From PogChamps to Insights: Detecting Original Content in Twitch Chat

Jari Lindroos, Jaakko Peltonen, Tanja Välisalo, Raine Koskimaa, Ida Toivanen

Tutkimustuotos: KonferenssiartikkeliTieteellinenvertaisarvioitu

7 Lataukset (Pure)

Abstrakti

The vast volume of chat messages generated during esports events on Twitch represents a valuable source of data for understanding audience behavior. However, the sheer quantity and dynamic nature of this data make manual analysis impractical. This study addresses this challenge by introducing FinTwitchBERT, a model fine-tuned to classify Twitch chat messages into four categories based on their uniqueness. Our model demonstrates the ability to distinguish between original content, repetitive messages such as emote spamming, formulaic messages, and interactive commands chat participants use to interact with channel bots. Pre-trained on over 18 million Finnish Twitch chat messages and utilizing a combination of semi-supervised learning and iterative pseudo-labeling with human-in-the-loop validation, FinTwitchBERT achieves 97.42% accuracy on a test set of unseen chat messages with a limited initial dataset of only 7,529 manually annotated messages.

AlkuperäiskieliEnglanti
OtsikkoProceedings of the 58th Hawaii International Conference on System Sciences, HICSS 2025
ToimittajatTung X. Bui
KustantajaHawaii International Conference on System Sciences
Sivut2542-2551
Sivumäärä10
ISBN (elektroninen)9780998133188
TilaJulkaistu - 2025
OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisussa
TapahtumaHawaii International Conference on System Sciences - Honolulu, Yhdysvallat
Kesto: 7 tammik. 202510 tammik. 2025

Julkaisusarja

NimiProceedings of the Annual Hawaii International Conference on System Sciences
ISSN (elektroninen)2572-6862

Conference

ConferenceHawaii International Conference on System Sciences
Maa/AlueYhdysvallat
KaupunkiHonolulu
Ajanjakso7/01/2510/01/25

Julkaisufoorumi-taso

  • Jufo-taso 1

!!ASJC Scopus subject areas

  • Yleinen tekniikka

Sormenjälki

Sukella tutkimusaiheisiin 'From PogChamps to Insights: Detecting Original Content in Twitch Chat'. Ne muodostavat yhdessä ainutlaatuisen sormenjäljen.

Siteeraa tätä