Ilia Frolov

Bakalářská práce

USING SYNTHETIC TEXT DATA TO TRAIN SENTIMENT ANALYSIS MODELS

Využití syntetických textových dat pro trénování modelů analýzy sentimentu
Anotace:
Explozivní nárůst digitálních textových dat představuje mnoho příležitostí a výzev, zejména v oblasti analýzy sentimentu. Častým problémem je nevyváženost souborů dat, kdy jedna třída sentimentu výrazně převyšuje ostatní, což vede k predikčnímu zkreslení. V této studii je problém nevyváženosti tříd řešen vytvořením syntetických dat pomocí GPT-2, nejmodernějšího generativního modelu jazyka. Byly provedeny …více
Abstract:
The explosive growth of digital text data presents many opportunities and challenges, especially in the area of sentiment analysis. A common problem is the imbalance of datasets, where one sentiment class significantly outperforms others, resulting in prediction bias. In this study, the class imbalance problem is addressed by creating synthetic data using GPT-2, a state-of-the-art generative language …více
 
 
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 3. 5. 2025

Obhajoba závěrečné práce

  • Obhajoba proběhla 2025
  • Vedoucí: David Chudán
  • Oponent: Filip Vencovský

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • autentizovaným zaměstnancům ze stejné školy/fakulty
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Vysoká škola ekonomická v Praze
https://vskp.vse.cz/eid/96353