USING SYNTHETIC TEXT DATA TO TRAIN SENTIMENT ANALYSIS MODELS – Ilia Frolov
Ilia Frolov
Bakalářská práce
USING SYNTHETIC TEXT DATA TO TRAIN SENTIMENT ANALYSIS MODELS
Využití syntetických textových dat pro trénování modelů analýzy sentimentu
Anotace:
Explozivní nárůst digitálních textových dat představuje mnoho příležitostí a výzev, zejména v oblasti analýzy sentimentu. Častým problémem je nevyváženost souborů dat, kdy jedna třída sentimentu výrazně převyšuje ostatní, což vede k predikčnímu zkreslení. V této studii je problém nevyváženosti tříd řešen vytvořením syntetických dat pomocí GPT-2, nejmodernějšího generativního modelu jazyka. Byly provedeny …víceAbstract:
The explosive growth of digital text data presents many opportunities and challenges, especially in the area of sentiment analysis. A common problem is the imbalance of datasets, where one sentiment class significantly outperforms others, resulting in prediction bias. In this study, the class imbalance problem is addressed by creating synthetic data using GPT-2, a state-of-the-art generative language …více
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 3. 5. 2025
Identifikátor:
https://vskp.vse.cz/eid/96353
Obhajoba závěrečné práce
- Obhajoba proběhla 2025
- Vedoucí: David Chudán
- Oponent: Filip Vencovský
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- autentizovaným zaměstnancům ze stejné školy/fakulty
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Vysoká škola ekonomická v Prazehttps://vskp.vse.cz/eid/96353
Vysoká škola ekonomická v Praze
Bakalářský studijní program:
Data Analytics
Práce na příbuzné téma
-
Credit score model via GAS model and logistic regression
Nela Hendrichová -
Comparison between Frequentist and Bayesian logistic regression on the example of real data
Mikhail Fedorov -
Logistic regression improvements for credit scoring development
Nikolai Pravdin -
Využití sentimentu při určování autorství
Kateřina CHRÁPKOVÁ -
Sentiment Analysis on Twitter Data
Priyanshu Sharma -
Comparison of open-source data mining tools for sentiment analysis
Tariku Abebe Asfaw -
Big Data approach to sentiment analysis
Karandeep Handa -
Sentiment Analysis with Linguistic Knowledge
Pavlína Klimešová