Theses 

Analýza příspěvků na sociální síti Twitter – Bc. Jakub HAIN

česky | in English | slovensky

Agenda:
Změnit agendu. Adresa v ISu:

ZÁPADOČESKÁ UNIVERZITA V PLZNI

Fakulta aplikovaných věd

Magisterský studijní program / obor:
Inženýrská informatika / Softwarové inženýrství

Bc. Jakub HAIN

Diplomová práce

Analýza příspěvků na sociální síti Twitter

Twitter post sentiment analysis

Anotace: Tato práce je zaměřena na analýzu sentimentu a sumarizaci dat. Konečné využití aplikace by melo být pro sociální sít Twitter v češtině. V textu jsou popsány jednotlivé metody strojového učení použité pro klasifikaci (Naivní Bayes, Support Vector Machine a Maximum Entropy). Extraktivní sumarizace je implementována pomocí Latentní sémantické analýzy. Vety jsou vybrány dvěma způsoby (Gong a Liu, Steinberger a Ježek). Sentiment byl testován na ohodnocených datech z českého Facebooku a anglických tweetech. Při testování na českých datech byly výsledky jednotlivých klasifikátoru srovnatelné kromě SVM. Sumarizace byla otestována na anglickém datasetu. Pro ověření byla použita metrika ROUGE-1, podle které obě verze sumarizace dosahovaly podobných výsledku.

Abstract: This thesis focuses on sentiment analysis and data summarization. Final use of the application should be for social network Twitter in Czech language. The text shows several machine learning methods used for classification (Naive Bayes, Support Vector Machine and Maximum Entropy). Extractive summarization is implemented as Latent semantic analysis. Selection of sentences is implemented in 2 versions (Gong and Liu, Steinberger and Ježek). Sentiment was tested on classified data from Czech Facebook and English tweets. Testing on Czech data shows comparable results on all classifiers except SVM. Summarization was tested on English dataset. ROUGE-1 metric was used for verification. Both versions of LSA performed similarly.

Klíčová slova: sociální sítě, twitter, sentiment, klasifikace, maximální entropie, naivní bayes, svm, sumarizace, latentní sémantická analýza

Jazyk práce: čeština

  • Datum vytvoření / odevzdání či podání práce: 13. 5. 2019
  • Zveřejnit od: 31. 12. 2999

Obhajoba závěrečné práce

  • Vedoucí: Prof. Ing. Karel Ježek, CSc.

Citační záznam

Citace dle ISO 690: LaTeX | HTML | text | BibTeX | Wikipedie

Plný text práce

Právo: Autor si nepřeje zpřístupnění práce veřejnosti

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • Soubory jsou nedostupné.
https://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=79959 Odkaz na soubor do lokálního úložiště instituce
Jak jinak získat přístup k textu

Instituce archivující a zpřístupňující práci: ZÁPADOČESKÁ UNIVERZITA V PLZNI, Fakulta aplikovaných věd
Vázaný výtisk práce naleznete v Univerzitní knihovně ZČU, více na http://www.knihovna.zcu.cz/kvalifikacni-prace/

Jak správně citovat práci

HAIN, Jakub. Analýza příspěvků na sociální síti Twitter. Plzeň, 2019. diplomová práce (Ing.). ZÁPADOČESKÁ UNIVERZITA V PLZNI. Fakulta aplikovaných věd

Relevantní odkazy 


Nahoru | Aktuální datum a čas: 27. 6. 2019 13:01, 26. (sudý) týden

Soukromí

Kontakty: theses(zavináč/atsign)fi(tečka/dot)muni(tečka/dot)cz