Mgr. David Hrbek
Diplomová práce
Detekce tématu textu
Topic detection in the text
Anotace:
Tato práce je o inovativním přístupu k detekci tématu v textu. Je založena na procházení Wikipedie za účelem získání hierarchie možných témat and stažení článků, které slouží jako klasifikovaný korpus pro natrénování klasifikátoru, který je schopen přiřadit možná témata danému textu. Text práce popisuje proces vytváření hierarchie témat, sběr a předzpracování dat korpusu, trénování klasifikátoru s …víceAbstract:
This thesis is about an original approach to topic detection in a text document. It is based on crawling Wikipedia to get a hierarchy of possible topics and using Wikipedia articles as a labeled corpus for training a classifier, which is able to assign these topics to an arbitrary text document. The text describes the process of creating the topic hierarchy, gathering and preprocessing a data corpus …více
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 22. 5. 2017
Identifikátor:
https://is.muni.cz/th/elsc9/
Obhajoba závěrečné práce
- Obhajoba proběhla 20. 6. 2017
- Vedoucí: RNDr. Zuzana Nevěřilová, Ph.D.
- Oponent: Mgr. et Mgr. Vít Baisa, Ph.D.
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasarykova univerzita
Fakulta informatikyMagisterský studijní program / obor:
Aplikovaná informatika / Služby - výzkum, řízení a inovace
Práce na příbuzné téma
-
Failure and Fault classification for Smart Grids
Zuzana Křivohlavá -
Movement-Based Sentiment Classification in Human Interactions
Maroš Dubíny -
Folk Dance Step Analysis and Classification in Virtual Reality
David Zelníček -
Advancing Motion Words for Human Motion Classification
David Procházka -
ECG Arrhythmia Detection and Classification
Adam Ivora -
Topic Classification for Web Corpora: Method Comparison and Crosslingual Transfer
Rastislav Papčo