Mgr. David Hrbek
Master's thesis
Detekce tématu textu
Topic detection in the text
Anotácia:
Tato práce je o inovativním přístupu k detekci tématu v textu. Je založena na procházení Wikipedie za účelem získání hierarchie možných témat and stažení článků, které slouží jako klasifikovaný korpus pro natrénování klasifikátoru, který je schopen přiřadit možná témata danému textu. Text práce popisuje proces vytváření hierarchie témat, sběr a předzpracování dat korpusu, trénování klasifikátoru s …viacAbstract:
This thesis is about an original approach to topic detection in a text document. It is based on crawling Wikipedia to get a hierarchy of possible topics and using Wikipedia articles as a labeled corpus for training a classifier, which is able to assign these topics to an arbitrary text document. The text describes the process of creating the topic hierarchy, gathering and preprocessing a data corpus …viac
Jazyk práce: English
Datum vytvoření / odevzdání či podání práce: 22. 5. 2017
Identifikátor:
https://is.muni.cz/th/elsc9/
Obhajoba závěrečné práce
- Obhajoba proběhla 20. 6. 2017
- Vedúci: RNDr. Zuzana Nevěřilová, Ph.D.
- Oponent: Mgr. et Mgr. Vít Baisa, Ph.D.
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsMaster programme / odbor:
Applied Informatics / Service Science, Management and Engineering
Práce na příbuzné téma
-
Failure and Fault classification for Smart Grids
Zuzana Křivohlavá -
Recognition and Classification Methods for Collection of Images
Martin Wenzl -
Classification of Passersby Using Single-point LiDAR Sensor and Machine Learning
Dominik Klement -
Difficulty Classification of Moonboard Bouldering Problems
Eduard Minks -
Analysis and classification of long terminal repeat (LTR) sequences using machine learning approaches
Jakub Horváth -
Advancing Motion Words for Human Motion Classification
David Procházka