Mgr. David Hrbek

Master's thesis

Detekce tématu textu

Topic detection in the text
Anotácia:
Tato práce je o inovativním přístupu k detekci tématu v textu. Je založena na procházení Wikipedie za účelem získání hierarchie možných témat and stažení článků, které slouží jako klasifikovaný korpus pro natrénování klasifikátoru, který je schopen přiřadit možná témata danému textu. Text práce popisuje proces vytváření hierarchie témat, sběr a předzpracování dat korpusu, trénování klasifikátoru s …viac
Abstract:
This thesis is about an original approach to topic detection in a text document. It is based on crawling Wikipedia to get a hierarchy of possible topics and using Wikipedia articles as a labeled corpus for training a classifier, which is able to assign these topics to an arbitrary text document. The text describes the process of creating the topic hierarchy, gathering and preprocessing a data corpus …viac
 
 
Jazyk práce: English
Datum vytvoření / odevzdání či podání práce: 22. 5. 2017

Obhajoba závěrečné práce

  • Obhajoba proběhla 20. 6. 2017
  • Vedúci: RNDr. Zuzana Nevěřilová, Ph.D.
  • Oponent: Mgr. et Mgr. Vít Baisa, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky