Mgr. David Hrbek

Diplomová práce

Detekce tématu textu

Topic detection in the text
Anotace:
Tato práce je o inovativním přístupu k detekci tématu v textu. Je založena na procházení Wikipedie za účelem získání hierarchie možných témat and stažení článků, které slouží jako klasifikovaný korpus pro natrénování klasifikátoru, který je schopen přiřadit možná témata danému textu. Text práce popisuje proces vytváření hierarchie témat, sběr a předzpracování dat korpusu, trénování klasifikátoru s …více
Abstract:
This thesis is about an original approach to topic detection in a text document. It is based on crawling Wikipedia to get a hierarchy of possible topics and using Wikipedia articles as a labeled corpus for training a classifier, which is able to assign these topics to an arbitrary text document. The text describes the process of creating the topic hierarchy, gathering and preprocessing a data corpus …více
 
 
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 22. 5. 2017

Obhajoba závěrečné práce

  • Obhajoba proběhla 20. 6. 2017
  • Vedoucí: RNDr. Zuzana Nevěřilová, Ph.D.
  • Oponent: Mgr. et Mgr. Vít Baisa, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masarykova univerzita

Fakulta informatiky

Magisterský studijní program / obor:
Aplikovaná informatika / Služby - výzkum, řízení a inovace