Tomáš Kliegr

Doctoral thesis

Unsupervised Entity Classification with Wikipedia and WordNet

Klasifikace entit pomocí Wikipedie a WordNetu
Abstract:
Dizertační práce se věnuje problému klasifikace entit reprezentovaných jmennými frázemi v textu. Cílem je vyvinout metodu pro automatizovanou klasifikaci těchto entit v datasetech skládajících se z krátkých textových fragmentů. Důraz je kladen na metody učení bez učitele, nebo kombinaci učení s učitelem a bez učitele (angl. semi-supervised learning), přičemž nebudou vyžadovány trénovací příklady. Třídy …more
Abstract:
This dissertation addresses the problem of classification of entities in text represented by noun phrases. The goal of this thesis is to develop a method for automated classification of entities appearing in datasets consisting of short textual fragments. The emphasis is on unsupervised and semi-supervised methods that will allow for fine-grained character of the assigned classes and require no labeled …more
 
 
Language used: English
Date on which the thesis was submitted / produced: 30. 9. 2007

Thesis defence

  • Date of defence: 5. 11. 2012
  • Supervisor: Jan Rauch
  • Reader: Petr Berka, Pavel Smrž, Zdeněk Žabokrtský

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • autentizovaným zaměstnancům ze stejné školy/fakulty
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Vysoká škola ekonomická v Praze
http://www.vse.cz/vskp/eid/34059