Mgr. Lukáš Kohout

Bachelor's thesis

Identifikace pojmenovaných entit v textu

Named Entity Recognition from Texts
Abstract:
Cílem této práce je stanovit možnosti určování a klasifikace pojmenovaných entit v textu. Výstupem této práce je 15 regulárních výrazů identifikujících pojmenované entity v korpusu a více než 12 milionů pojmenovaných entit v korpusu identifikovaných.
Abstract:
The aim of this thesis is to determine the possibilities of identification and classification of named entities in a text. The output of this thesis is 15 regular expressions identifying named entities in the corpus, and more than 12 million named entities identified in the corpus.
 
 
Language used: Czech
Date on which the thesis was submitted / produced: 21. 5. 2012

Thesis defence

  • Date of defence: 22. 6. 2012
  • Supervisor: RNDr. Zuzana Nevěřilová, Ph.D.
  • Reader: Mgr. Václav Němčík

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky

Masaryk University

Faculty of Informatics

Bachelor programme / field:
Informatics / Computer Systems and Data Processing

Theses on a related topic