Bc. Lubomír Sedlář

Master's thesis

Hybridní systém pro detekci pojmenovaných entit v českém textu

Hybrid system for named entities recognition in Czech
Abstract:
Detekce pojmenovaných entit je úloha extrakce informace z textu, která v datech hledá výskyty jmen a dalších odkazů na reálné objekty. Cílem této práce je navrhnout a implementovat hybridní systém založený na slovnících a pravidlech, který bude detekovat pojmenované entity v českém textu. Výsledný systém bude vyhodnocen na existujícím korpusu ručně značkovaných dat pomocí metrik přesnosti, pokrytí …more
Abstract:
Named entity detection is a task of information extraction. It detects names and other references to real world objects. The goal of this work is to design and implement a hybrid system based on gazeteers and rules, which will detect named entities in Czech text. The system will be evaluated on an existing corpora of hand-tagged entities in terms of precision, recall and F-measure.
 
 
Language used: Czech
Date on which the thesis was submitted / produced: 21. 5. 2014

Thesis defence

  • Date of defence: 24. 6. 2014
  • Supervisor: RNDr. Zuzana Nevěřilová, Ph.D.
  • Reader: doc. RNDr. Aleš Horák, Ph.D.

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky

Masaryk University

Faculty of Informatics

Master programme / field:
Informatics / Artificial Intelligence and Natural Language Processing