Bc. Lubomír Sedlář

Master's thesis

Hybridní systém pro detekci pojmenovaných entit v českém textu

Hybrid system for named entities recognition in Czech
Anotácia:
Detekce pojmenovaných entit je úloha extrakce informace z textu, která v datech hledá výskyty jmen a dalších odkazů na reálné objekty. Cílem této práce je navrhnout a implementovat hybridní systém založený na slovnících a pravidlech, který bude detekovat pojmenované entity v českém textu. Výsledný systém bude vyhodnocen na existujícím korpusu ručně značkovaných dat pomocí metrik přesnosti, pokrytí …viac
Abstract:
Named entity detection is a task of information extraction. It detects names and other references to real world objects. The goal of this work is to design and implement a hybrid system based on gazeteers and rules, which will detect named entities in Czech text. The system will be evaluated on an existing corpora of hand-tagged entities in terms of precision, recall and F-measure.
 
 
Jazyk práce: Czech
Datum vytvoření / odevzdání či podání práce: 21. 5. 2014

Obhajoba závěrečné práce

  • Obhajoba proběhla 24. 6. 2014
  • Vedúci: RNDr. Zuzana Nevěřilová, Ph.D.
  • Oponent: doc. RNDr. Aleš Horák, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky