Bc. Lubomír Sedlář

Diplomová práce

Hybridní systém pro detekci pojmenovaných entit v českém textu

Hybrid system for named entities recognition in Czech
Anotace:
Detekce pojmenovaných entit je úloha extrakce informace z textu, která v datech hledá výskyty jmen a dalších odkazů na reálné objekty. Cílem této práce je navrhnout a implementovat hybridní systém založený na slovnících a pravidlech, který bude detekovat pojmenované entity v českém textu. Výsledný systém bude vyhodnocen na existujícím korpusu ručně značkovaných dat pomocí metrik přesnosti, pokrytí …více
Abstract:
Named entity detection is a task of information extraction. It detects names and other references to real world objects. The goal of this work is to design and implement a hybrid system based on gazeteers and rules, which will detect named entities in Czech text. The system will be evaluated on an existing corpora of hand-tagged entities in terms of precision, recall and F-measure.
 
 
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 21. 5. 2014

Obhajoba závěrečné práce

  • Obhajoba proběhla 24. 6. 2014
  • Vedoucí: RNDr. Zuzana Nevěřilová, Ph.D.
  • Oponent: doc. RNDr. Aleš Horák, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masarykova univerzita

Fakulta informatiky

Magisterský studijní program / obor:
Informatika / Umělá inteligence a zpracování přirozeného jazyka