Mgr. Petr Uhlíř

Bachelor's thesis

Automatické vyhledávání nadřazených a podřazených pojmů v textu

Automatic Extraction of Broad and Narrow Terms in Text
Abstract:
Práce se zabývá možnými postupy při získávání nadřazených a podřazených výrazů z česky psaného textu. Tyto metody byly otestovány na korpusech se stovkami milionů slov. Nalezené chyby byly analyzovány a pomocí vhodného řešení odstraněny, aby výsledné pojmy dosahovaly vysoké přesnosti. Aplikovaná pravidla byla dále zahrnuta do implementace programu, který automaticky prochází vstupní soubor a pokouší …more
Abstract:
This work concerns the possible procedures for obtaining hyperonyms and hyponyms terms of Czech written text. These methods were tested on corpora with hundreds of millions of words. Found errors were analyzed and removed using a suitable solution for resulting concepts to achieve high accuracy. Applied rules were also included in the program's implementation, which automatically passes through the …more
 
 
Language used: Czech
Date on which the thesis was submitted / produced: 24. 5. 2010

Thesis defence

  • Date of defence: 1. 2. 2011
  • Supervisor: doc. RNDr. Aleš Horák, Ph.D.
  • Reader: Mgr. Václav Němčík

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky