Automatické vyhledávání nadřazených a podřazených pojmů v textu – Mgr. Petr Uhlíř
Mgr. Petr Uhlíř
Bachelor's thesis
Automatické vyhledávání nadřazených a podřazených pojmů v textu
Automatic Extraction of Broad and Narrow Terms in Text
Abstract:
Práce se zabývá možnými postupy při získávání nadřazených a podřazených výrazů z česky psaného textu. Tyto metody byly otestovány na korpusech se stovkami milionů slov. Nalezené chyby byly analyzovány a pomocí vhodného řešení odstraněny, aby výsledné pojmy dosahovaly vysoké přesnosti. Aplikovaná pravidla byla dále zahrnuta do implementace programu, který automaticky prochází vstupní soubor a pokouší …moreAbstract:
This work concerns the possible procedures for obtaining hyperonyms and hyponyms terms of Czech written text. These methods were tested on corpora with hundreds of millions of words. Found errors were analyzed and removed using a suitable solution for resulting concepts to achieve high accuracy. Applied rules were also included in the program's implementation, which automatically passes through the …more
Language used: Czech
Date on which the thesis was submitted / produced: 24. 5. 2010
Identifier:
https://is.muni.cz/th/hxntb/
Thesis defence
- Date of defence: 1. 2. 2011
- Supervisor: doc. RNDr. Aleš Horák, Ph.D.
- Reader: Mgr. Václav Němčík
Citation record
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsBachelor programme / field:
Informatics / Informatics
Theses on a related topic
-
Využití syntaktických analyzátorů pro získávání kolokací v korpusech
Lucia Kocincová -
Korpus češtiny nerodilých mluvčích – začátečníků
Barbora Kočařová -
Český korpus příkladových vět
Michal Cukr -
Korpus jako zdroj dat pro optimalizaci automatické morfologické analýzy
Daniela Ryšavá -
Chybový korpus z Wikipedie
Jiří Kletečka -
Perfekt im Deutschen anhand von Korpus-Analyse
Dagmar Janker -
Souslednost časová ve španělských obsahových větách po předpřítomném čase (ha dicho que...): frekvenční analýza na základě korpusu CREA (ústní korpus)
Jakub KOVÁČ -
Korpus jako zdroj dat při prezentaci předložek do/na s místním směrovým významem ve výuce češtiny pro cizince
Melita Lukšija