Automatické vyhledávání nadřazených a podřazených pojmů v textu

Uhlíř, Petr

CS SKLog in Log in (EduId)

Theses q649b4

Automatické vyhledávání nadřazených a podřazených pojmů v textu – Mgr. Petr Uhlíř

Zpět na vyhledávání

Mgr. Petr Uhlíř

Bachelor's thesis

Automatické vyhledávání nadřazených a podřazených pojmů v textu

Automatic Extraction of Broad and Narrow Terms in Text

Abstract:

Práce se zabývá možnými postupy při získávání nadřazených a podřazených výrazů z česky psaného textu. Tyto metody byly otestovány na korpusech se stovkami milionů slov. Nalezené chyby byly analyzovány a pomocí vhodného řešení odstraněny, aby výsledné pojmy dosahovaly vysoké přesnosti. Aplikovaná pravidla byla dále zahrnuta do implementace programu, který automaticky prochází vstupní soubor a pokouší …more

Abstract:

This work concerns the possible procedures for obtaining hyperonyms and hyponyms terms of Czech written text. These methods were tested on corpora with hundreds of millions of words. Found errors were analyzed and removed using a suitable solution for resulting concepts to achieve high accuracy. Applied rules were also included in the program's implementation, which automatically passes through the …more

Keywords

WordNet korpus hyperonymum hyponymum synonymum antonymum morfologická analýza získávání informací kontext synonymní řada

Language used: Czech

Date on which the thesis was submitted / produced: 24. 5. 2010

Identifier: https://is.muni.cz/th/hxntb/

Thesis defence

Date of defence: 1. 2. 2011
Supervisor: doc. RNDr. Aleš Horák, Ph.D.
Reader: Mgr. Václav Němčík

Citation record

Cite this text

ISO 690-compliant citation record:

UHLÍŘ, Petr. \textit{Automatické vyhledávání nadřazených a podřazených pojmů v textu}. Online. Bachelor's thesis. Brno: Masaryk University, Faculty of Informatics. 2010. Available from: https://theses.cz/id/q649b4/.

{{Citace kvalifikační práce
 | příjmení = Uhlíř
 | jméno = Petr
 | instituce = Masaryk University, Faculty of Informatics
 | titul = Automatické vyhledávání nadřazených a podřazených pojmů v textu
 | url = https://theses.cz/id/q649b4/
 | typ práce = Bachelor's thesis
 | vedoucí = doc. RNDr. Aleš Horák, Ph.D.
 | rok = 2010
 | počet stran =
 | strany =
 | citace = 2024-09-17
 | poznámka =
 | jazyk = 
}}

Full text of thesis

Contents of on-line thesis archive

Published in Theses:

světu

Other ways of accessing the text

Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky

Reference to the local database directory of the institution

Masaryk University

Faculty of Informatics

Bachelor programme / field:
Informatics / Informatics

Theses on a related topic

Využití syntaktických analyzátorů pro získávání kolokací v korpusech
Lucia Kocincová
Korpus češtiny nerodilých mluvčích – začátečníků
Barbora Kočařová
Český korpus příkladových vět
Michal Cukr
Korpus jako zdroj dat pro optimalizaci automatické morfologické analýzy
Daniela Ryšavá
Chybový korpus z Wikipedie
Jiří Kletečka
Perfekt im Deutschen anhand von Korpus-Analyse
Dagmar Janker
Souslednost časová ve španělských obsahových větách po předpřítomném čase (ha dicho que...): frekvenční analýza na základě korpusu CREA (ústní korpus)
Jakub KOVÁČ
Korpus jako zdroj dat při prezentaci předložek do/na s místním směrovým významem ve výuce češtiny pro cizince
Melita Lukšija

All theses