Bc. Ondřej Metelka

Bachelor's thesis

Automatická tvorba morfologických pravidel z anotovaných textových korpusů

Automatic Creation of Morphological Rules from Annotated Text Corpora
Abstract:
Práce zkoumá možnosti automatického rozpoznávání mluvnických vzorů českých slov, která se nenacházejí v databázi morfologického analyzátoru, na základě výskytu jim podobných výrazů v textovém korpusu – pro tento účel byl v rámci práce navrhnut a implementován nástroj CorpMorpho. Dále jsou pozorovány a zhodnoceny změny úspěšnosti tohoto rozpoznávání při použití různých nástrojů pro segmentaci slova …more
Abstract:
This work explores the possibilities of automatic paradigm recognition of Czech words not present in the database of morphological analyzer, based on the occurrence of similar expressions in a text corpus. For this purpose, a tool called CorpMorpho was designed and implemented as part of the work. Furthermore, changes in the success rate of this recognition are observed and evaluated when using different …more
 
 
Language used: Czech
Date on which the thesis was submitted / produced: 18. 5. 2023

Thesis defence

  • Date of defence: 28. 6. 2023
  • Supervisor: doc. RNDr. Aleš Horák, Ph.D.
  • Reader: RNDr. Pavel Šmerk, Ph.D.

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky

Masaryk University

Faculty of Informatics

Bachelor programme / field:
Informatics / Informatics