Automatická tvorba morfologických pravidel z anotovaných textových korpusů – Bc. Ondřej Metelka
Bc. Ondřej Metelka
Bachelor's thesis
Automatická tvorba morfologických pravidel z anotovaných textových korpusů
Automatic Creation of Morphological Rules from Annotated Text Corpora
Abstract:
Práce zkoumá možnosti automatického rozpoznávání mluvnických vzorů českých slov, která se nenacházejí v databázi morfologického analyzátoru, na základě výskytu jim podobných výrazů v textovém korpusu – pro tento účel byl v rámci práce navrhnut a implementován nástroj CorpMorpho. Dále jsou pozorovány a zhodnoceny změny úspěšnosti tohoto rozpoznávání při použití různých nástrojů pro segmentaci slova …moreAbstract:
This work explores the possibilities of automatic paradigm recognition of Czech words not present in the database of morphological analyzer, based on the occurrence of similar expressions in a text corpus. For this purpose, a tool called CorpMorpho was designed and implemented as part of the work. Furthermore, changes in the success rate of this recognition are observed and evaluated when using different …more
Language used: Czech
Date on which the thesis was submitted / produced: 18. 5. 2023
Identifier:
https://is.muni.cz/th/qa5j7/
Thesis defence
- Date of defence: 28. 6. 2023
- Supervisor: doc. RNDr. Aleš Horák, Ph.D.
- Reader: RNDr. Pavel Šmerk, Ph.D.
Citation record
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsBachelor programme / field:
Informatics / Informatics
Theses on a related topic
-
Segmentace a morfologická analýza choroidního plexu myšího embrya
Viktória Parobková -
Ruční anotace morfologické segmentace češtiny
Květa Mrštíková -
Systém pro zpracování dat a vyhodnocení morfologické segmentace češtiny
Pavel Šturc -
Český korpus příkladových vět
Michal Cukr -
Textové korpusy ze závěrečných prací
Martin Šmíd -
Tvorba textových korpusů z blogů
Jakub Jančo