Automatická tvorba morfologických pravidel z anotovaných textových korpusů – Bc. Ondřej Metelka
Bc. Ondřej Metelka
Bakalářská práce
Automatická tvorba morfologických pravidel z anotovaných textových korpusů
Automatic Creation of Morphological Rules from Annotated Text Corpora
Anotace:
Práce zkoumá možnosti automatického rozpoznávání mluvnických vzorů českých slov, která se nenacházejí v databázi morfologického analyzátoru, na základě výskytu jim podobných výrazů v textovém korpusu – pro tento účel byl v rámci práce navrhnut a implementován nástroj CorpMorpho. Dále jsou pozorovány a zhodnoceny změny úspěšnosti tohoto rozpoznávání při použití různých nástrojů pro segmentaci slova …víceAbstract:
This work explores the possibilities of automatic paradigm recognition of Czech words not present in the database of morphological analyzer, based on the occurrence of similar expressions in a text corpus. For this purpose, a tool called CorpMorpho was designed and implemented as part of the work. Furthermore, changes in the success rate of this recognition are observed and evaluated when using different …více
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 18. 5. 2023
Identifikátor:
https://is.muni.cz/th/qa5j7/
Obhajoba závěrečné práce
- Obhajoba proběhla 28. 6. 2023
- Vedoucí: doc. RNDr. Aleš Horák, Ph.D.
- Oponent: RNDr. Pavel Šmerk, Ph.D.
Citační záznam
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasarykova univerzita
Fakulta informatikyBakalářský studijní program / obor:
Informatika / Informatika
Práce na příbuzné téma
-
Segmentace a morfologická analýza choroidního plexu myšího embrya
Viktória Parobková -
Ruční anotace morfologické segmentace češtiny
Květa Mrštíková -
Systém pro zpracování dat a vyhodnocení morfologické segmentace češtiny
Pavel Šturc -
Český korpus příkladových vět
Michal Cukr -
Textové korpusy ze závěrečných prací
Martin Šmíd -
Tvorba textových korpusů z blogů
Jakub Jančo