Bc. Ondřej Metelka

Bakalářská práce

Automatická tvorba morfologických pravidel z anotovaných textových korpusů

Automatic Creation of Morphological Rules from Annotated Text Corpora
Anotace:
Práce zkoumá možnosti automatického rozpoznávání mluvnických vzorů českých slov, která se nenacházejí v databázi morfologického analyzátoru, na základě výskytu jim podobných výrazů v textovém korpusu – pro tento účel byl v rámci práce navrhnut a implementován nástroj CorpMorpho. Dále jsou pozorovány a zhodnoceny změny úspěšnosti tohoto rozpoznávání při použití různých nástrojů pro segmentaci slova …více
Abstract:
This work explores the possibilities of automatic paradigm recognition of Czech words not present in the database of morphological analyzer, based on the occurrence of similar expressions in a text corpus. For this purpose, a tool called CorpMorpho was designed and implemented as part of the work. Furthermore, changes in the success rate of this recognition are observed and evaluated when using different …více
 
 
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 18. 5. 2023

Obhajoba závěrečné práce

  • Obhajoba proběhla 28. 6. 2023
  • Vedoucí: doc. RNDr. Aleš Horák, Ph.D.
  • Oponent: RNDr. Pavel Šmerk, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masarykova univerzita

Fakulta informatiky

Bakalářský studijní program / obor:
Informatika / Informatika