Nástroje pro přípravu českého textu na strojové zpracování – Bc. Vlasta Matějková
Bc. Vlasta Matějková
Bakalářská práce
Nástroje pro přípravu českého textu na strojové zpracování
Tools for preprocessing Czech text for machine processing
Anotace:
Práce vysvětluje principy přípravy textu pro strojové zpracování. Mezi hlavními principy patří normalizace, segmentace, tokenizace, lemmatizace, stematizace, desambiguace, part of speech tagování a další. Tyto principy fungují obecně na většinu jazyků, pro správnou a detailní přípravu textu je ovšem třeba postupy upravit na základě požadovaného jazyka (v tomto případě češtinu) a budoucímu účelu. Práce …víceAbstract:
The thesis explains principals of text preparation for machine processing. The main principals include normalization, segmentation, tokenization, lemmatization, stemmatization, disambiguation, part of speech tagging and more. These principals work in general for most languages, but for correct and detailed preparation of text, the procedures must be adjusted based on the wanted language (in this case …více
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 7. 5. 2024
Identifikátor:
http://evskp.uhk.cz/eB15073
Obhajoba závěrečné práce
- Obhajoba proběhla 28. 5. 2024
- Vedoucí: Mgr. Jiří Haviger, Ph.D.
- Oponent: Ing. Martina Husáková, Ph.D.
Citační záznam
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- Soubory jsou od 31. 5. 2024 dostupné: světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Univerzita Hradec KrálovéUniverzita Hradec Králové
Fakulta informatiky a managementuBakalářský studijní program / obor:
Aplikovaná informatika / Aplikovaná informatika
Práce na příbuzné téma
- Žádné práce na příbuzné téma.
Název
Vložil
Vloženo
Práva
Složky
Soubory
Kohout, J.
1. 6. 2024
Kohout, J.
1. 6. 2024