Bc. Vlasta Matějková

Bakalářská práce

Nástroje pro přípravu českého textu na strojové zpracování

Tools for preprocessing Czech text for machine processing
Anotace:
Práce vysvětluje principy přípravy textu pro strojové zpracování. Mezi hlavními principy patří normalizace, segmentace, tokenizace, lemmatizace, stematizace, desambiguace, part of speech tagování a další. Tyto principy fungují obecně na většinu jazyků, pro správnou a detailní přípravu textu je ovšem třeba postupy upravit na základě požadovaného jazyka (v tomto případě češtinu) a budoucímu účelu. Práce …více
Abstract:
The thesis explains principals of text preparation for machine processing. The main principals include normalization, segmentation, tokenization, lemmatization, stemmatization, disambiguation, part of speech tagging and more. These principals work in general for most languages, but for correct and detailed preparation of text, the procedures must be adjusted based on the wanted language (in this case …více
 
 
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 7. 5. 2024
Identifikátor: http://evskp.uhk.cz/eB15073

Obhajoba závěrečné práce

  • Obhajoba proběhla 28. 5. 2024
  • Vedoucí: Mgr. Jiří Haviger, Ph.D.
  • Oponent: Ing. Martina Husáková, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • Soubory jsou od 31. 5. 2024 dostupné: světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Univerzita Hradec Králové

Univerzita Hradec Králové

Fakulta informatiky a managementu

Bakalářský studijní program / obor:
Aplikovaná informatika / Aplikovaná informatika

Práce na příbuzné téma

  • Žádné práce na příbuzné téma.
  • Co je jinak přidání souboru

    Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
  • Co je jinak další operace se soubory

    Podrobnosti lze zjistit označením příslušného řádku.
  • Co je jinak pohled pro experty

    Pro častou práci je možné zvolit režim Více možností.
  • Co je nové vyhledávání souborů

    Vyhledávaný výraz můžete zadat přímo do adresního řádku.
  • Co je nové rychlý přístup k souborům

    Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.
  • Co se chystá

    Připravujeme další vylepšení pro mobilní zařízení.