Bc. Vlasta Matějková

Bachelor's thesis

Nástroje pro přípravu českého textu na strojové zpracování

Tools for preprocessing Czech text for machine processing
Abstract:
Práce vysvětluje principy přípravy textu pro strojové zpracování. Mezi hlavními principy patří normalizace, segmentace, tokenizace, lemmatizace, stematizace, desambiguace, part of speech tagování a další. Tyto principy fungují obecně na většinu jazyků, pro správnou a detailní přípravu textu je ovšem třeba postupy upravit na základě požadovaného jazyka (v tomto případě češtinu) a budoucímu účelu. Práce …more
Abstract:
The thesis explains principals of text preparation for machine processing. The main principals include normalization, segmentation, tokenization, lemmatization, stemmatization, disambiguation, part of speech tagging and more. These principals work in general for most languages, but for correct and detailed preparation of text, the procedures must be adjusted based on the wanted language (in this case …more
 
 
Language used: Czech
Date on which the thesis was submitted / produced: 7. 5. 2024

Thesis defence

  • Date of defence: 28. 5. 2024
  • Supervisor: Mgr. Jiří Haviger, Ph.D.
  • Reader: Ing. Martina Husáková, Ph.D.

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • Soubory jsou od 31. 5. 2024 dostupné: světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Univerzita Hradec Králové

University of Hradec Králové

Faculty of Informatics and Management

Bachelor programme / field:
Aplikovaná informatika / Aplikovaná informatika

Theses on a related topic

  • No theses on a related topic available.
  • Co je jinak přidání souboru

    Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
  • Co je jinak další operace se soubory

    Podrobnosti lze zjistit označením příslušného řádku.
  • Co je jinak pohled pro experty

    Pro častou práci je možné zvolit režim Více možností.
  • Co je nové vyhledávání souborů

    Vyhledávaný výraz můžete zadat přímo do adresního řádku.
  • Co je nové rychlý přístup k souborům

    Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.
  • Co se chystá

    Připravujeme další vylepšení pro mobilní zařízení.