Ing. David Illner

Diplomová práce

Extrakce témat z nestrukturovaného textu

Extraction of topics from unstructured text
Anotace:
Předmětem diplomové práce je vytvoření modelu pro extrakci témat z nestrukturovaného textu. Byla využita platforma KNIME a veřejně dostupný dataset, který obsahuje pouze abstrakty vědeckých článků. V teoretické části práce je popsána analýza přirozené řeči a vysvětlena důležitost předzpracování textu, aby bylo nadále možné s přirozenou řečí pracovat v prostředí informačních technologií. Pro předzpracování …více
Abstract:
The subject of this master thesis is to create a model for topic extraction from unstructured text using the KNIME platform and a publicly available dataset containing only abstracts of scientific articles. The analysis of natural language and the importance of pre-processing text with this language to be able to continue working with it in an information technology environment. Word stemming, stemming …více
 
 
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 23. 4. 2024
Identifikátor: http://evskp.uhk.cz/eM7960

Obhajoba závěrečné práce

  • Obhajoba proběhla 27. 5. 2024
  • Vedoucí: Ing. Martina Husáková, Ph.D.
  • Oponent: Mgr. Jiří Haviger, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • Soubory jsou od 31. 5. 2024 dostupné: světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Univerzita Hradec Králové
  • Co je jinak přidání souboru

    Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
  • Co je jinak další operace se soubory

    Podrobnosti lze zjistit označením příslušného řádku.
  • Co je jinak pohled pro experty

    Pro častou práci je možné zvolit režim Více možností.
  • Co je nové vyhledávání souborů

    Vyhledávaný výraz můžete zadat přímo do adresního řádku.
  • Co je nové rychlý přístup k souborům

    Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.
  • Co se chystá

    Připravujeme další vylepšení pro mobilní zařízení.