Efektivní strategie pro automatické generování trénovacích dat – Bc. Kryštof KRMASCHEK
Bc. Kryštof KRMASCHEK
Diplomová práce
Efektivní strategie pro automatické generování trénovacích dat
Efficient Strategies for Automatic Generation of Training Data
Abstract:
Tato práce se zabývá efektivními strategiemi automatického generování trénovacích dat, které řeší problémy spojené s ručním anotováním dat. První část práce poskytuje teoretický základ, vysvětluje klíčové pojmy v oblasti zpracování přirozeného jazyka (NLP) a metodiky pro práci s textovými daty. To zahrnuje podrobnou diskusi o předzpracování textu, tokenizaci a různých technikách NLP nezbytných pro …víceAbstract:
This thesis explores efficient strategies for the automatic generation of training data to address the challenges associated with manual data annotation. The first part of the thesis provides a theoretical foundation, explaining key concepts in Natural Language Processing (NLP) and methodologies for working with textual data. This includes an in-depth discussion of text preprocessing, tokenization …více
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 24. 5. 2024
Zveřejnit od: 31. 12. 2999
Obhajoba závěrečné práce
- Obhajoba proběhla 12. 6. 2024
- Vedoucí: MgA. Jan Hůla, Ph.D.
Citační záznam
Jak správně citovat práci
KRMASCHEK, Kryštof. Efektivní strategie pro automatické generování trénovacích dat. Ostrava, 2024. diplomová práce (Mgr.). OSTRAVSKÁ UNIVERZITA. Přírodovědecká fakulta
Plný text práce
Právo: Autor si nepřeje zpřístupnění práce veřejnosti
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- Soubory jsou nedostupné.
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: OSTRAVSKÁ UNIVERZITA, Přírodovědecká fakultaOSTRAVSKÁ UNIVERZITA
Přírodovědecká fakultaMagisterský studijní program / obor:
Aplikovaná informatika / Umělá inteligence
Práce na příbuzné téma
-
Automatické generování testovacích dat informačních systémů
Andrej Naňo -
Automatické zpracování dat z meteostanic
Tomáš PAŠEK -
Získávání a reportování testovacích dat C++ projektech
Roman Dohnal -
Systém pro tvorbu automatického generátoru zpráv ze strukturovaných dat
Jan ULRYCH -
Klasifikace jazykových dat dle specifických kategorií
Pavlína Sedlářová -
Generování testovacích dat z anotací
Michal DÉKÁNY -
Analýza a vizualizace dat v pohostinství
David Hanina -
Srovnání metod strojového učení pro rozpoznání citlivých dat
Adam Považanec