Segmentace řečových trénovacích dat pro učení systémů ASR – Bc. Ondřej Vacek
Bc. Ondřej Vacek
Diplomová práce
Segmentace řečových trénovacích dat pro učení systémů ASR
Segmentation of speech training data for ASR system
Anotace:
Tato diplomová práce se zabývá vývojem poměrně rozsáhlého systému pro vytěžování a přípravu trénovacích dat pro účely trénování systémů rozpoznávání řeči. Začíná přehledem historického vývoje automatických systémů rozpoznávání řeči od tradičních po E2E systémy, přičemž zdůrazňuje klíčovou roli dat v jejich tvorbě. Na základě potřeby velkého množství dat je navržen systém pro jejich automatickou těžbu …víceAbstract:
This thesis deals with the development of a rather large-scale system for mining and preparing training data for the purpose of training speech recognition systems. It starts with an overview of the historical development of automatic speech recognition systems, from traditional to E2E systems, highlighting the key role of data in their design. Based on the need for large amounts of data, a system …více
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 22. 5. 2023
Obhajoba závěrečné práce
- Vedoucí: prof. Ing. Jan Nouza, CSc.
Citační záznam
Citace dle ISO 690:
VACEK, Ondřej. \textit{Segmentace řečových trénovacích dat pro učení systémů ASR}. Online. Diplomová práce. Liberec: Technická univerzita v Liberci, Fakulta mechatroniky, informatiky a mezioborových studií. 2023. Dostupné z: https://theses.cz/id/oan3m8/.
Jak správně citovat práci
Vacek, Ondřej. Segmentace řečových trénovacích dat pro učení systémů ASR. Liberec, 2023. diplomová práce (Ing.). Technická univerzita v Liberci. Fakulta mechatroniky, informatiky a mezioborových studií
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Technická univerzita v Liberci, Fakulta mechatroniky, informatiky a mezioborových studiíTechnická univerzita v Liberci
Fakulta mechatroniky, informatiky a mezioborových studiíMagisterský studijní program / obor:
Informační technologie / Inteligentní systémy
Práce na příbuzné téma
-
Aplikace metod strojového učení pro rozpoznávání znakové řeči
Mikhail Yuskou -
Tvorba českého jazykového modelu pro systém rozpoznávání řeči Sphinx4
Klára Kufová -
Rozpoznávání řeči pomocí neuronových sítí s navazujícím sequence-to-sequence modelem
Matěj ŠULC -
Učení se pravidel pro rozpoznávání řeči z nerozpoznaných promluv v dialogovém systému
Klára Kufová -
Multilingvální systém rozpoznávání řeči a jejich efektivní učení
Radek Šafařík -
Automatické generování interpunkce v systémech rozpoznávání řeči
Martin Poláček -
Využití metod strojového učení pro rozpoznávání řeči
Martina Slívová -
Analýza dat a nosičů dat – zajišťování a metody zkoumání
Martin Záruba
Název
Vložil
Vloženo
Práva