Byte Level Language Models – Mgr. et Mgr. Vít Baisa, Ph.D.
Mgr. et Mgr. Vít Baisa, Ph.D.
Disertační práce
Byte Level Language Models
Byte Level Language Models
Anotace:
Většina technik jazykového modelování pracuje se slovy jako dále nedělitelnými jednotkami. Teprve nedávno bylo prokázáno, že modely pracující s daty na nižší úrovni (částmi slov: morfémy či znaky) mohou konkurovat technikám založeným na slovech. V této práci představuji tři techniky pracující s jazykovými daty na úrovni bytů, díky čemuž mohou být použity pro libovolná jazyková data bez potřeby předzpracování …víceAbstract:
Most language modeling techniques treat words as atomic units. Only recently it has been shown that models using lower level units (morphemes, characters or bytes) can be competitive with the word level approach in terms of perplexity and other performance metrics. In this thesis I introduce three techniques operating on byte level. Thanks to this they can be applied to any language data without a …více
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 20. 6. 2016
Identifikátor:
https://is.muni.cz/th/en6ay/
Obhajoba závěrečné práce
- Obhajoba proběhla 1. 11. 2016
- Vedoucí: prof. PhDr. Karel Pala, CSc.
- Oponent: doc. Dr. Ing. Jan Černocký, Assoc. Prof. Dr. Tomaž Erjavec
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasarykova univerzita
Fakulta informatikyDoktorský studijní program / obor:
Informatika (čtyřleté) / Informatika
Práce na příbuzné téma
-
Building NLP model for classifying short-tail conversational student’s query data
Kural Arasu Venkatesh