Mgr. et Mgr. Vít Baisa, Ph.D.

Disertační práce

Byte Level Language Models

Byte Level Language Models
Anotace:
Většina technik jazykového modelování pracuje se slovy jako dále nedělitelnými jednotkami. Teprve nedávno bylo prokázáno, že modely pracující s daty na nižší úrovni (částmi slov: morfémy či znaky) mohou konkurovat technikám založeným na slovech. V této práci představuji tři techniky pracující s jazykovými daty na úrovni bytů, díky čemuž mohou být použity pro libovolná jazyková data bez potřeby předzpracování …více
Abstract:
Most language modeling techniques treat words as atomic units. Only recently it has been shown that models using lower level units (morphemes, characters or bytes) can be competitive with the word level approach in terms of perplexity and other performance metrics. In this thesis I introduce three techniques operating on byte level. Thanks to this they can be applied to any language data without a …více
 
 
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 20. 6. 2016

Obhajoba závěrečné práce

  • Obhajoba proběhla 1. 11. 2016
  • Vedoucí: prof. PhDr. Karel Pala, CSc.
  • Oponent: doc. Dr. Ing. Jan Černocký, Assoc. Prof. Dr. Tomaž Erjavec

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masarykova univerzita

Fakulta informatiky

Doktorský studijní program / obor:
Informatika (čtyřleté) / Informatika

Práce na příbuzné téma

  • Žádné práce na příbuzné téma.