Bc. Martin Geletka

Diplomová práce

Speeding up inference time of neural machine translation

Speeding up inference time of neural machine translation
Anotace:
Vďaka takzvaným Transformer modelom sa nedávno dosiahli signifikantné posuny v úlohách strojového prekladu. V praxi však tieto modely trpia vysokou latenciou, takže sú často nepoužiteľné v praktických aplikáciách. Táto práca študuje dôvody tejto vysokej latencie a zhrnuje, aplikuje a porovnáva techniky strojového učenia, ktorých cieľom je skrátenie inferenčného času Transformer modelov použitých pri …více
Abstract:
Large qualitative gains were recently made in machine translation tasks thanks to Transformers models. However, in practice, these models suffer from high latency, such that they often are hardly usable in practical applications. This thesis study studies the reasons behind high latency time and tries to overview, employ and compare techniques, which tries to decrease the inference time of the Transformer …více
 
 
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 14. 12. 2021

Obhajoba závěrečné práce

  • Obhajoba proběhla 1. 2. 2022
  • Vedoucí: doc. RNDr. Petr Sojka, Ph.D.
  • Oponent: RNDr. Vít Novotný

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky