Bc. Martin Geletka

Master's thesis

Speeding up inference time of neural machine translation

Speeding up inference time of neural machine translation
Anotácia:
Vďaka takzvaným Transformer modelom sa nedávno dosiahli signifikantné posuny v úlohách strojového prekladu. V praxi však tieto modely trpia vysokou latenciou, takže sú často nepoužiteľné v praktických aplikáciách. Táto práca študuje dôvody tejto vysokej latencie a zhrnuje, aplikuje a porovnáva techniky strojového učenia, ktorých cieľom je skrátenie inferenčného času Transformer modelov použitých pri …viac
Abstract:
Large qualitative gains were recently made in machine translation tasks thanks to Transformers models. However, in practice, these models suffer from high latency, such that they often are hardly usable in practical applications. This thesis study studies the reasons behind high latency time and tries to overview, employ and compare techniques, which tries to decrease the inference time of the Transformer …viac
 
 
Jazyk práce: English
Datum vytvoření / odevzdání či podání práce: 14. 12. 2021

Obhajoba závěrečné práce

  • Obhajoba proběhla 1. 2. 2022
  • Vedúci: doc. RNDr. Petr Sojka, Ph.D.
  • Oponent: RNDr. Vít Novotný

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masaryk University

Faculty of Informatics

Master programme / odbor:
Artificial intelligence and data processing / Machine learning and artificial intelligence