Mgr. Marek Petrovič

Master's thesis

One Bit at a Time: Impact of Quantisation on Neural Machine Translation

One Bit at a Time: Impact of Quantisation on Neural Machine Translation
Anotácia:
Napriek svojej presnosti, nasadenie veľkých neurónových jazykových modelov stále čelí niekoľkým praktickým problémom. Okrem vysokej pamäťovej náročnosti, hlavnou prekážkou je rýchlosť predikcie. V prípade generatívnych modelov, čas auto-regresívneho generovania škáluje s dĺžkou výstupu. Ďalšie významné obmedzenie prekladových modelov je ich doménová špecificita, ktorá je daná doménou tréningových dát …viac
Abstract:
Despite the precision of the large language models, the deployment of these models still faces some practical issues. Except for being memory-demanding, the main issue lies in the speed of prediction. In the case of generative language models, the time of auto-regressive generation scales with the output length. Another significant limitation of translation models remains in their domain-specificity …viac
 
 
Jazyk práce: English
Datum vytvoření / odevzdání či podání práce: 17. 5. 2022

Obhajoba závěrečné práce

  • Obhajoba proběhla 22. 6. 2022
  • Vedúci: Mgr. Michal Štefánik
  • Oponent: Mgr. Ondřej Sotolář

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masaryk University

Faculty of Informatics

Master programme / odbor:
Artificial intelligence and data processing / Big data