Mgr. Marek Petrovič

Master's thesis

One Bit at a Time: Impact of Quantisation on Neural Machine Translation

One Bit at a Time: Impact of Quantisation on Neural Machine Translation
Abstract:
Napriek svojej presnosti, nasadenie veľkých neurónových jazykových modelov stále čelí niekoľkým praktickým problémom. Okrem vysokej pamäťovej náročnosti, hlavnou prekážkou je rýchlosť predikcie. V prípade generatívnych modelov, čas auto-regresívneho generovania škáluje s dĺžkou výstupu. Ďalšie významné obmedzenie prekladových modelov je ich doménová špecificita, ktorá je daná doménou tréningových dát …more
Abstract:
Despite the precision of the large language models, the deployment of these models still faces some practical issues. Except for being memory-demanding, the main issue lies in the speed of prediction. In the case of generative language models, the time of auto-regressive generation scales with the output length. Another significant limitation of translation models remains in their domain-specificity …more
 
 
Language used: English
Date on which the thesis was submitted / produced: 17. 5. 2022

Thesis defence

  • Date of defence: 22. 6. 2022
  • Supervisor: Mgr. Michal Štefánik
  • Reader: Mgr. Ondřej Sotolář

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky

Masaryk University

Faculty of Informatics

Master programme / field:
Artificial intelligence and data processing / Big data