Jáchym Dvořák

Master's thesis

GPT-2 for email classification of german emails in Azure

GPT-2 pro klasifikaci emailů v němčině na platformě Azure
Abstract:
Siemens v tuto chvíli používá systém strojového učení v cloudové platformě Azure na kategorizaci příchozích emailů v němčině do několika kategorií, podkategorií a přiděluje jim prioritu. Kompletní test vícero modelů a selekce toho nejlepšího však nebyly nikdy provedeny, a ač je přesnost aktuálního modelu dostačující a napříč odvětvími dobrá, není zřejmé, zda lze dosáhnout zlepšení. Tato diplomová práce …more
Abstract:
Siemens currently uses a machine learning system deployed in the Azure cloud platform that categorizes incoming emails in German into several categories, subcategories and assigns priority to them. However, full try-out of different models has not been performed, and despite great industry-wise performance of the current solution, it is not clear whether it can be improved. This thesis outlines the …more
 
 
Language used: English
Date on which the thesis was submitted / produced: 28. 4. 2022

Thesis defence

  • Date of defence: 11. 10. 2022
  • Supervisor: Pavel Zimmermann
  • Reader: Filip Habarta

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • autentizovaným zaměstnancům ze stejné školy/fakulty
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Vysoká škola ekonomická v Praze
https://vskp.vse.cz/eid/85656