Bc. Šárka Ščavnická

Master's thesis

Multimodal Document Understanding through Visual Question Answering

Multimodal Document Understanding through Visual Question Answering
Anotácia:
Služby na spracovania dokumentov sú čoraz populárnejšie vo viacerých odvetviach, čo vedie k rastúcemu počtu výskumov použitia umelej inteligencie pri spracovaní dokumentov, táto oblasť je známa ako Document Intelligence. Táto práca sa zameriava na zodpovedanie otázok, ktoré sa týkajú dokumentov a ich vizuálnej stránky, skrátene známe pod pojmom DVQA (document visual question answering). Ide o podoblasť …viac
Abstract:
Applications of document processing become increasingly popular across multiple industries, resulting in a growing amount of research on the applications of artificial intelligence in document processing, known as Document Intelligence. This paper focuses on Document Visual Question Answering, shortly known as DVQA, a subtask of Document Intelligence that is gaining attention for its universality. …viac
 
 
Jazyk práce: English
Datum vytvoření / odevzdání či podání práce: 15. 12. 2023

Obhajoba závěrečné práce

  • Obhajoba proběhla 8. 2. 2024
  • Vedúci: Mgr. Michal Štefánik
  • Oponent: Edoardo Signoroni

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masaryk University

Faculty of Informatics

Master programme / odbor:
Artificial intelligence and data processing / Big data