Bc. Šárka Ščavnická

Diplomová práce

Multimodal Document Understanding through Visual Question Answering

Multimodal Document Understanding through Visual Question Answering
Anotace:
Služby na spracovania dokumentov sú čoraz populárnejšie vo viacerých odvetviach, čo vedie k rastúcemu počtu výskumov použitia umelej inteligencie pri spracovaní dokumentov, táto oblasť je známa ako Document Intelligence. Táto práca sa zameriava na zodpovedanie otázok, ktoré sa týkajú dokumentov a ich vizuálnej stránky, skrátene známe pod pojmom DVQA (document visual question answering). Ide o podoblasť …více
Abstract:
Applications of document processing become increasingly popular across multiple industries, resulting in a growing amount of research on the applications of artificial intelligence in document processing, known as Document Intelligence. This paper focuses on Document Visual Question Answering, shortly known as DVQA, a subtask of Document Intelligence that is gaining attention for its universality. …více
 
 
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 15. 12. 2023

Obhajoba závěrečné práce

  • Obhajoba proběhla 8. 2. 2024
  • Vedoucí: Mgr. Michal Štefánik
  • Oponent: Edoardo Signoroni

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masarykova univerzita

Fakulta informatiky

Magisterský studijní program / obor:
Umělá inteligence a zpracování dat / Zpracování a analýza rozsáhlých dat