Multimodal Document Understanding through Visual Question Answering – Bc. Šárka Ščavnická
Bc. Šárka Ščavnická
Master's thesis
Multimodal Document Understanding through Visual Question Answering
Multimodal Document Understanding through Visual Question Answering
Anotácia:
Služby na spracovania dokumentov sú čoraz populárnejšie vo viacerých odvetviach, čo vedie k rastúcemu počtu výskumov použitia umelej inteligencie pri spracovaní dokumentov, táto oblasť je známa ako Document Intelligence. Táto práca sa zameriava na zodpovedanie otázok, ktoré sa týkajú dokumentov a ich vizuálnej stránky, skrátene známe pod pojmom DVQA (document visual question answering). Ide o podoblasť …viacAbstract:
Applications of document processing become increasingly popular across multiple industries, resulting in a growing amount of research on the applications of artificial intelligence in document processing, known as Document Intelligence. This paper focuses on Document Visual Question Answering, shortly known as DVQA, a subtask of Document Intelligence that is gaining attention for its universality. …viac
Jazyk práce: English
Datum vytvoření / odevzdání či podání práce: 15. 12. 2023
Identifikátor:
https://is.muni.cz/th/wotad/
Obhajoba závěrečné práce
- Obhajoba proběhla 8. 2. 2024
- Vedúci: Mgr. Michal Štefánik
- Oponent: Edoardo Signoroni
Citační záznam
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsMaster programme / odbor:
Artificial intelligence and data processing / Big data
Práce na příbuzné téma
-
Think Twice Before You Answer: Mitigating Biases of Question Answering Models
Lukáš Mikula -
Czech Question Answer Selection using Recurrent Neural Networks
Radoslav Sabol -
Automatic question answering for flective languages
Marek Medveď -
Think Twice Before You Answer: Mitigating Biases of Question Answering Models
Lukáš Mikula -
Automatic question answering for flective languages
Marek Medveď -
Question Answering technologie v právní praxi
Tomáš Nosek -
Czech Question Answer Selection using Recurrent Neural Networks
Radoslav Sabol