Digital document analysis using machine learning methods – Bc. Nicholas Čapek
Bc. Nicholas Čapek
Diplomová práce
Digital document analysis using machine learning methods
Digital document analysis using machine learning methods
Anotace:
Tato práce se zabývá problémem zpracování dokumentů v pojišťovnách, konkrétně využitím strojového učení v této oblasti. Rozebíráme proces zpracování dokumentů a příležitosti automatizování různých jeho částí u naší partnerské společnosti Generali Česká pojišťovna a.s. Pro vlastní zpracování v experimentální části byl vybrán problém detekování skoro duplicitních obrázků. Byly ozkoušeny různé přístupy …víceAbstract:
This thesis is concerned with the problem of document processing in insurance companies, specifically with the utilization of machine learning in this area. We discuss a document processing pipeline and various opportunities for automation at our partner company, Generali Česká pojišťovna a.s. The problem of near-duplicate document detection was selected to be explored in the experimental section. …více
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 17. 5. 2022
Identifikátor:
https://is.muni.cz/th/shsis/
Obhajoba závěrečné práce
- Obhajoba proběhla 23. 6. 2022
- Vedoucí: RNDr. Jaroslav Čechák
- Oponent: doc. RNDr. Tomáš Brázdil, Ph.D.
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasarykova univerzita
Fakulta informatikyMagisterský studijní program / obor:
Umělá inteligence a zpracování dat / Strojové učení a umělá inteligence
Práce na příbuzné téma
-
Receipt database with OCR scan
Petr Janík -
Evolutionary and Neural Approaches in OCR Error Correction
Dung Quoc Nguyen -
Využití OCR technologií v oblasti zrakově handicapovaných
David Bernard -
Evaluation of off-the-shelf OCR technologies
Martin Tomaschek -
OCR historických dokumentů
Martin Mejzlík -
Strojové zpracování faktur metodou OCR a jeho integrace do CRM systému Atollon
Marián Čamák -
Sada dobrých praktik pro automatizaci testů pomocí Robot Framework a technologie OCR
Richard Bruna -
Digitalizace faktur a vytěžení metadat pomocí OCR softwaru
Ondřej Kotala