Digital document analysis using machine learning methods – Bc. Nicholas Čapek
Bc. Nicholas Čapek
Master's thesis
Digital document analysis using machine learning methods
Digital document analysis using machine learning methods
Abstract:
Tato práce se zabývá problémem zpracování dokumentů v pojišťovnách, konkrétně využitím strojového učení v této oblasti. Rozebíráme proces zpracování dokumentů a příležitosti automatizování různých jeho částí u naší partnerské společnosti Generali Česká pojišťovna a.s. Pro vlastní zpracování v experimentální části byl vybrán problém detekování skoro duplicitních obrázků. Byly ozkoušeny různé přístupy …moreAbstract:
This thesis is concerned with the problem of document processing in insurance companies, specifically with the utilization of machine learning in this area. We discuss a document processing pipeline and various opportunities for automation at our partner company, Generali Česká pojišťovna a.s. The problem of near-duplicate document detection was selected to be explored in the experimental section. …more
Language used: English
Date on which the thesis was submitted / produced: 17. 5. 2022
Identifier:
https://is.muni.cz/th/shsis/
Thesis defence
- Date of defence: 23. 6. 2022
- Supervisor: RNDr. Jaroslav Čechák
- Reader: doc. RNDr. Tomáš Brázdil, Ph.D.
Citation record
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsMaster programme / field:
Artificial intelligence and data processing / Machine learning and artificial intelligence
Theses on a related topic
-
Receipt database with OCR scan
Petr Janík -
Evolutionary and Neural Approaches in OCR Error Correction
Dung Quoc Nguyen -
Využití OCR technologií v oblasti zrakově handicapovaných
David Bernard -
Strojové zpracování faktur metodou OCR a jeho integrace do CRM systému Atollon
Marián Čamák -
Evaluation of off-the-shelf OCR technologies
Martin Tomaschek -
OCR historických dokumentů
Martin Mejzlík -
Sada dobrých praktik pro automatizaci testů pomocí Robot Framework a technologie OCR
Richard Bruna -
Prožitky účastníků OCR Gladiator Race
Ester KOPECKÁ