Evolutionary and Neural Approaches in OCR Error Correction – Dung Quoc Nguyen
Dung Quoc Nguyen
Disertační práce
Evolutionary and Neural Approaches in OCR Error Correction
Evolutionary and Neural Approaches in OCR Error Correction
Anotace:
Systémy optického rozpoznávání znaků (OCR) pomáhají digitalizovat archivy textových dokumentů. Nízká kvalita skenovaných dokumentů a omezení metod rozpoznávání textu však mají v digitalizovaných textech, známých jako OCR texty, za následek různé typy chyb. Chyby v OCR ovlivňují čitelnost OCR textů a snižují jejich připravenost k použití pro vyhledávání informací a vyhledávací aplikace. Následné zpracování …víceAbstract:
Optical Character Recognition (OCR) systems help to digitize paper-based archives. However, the poor quality of scanned documents and the limitations of text recognition techniques result in different types of errors in digitized texts, known as OCR texts. OCR errors impact the readability of OCR texts and suspend their readiness for information retrieval and search applications. Post-processing is …více
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 24. 9. 2022
Identifikátor:
http://hdl.handle.net/10084/149025
Obhajoba závěrečné práce
- Obhajoba proběhla 23. 11. 2022
- Vedoucí: Pavel Krömer
- Oponent: Roman Šenkeřík, Jiří Dvorský, Simone Ludwig
Citační záznam
Citace dle ISO 690:
NGUYEN, Dung Quoc. \textit{Evolutionary and Neural Approaches in OCR Error Correction}. Online. Disertační práce. Ostrava: Vysoká škola báňská - Technická univerzita Ostrava, Fakulta elektrotechniky a informatiky. 2022. Dostupné z: https://theses.cz/id/n3o2pq/.
Plný text práce
Právo: Plné texty vysokoškolských kvalifikačních prací obhájených na Vysoké škole báňské - Technické univerzitě Ostrava jsou uloženy v repozitáři DSpace. Přístup k plným textům mají všichni uživatelé bez omezení. Přístup je omezen pouze ve výjimečných případech, zpravidla z důvodu ochrany duševního vlastnictví. Nepřístupné práce jsou označeny jako closedAccess nebo embargoedAccess. Tištěné verze prácí jsou uloženy v Ústřední knihovně VŠB-TUO a jsou prezenčně přístupné ve studovně diplomových prací. Další nakládání s prací (kopírování, opisy, MVS)se řídí Knihovní a výpůjčním řádem Ústřední knihovny VŠB-TUO.
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- autentizovaným zaměstnancům ze stejné školy/fakulty
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: VŠB – Technická univerzita OstravaVŠB – Technická univerzita Ostrava
Fakulta elektrotechniky a informatikyDoktorský studijní program:
Informatika
Práce na příbuzné téma
-
Evolutionary Synthesis of the Turing Machine´s Rules
Lukáš KOUŘIL -
Automatické doplňování a korekce interpunkce v češtině
Jakub Machura -
Pretraining and Evaluation of Czech ALBERT Language Model
Petr Zelina -
Feasibility Study of a Large Language Model (LLM)
Samuel Seidel -
Language endangerment, vitality and revitalization of the Hawaiian language
Hana Lebánková -
Byte Level Language Models
Vít Baisa -
Improving Arithmetical Reasoning of Language Models
Marek Kadlčík -
Mining Czech Clinical Notes Using the Language Modelling Technology
Tomáš Houfek