Evolutionary and Neural Approaches in OCR Error Correction – Dung Quoc Nguyen
Dung Quoc Nguyen
Doctoral thesis
Evolutionary and Neural Approaches in OCR Error Correction
Evolutionary and Neural Approaches in OCR Error Correction
Abstract:
Systémy optického rozpoznávání znaků (OCR) pomáhají digitalizovat archivy textových dokumentů. Nízká kvalita skenovaných dokumentů a omezení metod rozpoznávání textu však mají v digitalizovaných textech, známých jako OCR texty, za následek různé typy chyb. Chyby v OCR ovlivňují čitelnost OCR textů a snižují jejich připravenost k použití pro vyhledávání informací a vyhledávací aplikace. Následné zpracování …moreAbstract:
Optical Character Recognition (OCR) systems help to digitize paper-based archives. However, the poor quality of scanned documents and the limitations of text recognition techniques result in different types of errors in digitized texts, known as OCR texts. OCR errors impact the readability of OCR texts and suspend their readiness for information retrieval and search applications. Post-processing is …more
Language used: English
Date on which the thesis was submitted / produced: 24. 9. 2022
Identifier:
http://hdl.handle.net/10084/149025
Thesis defence
- Date of defence: 23. 11. 2022
- Supervisor: Pavel Krömer
- Reader: Roman Šenkeřík, Jiří Dvorský, Simone Ludwig
Citation record
ISO 690-compliant citation record:
NGUYEN, Dung Quoc. \textit{Evolutionary and Neural Approaches in OCR Error Correction}. Online. Doctoral theses, Dissertations. Ostrava: VŠB - Technical University of Ostrava, Fakulta elektrotechniky a informatiky. 2022. Available from: https://theses.cz/id/n3o2pq/.
Full text of thesis
Accessibility: Plné texty vysokoškolských kvalifikačních prací obhájených na Vysoké škole báňské - Technické univerzitě Ostrava jsou uloženy v repozitáři DSpace. Přístup k plným textům mají všichni uživatelé bez omezení. Přístup je omezen pouze ve výjimečných případech, zpravidla z důvodu ochrany duševního vlastnictví. Nepřístupné práce jsou označeny jako closedAccess nebo embargoedAccess. Tištěné verze prácí jsou uloženy v Ústřední knihovně VŠB-TUO a jsou prezenčně přístupné ve studovně diplomových prací. Další nakládání s prací (kopírování, opisy, MVS)se řídí Knihovní a výpůjčním řádem Ústřední knihovny VŠB-TUO.
Contents of on-line thesis archive
Published in Theses:- autentizovaným zaměstnancům ze stejné školy/fakulty
Other ways of accessing the text
Institution archiving the thesis and making it accessible: VŠB – Technická univerzita OstravaVSB – Technical University of Ostrava
Fakulta elektrotechniky a informatikyDoctoral programme:
Informatika
Theses on a related topic
-
Evolutionary Synthesis of the Turing Machine´s Rules
Lukáš KOUŘIL -
Automatické doplňování a korekce interpunkce v češtině
Jakub Machura -
Pretraining and Evaluation of Czech ALBERT Language Model
Petr Zelina -
Feasibility Study of a Large Language Model (LLM)
Samuel Seidel -
Language endangerment, vitality and revitalization of the Hawaiian language
Hana Lebánková -
Byte Level Language Models
Vít Baisa -
Improving Arithmetical Reasoning of Language Models
Marek Kadlčík -
Mining Czech Clinical Notes Using the Language Modelling Technology
Tomáš Houfek