Automatizovaný přepis rukopisných historických dokumentů a jejich využití pomocí moderních IT – Ondřej Tomiška
Ondřej Tomiška
Diplomová práce
Automatizovaný přepis rukopisných historických dokumentů a jejich využití pomocí moderních IT
Automatized transcription of handwritten historical records and their use with modern IT
Anotace:
Cílem práce je analyzovat možnosti využití současných informačních technologií (NLP, HTR, OCR, aj.) a jejich nástrojů (Transkribus, Quartex, Textract, NLTK, aj.) pro automatizaci procesů transkripce rukopisných i tištěných dokumentů a jejich následné využití pomocí text mining, web scraping a natural language processing metod, nástrojů a technik v kontextu archivního zpracování a metod Digital Humanities …víceAbstract:
This Master´s thesis aims to analyze current possibilites regarding the use of modern information technologies (NLP, HTR, OCR etc.) and its tools (Transkribus, Quartex, Textract, NLTK etc.) to automatically transcribe handwritten and printed records used to further process via Text Mining, Web Scraping and Natural Language Processing methods, tools and techniques in the context of archival processing …více
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 23. 3. 2021
Identifikátor:
http://evskp.uhk.cz/eM6779
Obhajoba závěrečné práce
- Obhajoba proběhla 1. 6. 2021
- Vedoucí: doc. RNDr. Štěpán Hubálovský, Ph.D.
- Oponent: Mgr. Klára Rybenská, Ph.D.
Citační záznam
Citace dle ISO 690:
TOMIŠKA, Ondřej. \textit{Automatizovaný přepis rukopisných historických dokumentů a jejich využití pomocí moderních IT}. Online. Diplomová práce. Hradec Králové: Univerzita Hradec Králové, Filozofická fakulta. 2021. Dostupné z: https://theses.cz/id/9lbwy8/.
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- Soubory jsou od 4. 6. 2021 dostupné: světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Univerzita Hradec KrálovéUniverzita Hradec Králové
Filozofická fakultaMagisterský studijní program / obor:
Historické vědy / Archivnictví
Práce na příbuzné téma
-
Text mining and its application in specialized translation
Marie Stalmachová -
Text mining
Lenka Katráková -
TEXT-MINING WITH LINKED DATA
Martin DOSTAL -
Text mining pro analýzu publikací konference
Martina Chvílová -
Receipt database with OCR scan
Petr Janík -
Evolutionary and Neural Approaches in OCR Error Correction
Dung Quoc Nguyen -
Využití OCR technologií v oblasti zrakově handicapovaných
David Bernard -
OCR historických dokumentů
Martin Mejzlík
Název
Vložil
Vloženo
Práva
Složky
Soubory
Kohout, J.
5. 6. 2021
Kohout, J.
5. 6. 2021