Automatizovaný přepis rukopisných historických dokumentů a jejich využití pomocí moderních IT – Ondřej Tomiška
Ondřej Tomiška
Master's thesis
Automatizovaný přepis rukopisných historických dokumentů a jejich využití pomocí moderních IT
Automatized transcription of handwritten historical records and their use with modern IT
Anotácia:
Cílem práce je analyzovat možnosti využití současných informačních technologií (NLP, HTR, OCR, aj.) a jejich nástrojů (Transkribus, Quartex, Textract, NLTK, aj.) pro automatizaci procesů transkripce rukopisných i tištěných dokumentů a jejich následné využití pomocí text mining, web scraping a natural language processing metod, nástrojů a technik v kontextu archivního zpracování a metod Digital Humanities …viacAbstract:
This Master´s thesis aims to analyze current possibilites regarding the use of modern information technologies (NLP, HTR, OCR etc.) and its tools (Transkribus, Quartex, Textract, NLTK etc.) to automatically transcribe handwritten and printed records used to further process via Text Mining, Web Scraping and Natural Language Processing methods, tools and techniques in the context of archival processing …viac
Jazyk práce: Czech
Datum vytvoření / odevzdání či podání práce: 23. 3. 2021
Identifikátor:
http://evskp.uhk.cz/eM6779
Obhajoba závěrečné práce
- Obhajoba proběhla 1. 6. 2021
- Vedúci: doc. RNDr. Štěpán Hubálovský, Ph.D.
- Oponent: Mgr. Klára Rybenská, Ph.D.
Citační záznam
Citace dle ISO 690:
TOMIŠKA, Ondřej. \textit{Automatizovaný přepis rukopisných historických dokumentů a jejich využití pomocí moderních IT}. Online. Diplomová práca. Hradec Králové: Univerzita Hradec Králové, Faculty of Arts. 2021. Dostupné z: https://theses.cz/id/9lbwy8/.
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- Soubory jsou od 4. 6. 2021 dostupné: světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Univerzita Hradec KrálovéUniversity of Hradec Králové
Faculty of ArtsMaster programme / odbor:
Historické vědy / Archivnictví
Práce na příbuzné téma
-
Text mining and its application in specialized translation
Marie Stalmachová -
Text mining
Lenka Katráková -
TEXT-MINING WITH LINKED DATA
Martin DOSTAL -
Text mining pro analýzu publikací konference
Martina Chvílová -
Receipt database with OCR scan
Petr Janík -
Evolutionary and Neural Approaches in OCR Error Correction
Dung Quoc Nguyen -
Využití OCR technologií v oblasti zrakově handicapovaných
David Bernard -
OCR historických dokumentů
Martin Mejzlík
Názov
Vložil
Vložené
Práva
Složky
Soubory
Kohout, J.
5. 6. 2021
Kohout, J.
5. 6. 2021