Automatizovaný přepis rukopisných historických dokumentů a jejich využití pomocí moderních IT – Ondřej Tomiška
Ondřej Tomiška
Master's thesis
Automatizovaný přepis rukopisných historických dokumentů a jejich využití pomocí moderních IT
Automatized transcription of handwritten historical records and their use with modern IT
Abstract:
Cílem práce je analyzovat možnosti využití současných informačních technologií (NLP, HTR, OCR, aj.) a jejich nástrojů (Transkribus, Quartex, Textract, NLTK, aj.) pro automatizaci procesů transkripce rukopisných i tištěných dokumentů a jejich následné využití pomocí text mining, web scraping a natural language processing metod, nástrojů a technik v kontextu archivního zpracování a metod Digital Humanities …moreAbstract:
This Master´s thesis aims to analyze current possibilites regarding the use of modern information technologies (NLP, HTR, OCR etc.) and its tools (Transkribus, Quartex, Textract, NLTK etc.) to automatically transcribe handwritten and printed records used to further process via Text Mining, Web Scraping and Natural Language Processing methods, tools and techniques in the context of archival processing …more
Language used: Czech
Date on which the thesis was submitted / produced: 23. 3. 2021
Identifier:
http://evskp.uhk.cz/eM6779
Thesis defence
- Date of defence: 1. 6. 2021
- Supervisor: doc. RNDr. Štěpán Hubálovský, Ph.D.
- Reader: Mgr. Klára Rybenská, Ph.D.
Citation record
ISO 690-compliant citation record:
TOMIŠKA, Ondřej. \textit{Automatizovaný přepis rukopisných historických dokumentů a jejich využití pomocí moderních IT}. Online. Master's thesis. Hradec Králové: University of Hradec Králové, Faculty of Arts. 2021. Available from: https://theses.cz/id/9lbwy8/.
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- Soubory jsou od 4. 6. 2021 dostupné: světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Univerzita Hradec KrálovéUniversity of Hradec Králové
Faculty of ArtsMaster programme / field:
Historické vědy / Archivnictví
Theses on a related topic
-
Text mining and its application in specialized translation
Marie Stalmachová -
Text mining
Lenka Katráková -
TEXT-MINING WITH LINKED DATA
Martin DOSTAL -
Text mining pro analýzu publikací konference
Martina Chvílová -
Receipt database with OCR scan
Petr Janík -
Evolutionary and Neural Approaches in OCR Error Correction
Dung Quoc Nguyen -
Využití OCR technologií v oblasti zrakově handicapovaných
David Bernard -
Strojové zpracování faktur metodou OCR a jeho integrace do CRM systému Atollon
Marián Čamák
Name
Posted by
Uploaded/Created
Rights
Folders
Files
Kohout, J.
5/6/2021
Kohout, J.
5/6/2021