Aplikace Machine learningu pro získávání dat z dokumentů – Adéla Šolarová
Adéla Šolarová
Bachelor's thesis
Aplikace Machine learningu pro získávání dat z dokumentů
Machine learning application for obtaining data from documents
Abstract:
Tato práce se zabývá vytvořením programu, schopného automatizovat proces čtení určitých předem definovaných informací z velkého množství strukturovaných PDF dokumentů. Velký důraz je kladen na klasifikaci dokumentů, z důvodu definování malé skupiny vzájemně si velmi podobných dokumentů a následného usnadnění identifikace informací z této jasně vymezené skupiny dokumentů. Pro testování programu byly …moreAbstract:
This work presents a software program designed to automate the process of extracting predefined data from a large set of structured PDF documents. The focus is on document classification, which aims to group together very similar documents, thus streamlining the information retrieval process. The chosen document type for the study is measurement protocols for X-ray devices. Two unsupervised learning …more
Language used: Czech
Date on which the thesis was submitted / produced: 18. 3. 2023
Thesis defence
- Date of defence: 18. 5. 2023
- Supervisor: doc. Ing. Jan Tyrychtr, Ph.D.
- Reader: David Novák, Ing.
Citation record
ISO 690-compliant citation record:
ŠOLAROVÁ, Adéla. \textit{Aplikace Machine learningu pro získávání dat z dokumentů}. Online. Bachelor's thesis. Praha: Czech University of Life Sciences Prague, Faculty of Economics and Management. 2023. Available from: https://theses.cz/id/ckx19m/.
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Česká zemědělská univerzita v Praze, Provozně ekonomická fakultaCzech University of Life Sciences Prague
Faculty of Economics and ManagementBachelor programme:
Informatics
Theses on a related topic
-
Klasifikace dokumentů s částečnou informací od učitele
Ondřej MACEK -
Klasifikace dokumentů v textových korpusech
Vít Suchomel -
Automatická klasifikace vícejazyčných dokumentů
Ladislav HLOM -
Klasifikace textových dokumentů pomocí neuronových sítí
Petr HLAVÁČ -
Klasifikace dokumentů s použitím hierarchické reprezentace
Jakub MORÁVKA -
Metodika klasifikace dokumentů ve firmě v rámci ECM
Václava Kučerová Zrálíková -
Klasifikace dokumentů s využitím GPU-PSO
Tomáš Ježowicz -
Machine Learning for Text Anomaly Detection
Alina Tsykynovska
Name
Posted by
Uploaded/Created
Rights