Bc. Jakub Drábik

Bachelor's thesis

Semantic mining and analysis of information from heterogeneous data sets

Semantic mining and analysis of information from heterogeneous data sets
Abstract:
Cieľom tejto práce je preskúmať dostupné nástroje a techniky na umožnenie sémantického vyhľadávanie v elektronických dokumentoch rôznych formátov a pomocou nich implementovať riešenie podporujúce sémantické vyhľadávanie vo viacerých jazykoch. V prvej časti práca skúma nástroje a techniky na extrakciu textu a metadát, vrátane optického rozpoznávania znakov (OCR). Následne skúma rôzne metodológie z oblasti …more
Abstract:
This thesis aims to explore available tools and techniques for enabling semantic search in electronic documents of diverse formats and use them to implement a solution supporting semantic search across multiple languages. In the first part, the thesis explores tools and techniques for text and metadata extractions, including optical character recognition (OCR). Then, it examines various methodologies …more
 
 
Language used: English
Date on which the thesis was submitted / produced: 19. 12. 2023

Thesis defence

  • Date of defence: 15. 2. 2024
  • Supervisor: RNDr. Tomáš Rebok, Ph.D.
  • Reader: RNDr. Michal Batko, Ph.D.

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky