Mgr. Juraj Martinka

Bachelor's thesis

Moduly systému pro extrakci dat z HTML

HTML Extract modules
Abstract:
The main subject of this thesis is development of modules for application HTML Extract, dedicated for semi-automatic data extraction from HTML. The practical achievement of this thesis is implementation of two new modules: Automatic searching of web pages through the use of search engines and Data extraction into OpenOffice ODT format. The next point is the analysis of "state of the art" of used technologies …more
Abstract:
Práca sa zaoberá vývojom rozširujúcich modulov pre aplikáciu HTML Extract určenú pre poloautomatickú extrakciu dát z HTML. Praktickým výsledkom práce je implementácia dvoch nových modulov: modul pre automatizáciu vyhľadávania webových stránok pomocou internetových vyhľadávačov a modul pre extrakciu dát do formátu OpenOffice ODT. Ďalším bodom je analýza súčasného stavu použitých technológií a poskytnutie …more
 
 
Language used: Slovak
Date on which the thesis was submitted / produced: 25. 5. 2009

Thesis defence

  • Date of defence: 25. 6. 2009
  • Supervisor: RNDr. Tomáš Gregar
  • Reader: Mgr. Luděk Bártek, Ph.D.

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky