Mgr. Juraj Martinka

Bakalářská práce

Moduly systému pro extrakci dat z HTML

HTML Extract modules
Abstract:
The main subject of this thesis is development of modules for application HTML Extract, dedicated for semi-automatic data extraction from HTML. The practical achievement of this thesis is implementation of two new modules: Automatic searching of web pages through the use of search engines and Data extraction into OpenOffice ODT format. The next point is the analysis of "state of the art" of used technologies …více
Abstract:
Práca sa zaoberá vývojom rozširujúcich modulov pre aplikáciu HTML Extract určenú pre poloautomatickú extrakciu dát z HTML. Praktickým výsledkom práce je implementácia dvoch nových modulov: modul pre automatizáciu vyhľadávania webových stránok pomocou internetových vyhľadávačov a modul pre extrakciu dát do formátu OpenOffice ODT. Ďalším bodom je analýza súčasného stavu použitých technológií a poskytnutie …více
 
 
Jazyk práce: slovenština
Datum vytvoření / odevzdání či podání práce: 25. 5. 2009

Obhajoba závěrečné práce

  • Obhajoba proběhla 25. 6. 2009
  • Vedoucí: RNDr. Tomáš Gregar
  • Oponent: Mgr. Luděk Bártek, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky