Bc. Martin Fraňo

Diplomová práce

Segmentace HTML dokumentu na logické části

Segmentation of an HTML document into logical parts
Abstract:
The most of webpages besides relavant data also contain certain amount of useless information, for example in terms of user searching. The main goal of this work is to design an algorithm applicable for extraction of the main content on a webpage.
Abstract:
Väčšina webových stránok obsahuje okrem hlavnej a podstatnej informácie aj množstvo nesúvisiacich dát, ktoré napríklad pri vyhľadávaní nie sú podstatné. Cieľom práce je navrhnúť algoritmus na extrahovanie práve hlavného obsahu webovej stránky.
 
 
Jazyk práce: slovenština
Datum vytvoření / odevzdání či podání práce: 25. 5. 2009

Obhajoba závěrečné práce

  • Obhajoba proběhla 29. 6. 2009
  • Vedoucí: doc. Mgr. Pavel Rychlý, Ph.D.
  • Oponent: RNDr. Radim Řehůřek, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masarykova univerzita

Fakulta informatiky

Magisterský studijní program / obor:
Aplikovaná informatika / Aplikovaná informatika

Práce na příbuzné téma