Segmentace HTML dokumentu na logické části – Bc. Martin Fraňo
Bc. Martin Fraňo
Diplomová práce
Segmentace HTML dokumentu na logické části
Segmentation of an HTML document into logical parts
Abstract:
The most of webpages besides relavant data also contain certain amount of useless information, for example in terms of user searching. The main goal of this work is to design an algorithm applicable for extraction of the main content on a webpage.Abstract:
Väčšina webových stránok obsahuje okrem hlavnej a podstatnej informácie aj množstvo nesúvisiacich dát, ktoré napríklad pri vyhľadávaní nie sú podstatné. Cieľom práce je navrhnúť algoritmus na extrahovanie práve hlavného obsahu webovej stránky.
Jazyk práce: slovenština
Datum vytvoření / odevzdání či podání práce: 25. 5. 2009
Identifikátor:
https://is.muni.cz/th/w5r53/
Obhajoba závěrečné práce
- Obhajoba proběhla 29. 6. 2009
- Vedoucí: doc. Mgr. Pavel Rychlý, Ph.D.
- Oponent: RNDr. Radim Řehůřek, Ph.D.
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasarykova univerzita
Fakulta informatikyMagisterský studijní program / obor:
Aplikovaná informatika / Aplikovaná informatika
Práce na příbuzné téma
-
Web content cleaning
Vít Baisa