Segmentace HTML dokumentu na logické části – Bc. Martin Fraňo
Bc. Martin Fraňo
Master's thesis
Segmentace HTML dokumentu na logické části
Segmentation of an HTML document into logical parts
Abstract:
The most of webpages besides relavant data also contain certain amount of useless information, for example in terms of user searching. The main goal of this work is to design an algorithm applicable for extraction of the main content on a webpage.Abstract:
Väčšina webových stránok obsahuje okrem hlavnej a podstatnej informácie aj množstvo nesúvisiacich dát, ktoré napríklad pri vyhľadávaní nie sú podstatné. Cieľom práce je navrhnúť algoritmus na extrahovanie práve hlavného obsahu webovej stránky.
Jazyk práce: Slovak
Datum vytvoření / odevzdání či podání práce: 25. 5. 2009
Identifikátor:
https://is.muni.cz/th/w5r53/
Obhajoba závěrečné práce
- Obhajoba proběhla 29. 6. 2009
- Vedúci: doc. Mgr. Pavel Rychlý, Ph.D.
- Oponent: RNDr. Radim Řehůřek, Ph.D.
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsMaster programme / odbor:
Applied Informatics / Applied Informatics
Práce na příbuzné téma
-
Web content cleaning
Vít Baisa