Bc. Tomáš Bílek

Bachelor's thesis

Automatická detekce struktury webových komunikačních kanálů

Automatic structure detection of web communication channels
Anotácia:
Práce se zabývá návrhem algoritmu a následným vývojem aplikace pro automatické detekování struktury dat z webových domén. Zaměřuje se na hledání data, nadpisu, autora a článku na českých zpravodajských serverech, blozích a podobně strukturovaných webových zdrojích. K hledání využívá vlastnosti textu a specifické značky ve zdrojovém kódu internetových stránek.
Abstract:
The thesis concerns the algorithm and development of the application for automatic structure detection from web domains. It focuses on finding date, title, author and article on Czech news servers, blogs and similarly structured web sources. It uses shallow text features and specific marks in source code of internet pages for searching.
 
 
Jazyk práce: Czech
Datum vytvoření / odevzdání či podání práce: 20. 5. 2013

Obhajoba závěrečné práce

  • Obhajoba proběhla 17. 6. 2013
  • Vedúci: RNDr. Jan Rygl
  • Oponent: Mgr. et Mgr. Vít Baisa, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masaryk University

Faculty of Informatics

Bachelor programme / odbor:
Applied Informatics / Applied Informatics

Práce na příbuzné téma