Bc. Tomáš Bílek

Bakalářská práce

Automatická detekce struktury webových komunikačních kanálů

Automatic structure detection of web communication channels
Anotace:
Práce se zabývá návrhem algoritmu a následným vývojem aplikace pro automatické detekování struktury dat z webových domén. Zaměřuje se na hledání data, nadpisu, autora a článku na českých zpravodajských serverech, blozích a podobně strukturovaných webových zdrojích. K hledání využívá vlastnosti textu a specifické značky ve zdrojovém kódu internetových stránek.
Abstract:
The thesis concerns the algorithm and development of the application for automatic structure detection from web domains. It focuses on finding date, title, author and article on Czech news servers, blogs and similarly structured web sources. It uses shallow text features and specific marks in source code of internet pages for searching.
 
 
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 20. 5. 2013

Obhajoba závěrečné práce

  • Obhajoba proběhla 17. 6. 2013
  • Vedoucí: RNDr. Jan Rygl
  • Oponent: Mgr. et Mgr. Vít Baisa, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masarykova univerzita

Fakulta informatiky

Bakalářský studijní program / obor:
Aplikovaná informatika / Aplikovaná informatika

Práce na příbuzné téma