Rozpoznávání struktur v kategorizaci webových dokumentů – Bc. Martina MEJZLÍKOVÁ
Bc. Martina MEJZLÍKOVÁ
Diplomová práce
Rozpoznávání struktur v kategorizaci webových dokumentů
Pattern recognition in categorization of web documents
Anotace:
Tato práce se zabývá analýzou textového obsahu webových stránek. V práci je popsána problematika kategorizačních algoritmů - Naivního Bayesova klasifikátoru, klasifikačního rozšíření Kohonenových map a Support Vector Machines. Zároveň jsou v práci představeny metody extrahování příznaků z textového obsahu nacházející latentní sémantické struktury - latentní sémantická analýza, pravděpodobnostní latentní …víceAbstract:
This paper analyzes the text content of Web pages. The thesis describes the problems of selected categorization algorithms - Naive Bayes classifier, classification extension Kohonen maps and Support Vector Machines. Furthermore, the work presented methods of extraction of features from the text content found latent semantic structure - latent semantic analysis, probabilistic latent semantic analysis …více
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 22. 6. 2015
Zveřejnit od: 22. 6. 2015
Obhajoba závěrečné práce
- Obhajoba proběhla 21. 8. 2015
- Vedoucí: doc. RNDr. PaedDr. Hashim Habiballa, PhD., Ph.D.
Citační záznam
Jak správně citovat práci
MEJZLÍKOVÁ, Martina. Rozpoznávání struktur v kategorizaci webových dokumentů. Ostrava, 2015. diplomová práce (Mgr.). OSTRAVSKÁ UNIVERZITA V OSTRAVĚ. Přírodovědecká fakulta
Plný text práce
Právo: Autor si přeje zpřístupnit práci veřejnosti od 22.6.2015
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- Soubory jsou od 22. 6. 2015 dostupné: autentizovaným zaměstnancům ze stejné školy/fakulty, autentizovaným studentům ze stejné školy/fakulty
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: OSTRAVSKÁ UNIVERZITA V OSTRAVĚ, Přírodovědecká fakultaOSTRAVSKÁ UNIVERZITA V OSTRAVĚ
Přírodovědecká fakultaMagisterský studijní program / obor:
Informatika / Informační systémy
Práce na příbuzné téma
-
Sémantická analýza textů
Matěj Fries -
Explicitní sémantická analýza
Michal TUŠL -
Analýza sentimentu na sociální síti Twitter
Jakub HAIN -
Analýza příspěvků na sociální síti Twitter
Jakub HAIN -
Hledání sémantické informace v textových datech s využitím latentní analýzy
Pavel Řezníček -
Dolování dat z bezpečnostních událostí
Jaroslav Kašpar -
Návrh a implementace modelu pro distribuované dolování dat z veřejných rejstříků.
Tomáš DAVID -
Dolování dat z vybrané datové sady pro predikci podvodných pracovních nabídek
Sharon Moscato