Rozpoznávání struktur v kategorizaci webových dokumentů – Bc. Martina MEJZLÍKOVÁ
Bc. Martina MEJZLÍKOVÁ
Master's thesis
Rozpoznávání struktur v kategorizaci webových dokumentů
Pattern recognition in categorization of web documents
Abstract:
Tato práce se zabývá analýzou textového obsahu webových stránek. V práci je popsána problematika kategorizačních algoritmů - Naivního Bayesova klasifikátoru, klasifikačního rozšíření Kohonenových map a Support Vector Machines. Zároveň jsou v práci představeny metody extrahování příznaků z textového obsahu nacházející latentní sémantické struktury - latentní sémantická analýza, pravděpodobnostní latentní …moreAbstract:
This paper analyzes the text content of Web pages. The thesis describes the problems of selected categorization algorithms - Naive Bayes classifier, classification extension Kohonen maps and Support Vector Machines. Furthermore, the work presented methods of extraction of features from the text content found latent semantic structure - latent semantic analysis, probabilistic latent semantic analysis …more
Language used: Czech
Date on which the thesis was submitted / produced: 22. 6. 2015
Accessible from:: 22. 6. 2015
Thesis defence
- Date of defence: 21. 8. 2015
- Supervisor: doc. RNDr. PaedDr. Hashim Habiballa, PhD., Ph.D.
Citation record
The right form of listing the thesis as a source quoted
MEJZLÍKOVÁ, Martina. Rozpoznávání struktur v kategorizaci webových dokumentů. Ostrava, 2015. diplomová práce (Mgr.). OSTRAVSKÁ UNIVERZITA V OSTRAVĚ. Přírodovědecká fakulta
Full text of thesis
Accessibility: Autor si přeje zpřístupnit práci veřejnosti od 22.6.2015
Contents of on-line thesis archive
Published in Theses:- Soubory jsou od 22. 6. 2015 dostupné: autentizovaným zaměstnancům ze stejné školy/fakulty, autentizovaným studentům ze stejné školy/fakulty
Other ways of accessing the text
Institution archiving the thesis and making it accessible: OSTRAVSKÁ UNIVERZITA V OSTRAVĚ, Přírodovědecká fakultaUniversity of Ostrava
Faculty of ScienceMaster programme / field:
Information Science / Information Systems
Theses on a related topic
-
Sémantická analýza textů
Matěj Fries -
Explicitní sémantická analýza
Michal TUŠL -
Analýza sentimentu na sociální síti Twitter
Jakub HAIN -
Analýza příspěvků na sociální síti Twitter
Jakub HAIN -
Hledání sémantické informace v textových datech s využitím latentní analýzy
Pavel Řezníček -
Dolování dat z bezpečnostních událostí
Jaroslav Kašpar -
Návrh a implementace modelu pro distribuované dolování dat z veřejných rejstříků.
Tomáš DAVID -
Dolování dat z vybrané datové sady pro predikci podvodných pracovních nabídek
Sharon Moscato