Bc. Martina MEJZLÍKOVÁ

Master's thesis

Rozpoznávání struktur v kategorizaci webových dokumentů

Pattern recognition in categorization of web documents
Abstract:
Tato práce se zabývá analýzou textového obsahu webových stránek. V práci je popsána problematika kategorizačních algoritmů - Naivního Bayesova klasifikátoru, klasifikačního rozšíření Kohonenových map a Support Vector Machines. Zároveň jsou v práci představeny metody extrahování příznaků z textového obsahu nacházející latentní sémantické struktury - latentní sémantická analýza, pravděpodobnostní latentní …more
Abstract:
This paper analyzes the text content of Web pages. The thesis describes the problems of selected categorization algorithms - Naive Bayes classifier, classification extension Kohonen maps and Support Vector Machines. Furthermore, the work presented methods of extraction of features from the text content found latent semantic structure - latent semantic analysis, probabilistic latent semantic analysis …more
 
 
Language used: Czech
Date on which the thesis was submitted / produced: 22. 6. 2015
Accessible from:: 22. 6. 2015

Thesis defence

  • Date of defence: 21. 8. 2015
  • Supervisor: doc. RNDr. PaedDr. Hashim Habiballa, PhD., Ph.D.

Citation record

The right form of listing the thesis as a source quoted

MEJZLÍKOVÁ, Martina. Rozpoznávání struktur v kategorizaci webových dokumentů. Ostrava, 2015. diplomová práce (Mgr.). OSTRAVSKÁ UNIVERZITA V OSTRAVĚ. Přírodovědecká fakulta

Full text of thesis

Accessibility: Autor si přeje zpřístupnit práci veřejnosti od 22.6.2015

Contents of on-line thesis archive
Published in Theses:
  • Soubory jsou od 22. 6. 2015 dostupné: autentizovaným zaměstnancům ze stejné školy/fakulty, autentizovaným studentům ze stejné školy/fakulty
Other ways of accessing the text
Institution archiving the thesis and making it accessible: OSTRAVSKÁ UNIVERZITA V OSTRAVĚ, Přírodovědecká fakulta