Tomáš SMOLÍK

Bachelor's thesis

Shlukování textů podle jejich podobnosti pomocí modulu Scikit-learn

Clustering of texts based on their similarity using the Scikit-learn
Abstract:
Cílem práce je prozkoumat vybrané algoritmy klasifikace (učení bez učitele) a jejich vhodnost vzhledem k reálnému problému. Tímto problémem je shlukování, respektive dělení novinových článku do skupin v závislosti na jejich tématu. Vybrané algoritmy jsou K-means, analýza hlavních komponent a latentní sémantická analýza. Práce se kromě teoretického úvodu zabývá také experimentální částí, kde jsou vybrané …more
Abstract:
The goal is to explore the selected classification algorithms (unsupervised learning) and their suitability for the real problem. This problem is the clustering or separation of newspaper articles into groups depending on their topic. The selected algorithms are the K-means, principal component analysis and latent semantic analysis. The work in addition to theoretical introduction also deals with the …more
 
 
Language used: Czech
Date on which the thesis was submitted / produced: 20. 8. 2013
Accessible from:: 31. 12. 2999

Thesis defence

  • Supervisor: Ing. Lucie Skorkovská

Citation record

The right form of listing the thesis as a source quoted

SMOLÍK, Tomáš. Shlukování textů podle jejich podobnosti pomocí modulu Scikit-learn. Plzeň, 2013. bakalářská práce (Bc.). ZÁPADOČESKÁ UNIVERZITA V PLZNI. Fakulta aplikovaných věd

Full text of thesis

Accessibility: Autor si nepřeje zpřístupnění práce veřejnosti

Contents of on-line thesis archive
Published in Theses:
  • Soubory jsou nedostupné.
Other ways of accessing the text
Institution archiving the thesis and making it accessible: ZÁPADOČESKÁ UNIVERZITA V PLZNI, Fakulta aplikovaných věd

University of West Bohemia

Faculty of Applied Sciences

Bachelor programme / field:
Applied Sciences and Computer Engineering / Cybernetics and Control Engineering