Shlukování textů podle jejich podobnosti pomocí modulu Scikit-learn – Tomáš SMOLÍK
Tomáš SMOLÍK
Bachelor's thesis
Shlukování textů podle jejich podobnosti pomocí modulu Scikit-learn
Clustering of texts based on their similarity using the Scikit-learn
Abstract:
Cílem práce je prozkoumat vybrané algoritmy klasifikace (učení bez učitele) a jejich vhodnost vzhledem k reálnému problému. Tímto problémem je shlukování, respektive dělení novinových článku do skupin v závislosti na jejich tématu. Vybrané algoritmy jsou K-means, analýza hlavních komponent a latentní sémantická analýza. Práce se kromě teoretického úvodu zabývá také experimentální částí, kde jsou vybrané …moreAbstract:
The goal is to explore the selected classification algorithms (unsupervised learning) and their suitability for the real problem. This problem is the clustering or separation of newspaper articles into groups depending on their topic. The selected algorithms are the K-means, principal component analysis and latent semantic analysis. The work in addition to theoretical introduction also deals with the …more
Language used: Czech
Date on which the thesis was submitted / produced: 20. 8. 2013
Accessible from:: 31. 12. 2999
Thesis defence
- Supervisor: Ing. Lucie Skorkovská
Citation record
ISO 690-compliant citation record:
SMOLÍK, Tomáš. \textit{Shlukování textů podle jejich podobnosti pomocí modulu Scikit-learn}. Online. Bachelor's thesis. Plzeň: University of West Bohemia, Faculty of Applied Sciences. 2013. Available from: https://theses.cz/id/lrgux5/.
The right form of listing the thesis as a source quoted
SMOLÍK, Tomáš. Shlukování textů podle jejich podobnosti pomocí modulu Scikit-learn. Plzeň, 2013. bakalářská práce (Bc.). ZÁPADOČESKÁ UNIVERZITA V PLZNI. Fakulta aplikovaných věd
Full text of thesis
Accessibility: Autor si nepřeje zpřístupnění práce veřejnosti
Contents of on-line thesis archive
Published in Theses:- Soubory jsou nedostupné.
Other ways of accessing the text
Institution archiving the thesis and making it accessible: ZÁPADOČESKÁ UNIVERZITA V PLZNI, Fakulta aplikovaných vědUniversity of West Bohemia
Faculty of Applied SciencesBachelor programme / field:
Applied Sciences and Computer Engineering / Cybernetics and Control Engineering
Theses on a related topic
-
Sémantická analýza textů
Matěj Fries -
Explicitní sémantická analýza
Michal TUŠL -
Analýza sentimentu na sociální síti Twitter
Jakub HAIN -
Analýza příspěvků na sociální síti Twitter
Jakub HAIN -
Hledání sémantické informace v textových datech s využitím latentní analýzy
Pavel Řezníček -
Integrace metod vyběrů bodů a analýzy hlavních komponent do projektu A.D.A.P.T.
Štěpán Dvořáček -
Analýza hlavních komponent při identifikaci větrných ramp
Marek Janata -
Analýza hlavních komponent v proudové analýze
František Jedlička