Klasifikace elektronických dokumentů s využitím shlukové analýzy – Radim Ševčík
Radim Ševčík
Master's thesis
Klasifikace elektronických dokumentů s využitím shlukové analýzy
Classification of electronic documents using cluster analysis
Abstract:
Současná doba je charakteristická nebývalým kumulováním informací, ať už co do množství, tak i komplexity. Většina z nich je dostupná v digitální formě a lze je analyzovat pomocí metod shlukové analýzy. Na kolekci 20 Newsgroups jsme se pokusili klasifikovat elektronické dokumenty na základě obsahu. Cílem bylo hodnotit dostupné shlukovací metody v širokém spektru aplikací. Po transformaci do binární …moreAbstract:
The current age is characterised by unprecedented information growth, whether it is by amount or complexity. Most of it is available in digital form so we can analyze it using cluster analysis. We have tried to classify the documents from 20 Newsgroups collection in terms of their content only. The aim was to asses available clustering methods in a variety of applications. After the transformation …more
Language used: Czech
Date on which the thesis was submitted / produced: 7. 11. 2009
Identifier:
http://www.vse.cz/vskp/eid/21187
Thesis defence
- Date of defence: 10. 6. 2010
- Supervisor: Hana Řezanková
- Reader: Vojtěch Svátek
Citation record
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- autentizovaným zaměstnancům ze stejné školy/fakulty
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Vysoká škola ekonomická v Prazehttp://www.vse.cz/vskp/eid/21187
Vysoká škola ekonomická v Praze
Master programme / field:
Kvantitativní metody v ekonomice / Statisticko-pojistné inženýrství