Klasifikace elektronických dokumentů s využitím shlukové analýzy – Radim Ševčík
Radim Ševčík
Diplomová práce
Klasifikace elektronických dokumentů s využitím shlukové analýzy
Classification of electronic documents using cluster analysis
Anotace:
Současná doba je charakteristická nebývalým kumulováním informací, ať už co do množství, tak i komplexity. Většina z nich je dostupná v digitální formě a lze je analyzovat pomocí metod shlukové analýzy. Na kolekci 20 Newsgroups jsme se pokusili klasifikovat elektronické dokumenty na základě obsahu. Cílem bylo hodnotit dostupné shlukovací metody v širokém spektru aplikací. Po transformaci do binární …víceAbstract:
The current age is characterised by unprecedented information growth, whether it is by amount or complexity. Most of it is available in digital form so we can analyze it using cluster analysis. We have tried to classify the documents from 20 Newsgroups collection in terms of their content only. The aim was to asses available clustering methods in a variety of applications. After the transformation …více
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 7. 11. 2009
Identifikátor:
http://www.vse.cz/vskp/eid/21187
Obhajoba závěrečné práce
- Obhajoba proběhla 10. 6. 2010
- Vedoucí: Hana Řezanková
- Oponent: Vojtěch Svátek
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- autentizovaným zaměstnancům ze stejné školy/fakulty
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Vysoká škola ekonomická v Prazehttp://www.vse.cz/vskp/eid/21187
Vysoká škola ekonomická v Praze
Magisterský studijní program / obor:
Kvantitativní metody v ekonomice / Statisticko-pojistné inženýrství