Radim Ševčík

Diplomová práce

Klasifikace elektronických dokumentů s využitím shlukové analýzy

Classification of electronic documents using cluster analysis
Anotace:
Současná doba je charakteristická nebývalým kumulováním informací, ať už co do množství, tak i komplexity. Většina z nich je dostupná v digitální formě a lze je analyzovat pomocí metod shlukové analýzy. Na kolekci 20 Newsgroups jsme se pokusili klasifikovat elektronické dokumenty na základě obsahu. Cílem bylo hodnotit dostupné shlukovací metody v širokém spektru aplikací. Po transformaci do binární …více
Abstract:
The current age is characterised by unprecedented information growth, whether it is by amount or complexity. Most of it is available in digital form so we can analyze it using cluster analysis. We have tried to classify the documents from 20 Newsgroups collection in terms of their content only. The aim was to asses available clustering methods in a variety of applications. After the transformation …více
 
 
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 7. 11. 2009

Obhajoba závěrečné práce

  • Obhajoba proběhla 10. 6. 2010
  • Vedoucí: Hana Řezanková
  • Oponent: Vojtěch Svátek

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • autentizovaným zaměstnancům ze stejné školy/fakulty
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Vysoká škola ekonomická v Praze
http://www.vse.cz/vskp/eid/21187

Vysoká škola ekonomická v Praze

Magisterský studijní program / obor:
Kvantitativní metody v ekonomice / Statisticko-pojistné inženýrství