Radim Ševčík

Master's thesis

Klasifikace elektronických dokumentů s využitím shlukové analýzy

Classification of electronic documents using cluster analysis
Abstract:
Současná doba je charakteristická nebývalým kumulováním informací, ať už co do množství, tak i komplexity. Většina z nich je dostupná v digitální formě a lze je analyzovat pomocí metod shlukové analýzy. Na kolekci 20 Newsgroups jsme se pokusili klasifikovat elektronické dokumenty na základě obsahu. Cílem bylo hodnotit dostupné shlukovací metody v širokém spektru aplikací. Po transformaci do binární …more
Abstract:
The current age is characterised by unprecedented information growth, whether it is by amount or complexity. Most of it is available in digital form so we can analyze it using cluster analysis. We have tried to classify the documents from 20 Newsgroups collection in terms of their content only. The aim was to asses available clustering methods in a variety of applications. After the transformation …more
 
 
Language used: Czech
Date on which the thesis was submitted / produced: 7. 11. 2009

Thesis defence

  • Date of defence: 10. 6. 2010
  • Supervisor: Hana Řezanková
  • Reader: Vojtěch Svátek

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • autentizovaným zaměstnancům ze stejné školy/fakulty
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Vysoká škola ekonomická v Praze
http://www.vse.cz/vskp/eid/21187

Vysoká škola ekonomická v Praze

Master programme / field:
Kvantitativní metody v ekonomice / Statisticko-pojistné inženýrství