Jiří Žárský

Master's thesis

Evaluation of text clustering comprehensibility

Evaluace srozumitelnosti pro shlukování textu
Abstract:
Diplomová práce má za cíl porovnat tři metody pro vizualizaci shluků textu (shlukování je metoda strojového učení bez učitele) za pomocí uživatelského průzkumu. Před vytvořením vizualizací je v práci provedena shluková analýza datové sady ze sociální sítě Twitter známé jako „Russian troll tweets“. Analýza je provedena dle metodiky CRISP-DM. Tři vizualizace zahrnují slovní mraky vypočítané z TD-IDF …more
Abstract:
This master thesis aims to evaluate three methods for visualizing results of text clustering, which is an unsupervised task of mining textual data, by conducting a user study. Before conceiving visualizations, clustering analysis of the “Russian Troll tweets” data set was performed. The analysis was completed using Python in accordance with the CRISP-DM methodology. The visualizations investigated …more
 
 
Language used: English
Date on which the thesis was submitted / produced: 25. 6. 2018

Thesis defence

  • Date of defence: 3. 2. 2020
  • Supervisor: Tomáš Kliegr
  • Reader: Štěpán Bahník

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • autentizovaným zaměstnancům ze stejné školy/fakulty
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Vysoká škola ekonomická v Praze
http://www.vse.cz/vskp/eid/78607