Balakothandaraman Mani

Master's thesis

Text Clustering

Text Clustering
Abstract:
Tato práce se snaží analyzovat postupy a metody používané pro shlukování textových dokumentů. Také vysvětluje problémy při provádění technik sdružování dokumentů. Seskupování dokumentů budeme provádět analýzou dvou textových datových souborů v reálném světě: 20 diskusních skupin a Reuters, kde 20 zpravodajských skupin bylo rozděleno do dvou variant, přičemž jedna varianta je založena na záhlaví, zápatí …more
Abstract:
This thesis tries to analyse the procedures and the methods used for clustering text documents. Also, explains the challenges in performing the document clustering techniques. We will be performing the document clustering by analysing two real world text datasets: 20 News group and Reuters, where 20 News group has been split into two variants, in which one variant is based on headers, footers and quotes …more
 
 
Language used: English
Date on which the thesis was submitted / produced: 30. 4. 2020

Thesis defence

  • Date of defence: 24. 6. 2020
  • Supervisor: Jan Platoš
  • Reader: Pavla Dráždilová

Citation record

Full text of thesis

Accessibility: Plné texty vysokoškolských kvalifikačních prací obhájených na Vysoké škole báňské - Technické univerzitě Ostrava jsou uloženy v repozitáři DSpace. Přístup k plným textům mají všichni uživatelé bez omezení. Přístup je omezen pouze ve výjimečných případech, zpravidla z důvodu ochrany duševního vlastnictví. Nepřístupné práce jsou označeny jako closedAccess nebo embargoedAccess. Tištěné verze prácí jsou uloženy v Ústřední knihovně VŠB-TUO a jsou prezenčně přístupné ve studovně diplomových prací. Další nakládání s prací (kopírování, opisy, MVS)se řídí Knihovní a výpůjčním řádem Ústřední knihovny VŠB-TUO.

Contents of on-line thesis archive
Published in Theses:
  • no one
Other ways of accessing the text
Institution archiving the thesis and making it accessible: VŠB – Technická univerzita Ostrava

VSB – Technical University of Ostrava

Fakulta elektrotechniky a informatiky

Master programme / field:
Informační a komunikační technologie / Informatika a výpočetní technika