Balakothandaraman Mani

Diplomová práce

Text Clustering

Text Clustering
Anotace:
Tato práce se snaží analyzovat postupy a metody používané pro shlukování textových dokumentů. Také vysvětluje problémy při provádění technik sdružování dokumentů. Seskupování dokumentů budeme provádět analýzou dvou textových datových souborů v reálném světě: 20 diskusních skupin a Reuters, kde 20 zpravodajských skupin bylo rozděleno do dvou variant, přičemž jedna varianta je založena na záhlaví, zápatí …více
Abstract:
This thesis tries to analyse the procedures and the methods used for clustering text documents. Also, explains the challenges in performing the document clustering techniques. We will be performing the document clustering by analysing two real world text datasets: 20 News group and Reuters, where 20 News group has been split into two variants, in which one variant is based on headers, footers and quotes …více
 
 
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 30. 4. 2020

Obhajoba závěrečné práce

  • Obhajoba proběhla 24. 6. 2020
  • Vedoucí: Jan Platoš
  • Oponent: Pavla Dráždilová

Citační záznam

Plný text práce

Právo: Plné texty vysokoškolských kvalifikačních prací obhájených na Vysoké škole báňské - Technické univerzitě Ostrava jsou uloženy v repozitáři DSpace. Přístup k plným textům mají všichni uživatelé bez omezení. Přístup je omezen pouze ve výjimečných případech, zpravidla z důvodu ochrany duševního vlastnictví. Nepřístupné práce jsou označeny jako closedAccess nebo embargoedAccess. Tištěné verze prácí jsou uloženy v Ústřední knihovně VŠB-TUO a jsou prezenčně přístupné ve studovně diplomových prací. Další nakládání s prací (kopírování, opisy, MVS)se řídí Knihovní a výpůjčním řádem Ústřední knihovny VŠB-TUO.

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • nikomu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: VŠB – Technická univerzita Ostrava

VŠB – Technická univerzita Ostrava

Fakulta elektrotechniky a informatiky

Magisterský studijní program / obor:
Informační a komunikační technologie / Informatika a výpočetní technika