Balakothandaraman Mani
Diplomová práce
Text Clustering
Text Clustering
Anotace:
Tato práce se snaží analyzovat postupy a metody používané pro shlukování textových dokumentů. Také vysvětluje problémy při provádění technik sdružování dokumentů. Seskupování dokumentů budeme provádět analýzou dvou textových datových souborů v reálném světě: 20 diskusních skupin a Reuters, kde 20 zpravodajských skupin bylo rozděleno do dvou variant, přičemž jedna varianta je založena na záhlaví, zápatí …víceAbstract:
This thesis tries to analyse the procedures and the methods used for clustering text documents. Also, explains the challenges in performing the document clustering techniques. We will be performing the document clustering by analysing two real world text datasets: 20 News group and Reuters, where 20 News group has been split into two variants, in which one variant is based on headers, footers and quotes …víceKlíčová slova
shlukování dokumentů shlukování textu 20 diskusních skupin Reuters HAC kmeans buckshot
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 30. 4. 2020
Identifikátor:
http://hdl.handle.net/10084/140520
Obhajoba závěrečné práce
- Obhajoba proběhla 24. 6. 2020
- Vedoucí: Jan Platoš
- Oponent: Pavla Dráždilová
Citační záznam
Plný text práce
Právo: Plné texty vysokoškolských kvalifikačních prací obhájených na Vysoké škole báňské - Technické univerzitě Ostrava jsou uloženy v repozitáři DSpace. Přístup k plným textům mají všichni uživatelé bez omezení. Přístup je omezen pouze ve výjimečných případech, zpravidla z důvodu ochrany duševního vlastnictví. Nepřístupné práce jsou označeny jako closedAccess nebo embargoedAccess. Tištěné verze prácí jsou uloženy v Ústřední knihovně VŠB-TUO a jsou prezenčně přístupné ve studovně diplomových prací. Další nakládání s prací (kopírování, opisy, MVS)se řídí Knihovní a výpůjčním řádem Ústřední knihovny VŠB-TUO.
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- autentizovaným zaměstnancům ze stejné školy/fakulty
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: VŠB – Technická univerzita OstravaVŠB – Technická univerzita Ostrava
Fakulta elektrotechniky a informatikyMagisterský studijní program / obor:
Informační a komunikační technologie / Informatika a výpočetní technika