Určování podobnosti dokumentů s použitím tradičních výpočetních metod a spolupráce davu – Barbora Cigánková
Barbora Cigánková
Diplomová práce
Určování podobnosti dokumentů s použitím tradičních výpočetních metod a spolupráce davu
Document Categorization Using Traditional Algorithms and Crowd Sourcing
Anotace:
Diplomová práce se zabývá kategorizací textových dokumentů a jejím následným zlepšováním pomocí spolupráce davu. Jejím cílem je návrh a vytvoření prototypu klasifikátoru textových dokumentů na základě jejich podobnosti a návrh zhodnocení a následné zlepšování kategorizace s využitím spolupráce davu. Ke kategorizaci dokumentů byl vybrán algoritmus N-gramů, který byl následně implementován v jazyce Java …víceAbstract:
The master thesis deals with categorization of text documents and its improvement through crowdsourcing. Its goal is to design and implement text documents classifier prototype based on documents similarity and to design evaluation and improvements of categorization using crowdsourcing. For categorization the N-grams algorithm has been chosen, which was implemented in Java. Next, interface for crowdsourcing …více
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 30. 4. 2018
Identifikátor:
http://hdl.handle.net/10084/128595
Obhajoba závěrečné práce
- Obhajoba proběhla 4. 6. 2018
- Vedoucí: Petr Šaloun
- Oponent: David Seidl
Citační záznam
Citace dle ISO 690:
CIGÁNKOVÁ, Barbora. \textit{Určování podobnosti dokumentů s použitím tradičních výpočetních metod a spolupráce davu}. Online. Diplomová práce. Ostrava: Vysoká škola báňská - Technická univerzita Ostrava, Fakulta elektrotechniky a informatiky. 2018. Dostupné z: https://theses.cz/id/u0ibrk/.
Plný text práce
Právo: Plné texty vysokoškolských kvalifikačních prací obhájených na Vysoké škole báňské - Technické univerzitě Ostrava jsou uloženy v repozitáři DSpace. Přístup k plným textům mají všichni uživatelé bez omezení. Přístup je omezen pouze ve výjimečných případech, zpravidla z důvodu ochrany duševního vlastnictví. Nepřístupné práce jsou označeny jako closedAccess nebo embargoedAccess. Tištěné verze prácí jsou uloženy v Ústřední knihovně VŠB-TUO a jsou prezenčně přístupné ve studovně diplomových prací. Další nakládání s prací (kopírování, opisy, MVS) se řídí Knihovní a výpůjčním řádem Ústřední knihovny VŠB-TUO.
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- autentizovaným zaměstnancům ze stejné školy/fakulty
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: VŠB - Technická univerzita OstravaVŠB - Technická univerzita Ostrava
Fakulta elektrotechniky a informatikyMagisterský studijní program / obor:
Informační a komunikační technologie / Informatika a výpočetní technika
Práce na příbuzné téma
-
Fast Similarity Searching of Text Documents using Learned Metric Index
Jakub Žovák -
Distributed Systems for Discovering Similar Documents
Jan Kasprzak -
Hudba v dokumentu, dokument v hudbě
Tereza Bulisová -
Komponenty pro výukový elektronický materiál - Zpracování textových dokumentů v aplikacích Dokumenty Google a Office 365.
Jan FRENCL -
Web API pro rozpoznání autorství textového dokumentu
Adam Prchal -
Automatická detekce jazyka textového dokumentu
Jan Cakl -
Implementace CMS na PHP frameworku Symfony
Jiří Barouš -
Srovnání PHP a JSP technologií
Tomáš Bartošek