Zpracování a kategorizace textů v přirozeném jazyce – Jan Kubica
Jan Kubica
Bachelor's thesis
Zpracování a kategorizace textů v přirozeném jazyce
Natural Text Processing and its Categorization
Anotácia:
Zaměřením této práce byla problematika zpracovávání textu v přirozeném jazyce a jeho kategorizace. Konkrétním cílem bylo vyvinout program pro zpracování textů v češtině a angličtině a jejich následnou analýzu. Po zvážení výběru jazyka pro implementaci byl vybrán programovací jazyk Python a pro extrakci dat z internetu byla využita jeho knihovna Scrapy. Lemmatizace textů je realizována skrze knihovnu …viacAbstract:
The aim of this work was the issue of text processing in natural language and its categorization, and specifically to develop a program for processing texts in Czech and English and their subsequent analysis. After considering the choice of language for implementation was selected programming language Python and its Scrapy library was used to extract data from the Internet. Lemmatization of texts is …viac
Jazyk práce: Czech
Datum vytvoření / odevzdání či podání práce: 30. 4. 2020
Identifikátor:
http://hdl.handle.net/10084/140472
Obhajoba závěrečné práce
- Obhajoba proběhla 23. 6. 2020
- Vedúci: Petr Šaloun
- Oponent: David Andrešič
Citační záznam
Citace dle ISO 690:
KUBICA, Jan. \textit{Zpracování a kategorizace textů v přirozeném jazyce}. Online. Bakalárska práca. Ostrava: Vysoká škola báňská - Technická univerzita Ostrava, Fakulta elektrotechniky a informatiky. 2020. Dostupné z: https://theses.cz/id/619ibk/.
Plný text práce
Právo: Plné texty vysokoškolských kvalifikačních prací obhájených na Vysoké škole báňské - Technické univerzitě Ostrava jsou uloženy v repozitáři DSpace. Přístup k plným textům mají všichni uživatelé bez omezení. Přístup je omezen pouze ve výjimečných případech, zpravidla z důvodu ochrany duševního vlastnictví. Nepřístupné práce jsou označeny jako closedAccess nebo embargoedAccess. Tištěné verze prácí jsou uloženy v Ústřední knihovně VŠB-TUO a jsou prezenčně přístupné ve studovně diplomových prací. Další nakládání s prací (kopírování, opisy, MVS)se řídí Knihovní a výpůjčním řádem Ústřední knihovny VŠB-TUO.
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- autentizovaným zaměstnancům ze stejné školy/fakulty
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: VŠB – Technická univerzita OstravaVSB – Technical University of Ostrava
Fakulta elektrotechniky a informatikyBachelor programme / odbor:
Informační a komunikační technologie / Informatika a výpočetní technika
Práce na příbuzné téma
-
Kategorizace zákaznické zpětné vazby nezávislá na jazyce
Pavel PRŮCHA -
Machine Learning for Text Anomaly Detection
Alina Tsykynovska -
Topic Classification for Web Corpora: Method Comparison and Crosslingual Transfer
Rastislav Papčo -
CEREMONIE MISTRŮ MAJKU RAP - UMĚNÍ NEBO PROTEST
Jiří Tichý -
Osvětlení schodiště v bytovém domě.
Ondrej Majko