Klasifikace dokumentů v textových korpusech

Suchomel, Vít

EN SKPřihlásit se Přihlásit se (EduID)

Theses buir8w

Klasifikace dokumentů v textových korpusech – Bc. Vít Suchomel

Zpět na vyhledávání

Bc. Vít Suchomel

Diplomová práce

Klasifikace dokumentů v textových korpusech

Document classification in text corpora

Anotace:

Diplomová práce má dva základní cíle. Prvním cílem je vytvoření „modelového korpusu“ webových textů o velikosti 100 milionů slov. Korpus bude vhodně složen z různých typů textů (např. novinové články, blogy, volně dostupná próza) zastoupených v přesně stanovených množstvích. Druhým cílem práce je vytvoření klasifikátoru jednotlivých typů textů pomocí metod strojového učení. Student se seznámí s několika …více

Abstract:

There are two aims of this diploma thesis. The first objective is to create a "model corpus" of web texts containing 100 million words. The corpus has to be consisted of several types of texts (e. g. newspaper articles, blogs, prose available online) in strictly defined quantities. The second objective of the thesis is to create a classifier of the respective text types using machine learning methods …více

Klíčová slova

Klasifikace dokumentů strojové učení korpus klasifikace klasifikátor SVM předzpracování

Jazyk práce: čeština

Datum vytvoření / odevzdání či podání práce: 11. 1. 2010

Identifikátor: https://is.muni.cz/th/wv40x/

Obhajoba závěrečné práce

Obhajoba proběhla 10. 2. 2010
Vedoucí: RNDr. Jan Pomikálek, Ph.D.

Citační záznam

Citovat tuto práci

Citace dle ISO 690:

SUCHOMEL, Vít. \textit{Klasifikace dokumentů v textových korpusech}. Online. Diplomová práce. Brno: Masarykova univerzita, Fakulta informatiky. 2010. Dostupné z: https://theses.cz/id/buir8w/.

{{Citace kvalifikační práce
 | příjmení = Suchomel
 | jméno = Vít
 | instituce = Masarykova univerzita, Fakulta informatiky
 | titul = Klasifikace dokumentů v textových korpusech
 | url = https://theses.cz/id/buir8w/
 | typ práce = Diplomová práce
 | vedoucí = RNDr. Jan Pomikálek, Ph.D.
 | rok = 2010
 | počet stran =
 | strany =
 | citace = 2024-11-17
 | poznámka =
 | jazyk = 
}}

Plný text práce

Obsah online archivu závěrečné práce

Zveřejněno v Theses:

světu

Jak jinak získat přístup k textu

Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Odkaz na adresář do lokálního úložiště instituce

Masarykova univerzita

Fakulta informatiky

Magisterský studijní program / obor:
Informatika / Umělá inteligence a zpracování přirozeného jazyka

Práce na příbuzné téma

Klasifikace dokumentů s částečnou informací od učitele
Ondřej MACEK
Automatická klasifikace vícejazyčných dokumentů
Ladislav HLOM
Detekce obsazenosti parkovacích míst pomocí algoritmu strojového učení bez učitele
Václav Bilský
Detekce hlasivkových pulsů v řečovém signálu pomocí strojového učení
Michal VRAŠTIL
Tvorba korpusu novinových titulků a jeho analýza
Pavlína Sedlářová