Klasifikace dokumentů v textových korpusech

Suchomel, Vít

CS ENPrihlásiť sa Prihlásiť sa (EduID)

Theses buir8w

Klasifikace dokumentů v textových korpusech – Bc. Vít Suchomel

Zpět na vyhledávání

Bc. Vít Suchomel

Master's thesis

Klasifikace dokumentů v textových korpusech

Document classification in text corpora

Anotácia:

Diplomová práce má dva základní cíle. Prvním cílem je vytvoření „modelového korpusu“ webových textů o velikosti 100 milionů slov. Korpus bude vhodně složen z různých typů textů (např. novinové články, blogy, volně dostupná próza) zastoupených v přesně stanovených množstvích. Druhým cílem práce je vytvoření klasifikátoru jednotlivých typů textů pomocí metod strojového učení. Student se seznámí s několika …viac

Abstract:

There are two aims of this diploma thesis. The first objective is to create a "model corpus" of web texts containing 100 million words. The corpus has to be consisted of several types of texts (e. g. newspaper articles, blogs, prose available online) in strictly defined quantities. The second objective of the thesis is to create a classifier of the respective text types using machine learning methods …viac

Kľúčové slová

Klasifikace dokumentů strojové učení korpus klasifikace klasifikátor SVM předzpracování

Jazyk práce: Czech

Datum vytvoření / odevzdání či podání práce: 11. 1. 2010

Identifikátor: https://is.muni.cz/th/wv40x/

Obhajoba závěrečné práce

Obhajoba proběhla 10. 2. 2010
Vedúci: RNDr. Jan Pomikálek, Ph.D.

Citační záznam

Citovat tuto práci

Citace dle ISO 690:

SUCHOMEL, Vít. \textit{Klasifikace dokumentů v textových korpusech}. Online. Diplomová práca. Brno: Masarykova univerzita, Faculty of Informatics. 2010. Dostupné z: https://theses.cz/id/buir8w/.

{{Citace kvalifikační práce
 | příjmení = Suchomel
 | jméno = Vít
 | instituce = Masarykova univerzita, Faculty of Informatics
 | titul = Klasifikace dokumentů v textových korpusech
 | url = https://theses.cz/id/buir8w/
 | typ práce = Diplomová práca
 | vedoucí = RNDr. Jan Pomikálek, Ph.D.
 | rok = 2010
 | počet stran =
 | strany =
 | citace = 2024-05-15
 | poznámka =
 | jazyk = 
}}

Plný text práce

Obsah online archivu závěrečné práce

Zveřejněno v Theses:

světu

Jak jinak získat přístup k textu

Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Odkaz na adresář do lokálního úložiště instituce

Masaryk University

Faculty of Informatics

Master programme / odbor:
Informatics / Artificial Intelligence and Natural Language Processing

Práce na příbuzné téma

Klasifikace dokumentů s částečnou informací od učitele
Ondřej MACEK
Automatická klasifikace vícejazyčných dokumentů
Ladislav HLOM
Detekce obsazenosti parkovacích míst pomocí algoritmu strojového učení bez učitele
Václav Bilský
Detekce hlasivkových pulsů v řečovém signálu pomocí strojového učení
Michal VRAŠTIL
Tvorba korpusu novinových titulků a jeho analýza
Pavlína Sedlářová