Automatická klasifikace textových dokumentů – Bc. Veronika ČERNÁ
Bc. Veronika ČERNÁ
Bakalářská práce
Automatická klasifikace textových dokumentů
Automatic Text Document Classification
Anotace:
Tato práce se zabývá automatickou klasifikací textových dokumentů, jejímž cílem je přiřadit dokumentům kategorii z nějaké předdefinované množiny kategorií. Pro experimenty byly vybrány tři známé klasifikační techniky: naivní Bayesův klasifikátor, support vector machines a maximální entropie. K předzpracování dat byly použity lemmatizátor a POS-tagger a na základě různých kritérií pro výběr příznaků …víceAbstract:
This work deals with automatic text document classification. Text classification is a process of labelling documents with thematic categories from a predefined set of categories. Three known classification techniques were chosen for experiments in this work: naive Bayes, support vector machines and maximum entropy. A lemmatizer and a POS-tagger were used for the text pre-processing. Four sets of documents …více
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 11. 5. 2012
Zveřejnit od: 11. 5. 2012
Obhajoba závěrečné práce
- Vedoucí: Ing. Pavel Král, Ph.D.
Citační záznam
Jak správně citovat práci
ČERNÁ, Veronika. Automatická klasifikace textových dokumentů. Plzeň, 2012. bakalářská práce (Bc.). ZÁPADOČESKÁ UNIVERZITA V PLZNI. Fakulta aplikovaných věd
Plný text práce
Právo: Autor si přeje zpřístupnit práci veřejnosti od 11.5.2012
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- Soubory jsou od 11. 5. 2012 dostupné: světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: ZÁPADOČESKÁ UNIVERZITA V PLZNI, Fakulta aplikovaných vědZÁPADOČESKÁ UNIVERZITA V PLZNI
Fakulta aplikovaných vědBakalářský studijní program / obor:
Inženýrská informatika / Informatika
Práce na příbuzné téma
-
Support vector machines a evoluční algoritmy
Martin Ševčík -
Support vector machines: teorie, aplikace a softwarové implementace
Daniil Podtesov -
Rozpoznávání ručně psaných číslic pomocí support vector machines
Jozef Hricko -
Support vector machines for credit scoring
Michal Haltuf -
Automatická klasifikace vícejazyčných dokumentů
Ladislav HLOM -
Automatická klasifikace dokumentů s podobným obsahem
Michal HRALA -
Topologická entropie subshiftů
Lukáš Václavík -
Entropie ve vztahu k iniciaci/průběhu stresové reakce a její souvislost s transgeneračním přenosem informace
Filip Zlámal