Bc. Veronika ČERNÁ

Bakalářská práce

Automatická klasifikace textových dokumentů

Automatic Text Document Classification
Anotace:
Tato práce se zabývá automatickou klasifikací textových dokumentů, jejímž cílem je přiřadit dokumentům kategorii z nějaké předdefinované množiny kategorií. Pro experimenty byly vybrány tři známé klasifikační techniky: naivní Bayesův klasifikátor, support vector machines a maximální entropie. K předzpracování dat byly použity lemmatizátor a POS-tagger a na základě různých kritérií pro výběr příznaků …více
Abstract:
This work deals with automatic text document classification. Text classification is a process of labelling documents with thematic categories from a predefined set of categories. Three known classification techniques were chosen for experiments in this work: naive Bayes, support vector machines and maximum entropy. A lemmatizer and a POS-tagger were used for the text pre-processing. Four sets of documents …více
 
 
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 11. 5. 2012
Zveřejnit od: 11. 5. 2012

Obhajoba závěrečné práce

  • Vedoucí: Ing. Pavel Král, Ph.D.

Citační záznam

Jak správně citovat práci

ČERNÁ, Veronika. Automatická klasifikace textových dokumentů. Plzeň, 2012. bakalářská práce (Bc.). ZÁPADOČESKÁ UNIVERZITA V PLZNI. Fakulta aplikovaných věd

Plný text práce

Právo: Autor si přeje zpřístupnit práci veřejnosti od 11.5.2012

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • Soubory jsou od 11. 5. 2012 dostupné: světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: ZÁPADOČESKÁ UNIVERZITA V PLZNI, Fakulta aplikovaných věd