Bc. Veronika ČERNÁ

Bachelor's thesis

Automatická klasifikace textových dokumentů

Automatic Text Document Classification
Abstract:
Tato práce se zabývá automatickou klasifikací textových dokumentů, jejímž cílem je přiřadit dokumentům kategorii z nějaké předdefinované množiny kategorií. Pro experimenty byly vybrány tři známé klasifikační techniky: naivní Bayesův klasifikátor, support vector machines a maximální entropie. K předzpracování dat byly použity lemmatizátor a POS-tagger a na základě různých kritérií pro výběr příznaků …more
Abstract:
This work deals with automatic text document classification. Text classification is a process of labelling documents with thematic categories from a predefined set of categories. Three known classification techniques were chosen for experiments in this work: naive Bayes, support vector machines and maximum entropy. A lemmatizer and a POS-tagger were used for the text pre-processing. Four sets of documents …more
 
 
Language used: Czech
Date on which the thesis was submitted / produced: 11. 5. 2012
Accessible from:: 11. 5. 2012

Thesis defence

  • Supervisor: Ing. Pavel Král, Ph.D.

Citation record

The right form of listing the thesis as a source quoted

ČERNÁ, Veronika. Automatická klasifikace textových dokumentů. Plzeň, 2012. bakalářská práce (Bc.). ZÁPADOČESKÁ UNIVERZITA V PLZNI. Fakulta aplikovaných věd

Full text of thesis

Accessibility: Autor si přeje zpřístupnit práci veřejnosti od 11.5.2012

Contents of on-line thesis archive
Published in Theses:
  • Soubory jsou od 11. 5. 2012 dostupné: světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: ZÁPADOČESKÁ UNIVERZITA V PLZNI, Fakulta aplikovaných věd