Automatická klasifikace textových dokumentů – Bc. Veronika ČERNÁ
Bc. Veronika ČERNÁ
Bachelor's thesis
Automatická klasifikace textových dokumentů
Automatic Text Document Classification
Abstract:
Tato práce se zabývá automatickou klasifikací textových dokumentů, jejímž cílem je přiřadit dokumentům kategorii z nějaké předdefinované množiny kategorií. Pro experimenty byly vybrány tři známé klasifikační techniky: naivní Bayesův klasifikátor, support vector machines a maximální entropie. K předzpracování dat byly použity lemmatizátor a POS-tagger a na základě různých kritérií pro výběr příznaků …moreAbstract:
This work deals with automatic text document classification. Text classification is a process of labelling documents with thematic categories from a predefined set of categories. Three known classification techniques were chosen for experiments in this work: naive Bayes, support vector machines and maximum entropy. A lemmatizer and a POS-tagger were used for the text pre-processing. Four sets of documents …more
Language used: Czech
Date on which the thesis was submitted / produced: 11. 5. 2012
Accessible from:: 11. 5. 2012
Thesis defence
- Supervisor: Ing. Pavel Král, Ph.D.
Citation record
The right form of listing the thesis as a source quoted
ČERNÁ, Veronika. Automatická klasifikace textových dokumentů. Plzeň, 2012. bakalářská práce (Bc.). ZÁPADOČESKÁ UNIVERZITA V PLZNI. Fakulta aplikovaných věd
Full text of thesis
Accessibility: Autor si přeje zpřístupnit práci veřejnosti od 11.5.2012
Contents of on-line thesis archive
Published in Theses:- Soubory jsou od 11. 5. 2012 dostupné: světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: ZÁPADOČESKÁ UNIVERZITA V PLZNI, Fakulta aplikovaných vědUniversity of West Bohemia
Faculty of Applied SciencesBachelor programme / field:
Computer Science and Engineering / Information Technologies
Theses on a related topic
-
Support vector machines a evoluční algoritmy
Martin Ševčík -
Support vector machines: teorie, aplikace a softwarové implementace
Daniil Podtesov -
Rozpoznávání ručně psaných číslic pomocí support vector machines
Jozef Hricko -
Support vector machines for credit scoring
Michal Haltuf -
Automatická klasifikace vícejazyčných dokumentů
Ladislav HLOM -
Automatická klasifikace dokumentů s podobným obsahem
Michal HRALA -
Topologická entropie subshiftů
Lukáš Václavík -
Entropie ve vztahu k iniciaci/průběhu stresové reakce a její souvislost s transgeneračním přenosem informace
Filip Zlámal