RNDr. Jan Rygl

Bachelor's thesis

Automatická extrakce informací z e-mailové korespondence pro češtinu

Automatic Information Extraction from Czech E-mail Correspondence
Abstract:
Vycházíme z postupů extrakce časových informací a automatické klasifikace e-mailových zpráv již zavedených pro angličtinu. Námi navržené algoritmy jsou přizpůsobeny češtině a přináší několik podstatných vylepšení. V oblasti klasifikace zpráv pomocí tématických štítků práce kombinuje naivní Bayesův klasifikátor, morfologický analyzátor Ajka, časté n-gramy v korespondenci a regulární výrazy. Přínosem …more
Abstract:
We study automatic information extraction algorithms and automatic classification of e-mail correspondence algorithms used for English. Our proposed algorithms are adapted to Czech language and offers several significant improvements. In the field of classification by using the thematic labels our work combines the Bayesian naive classifier, the morphological analyzer Ajka, frequent n-grams in the …more
 
 
Language used: Czech
Date on which the thesis was submitted / produced: 25. 5. 2009

Thesis defence

  • Date of defence: 23. 6. 2009
  • Supervisor: doc. RNDr. Aleš Horák, Ph.D.
  • Reader: RNDr. Vojtěch Kovář, Ph.D.

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky

Masaryk University

Faculty of Informatics

Bachelor programme / field:
Informatics / Informatics