RNDr. Jan Rygl

Bachelor's thesis

Automatická extrakce informací z e-mailové korespondence pro češtinu

Automatic Information Extraction from Czech E-mail Correspondence
Anotácia:
Vycházíme z postupů extrakce časových informací a automatické klasifikace e-mailových zpráv již zavedených pro angličtinu. Námi navržené algoritmy jsou přizpůsobeny češtině a přináší několik podstatných vylepšení. V oblasti klasifikace zpráv pomocí tématických štítků práce kombinuje naivní Bayesův klasifikátor, morfologický analyzátor Ajka, časté n-gramy v korespondenci a regulární výrazy. Přínosem …viac
Abstract:
We study automatic information extraction algorithms and automatic classification of e-mail correspondence algorithms used for English. Our proposed algorithms are adapted to Czech language and offers several significant improvements. In the field of classification by using the thematic labels our work combines the Bayesian naive classifier, the morphological analyzer Ajka, frequent n-grams in the …viac
 
 
Jazyk práce: Czech
Datum vytvoření / odevzdání či podání práce: 25. 5. 2009

Obhajoba závěrečné práce

  • Obhajoba proběhla 23. 6. 2009
  • Vedúci: doc. RNDr. Aleš Horák, Ph.D.
  • Oponent: RNDr. Vojtěch Kovář, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masaryk University

Faculty of Informatics

Bachelor programme / odbor:
Informatics / Informatics