Automatická extrakce informací z e-mailové korespondence pro češtinu – RNDr. Jan Rygl
RNDr. Jan Rygl
Bachelor's thesis
Automatická extrakce informací z e-mailové korespondence pro češtinu
Automatic Information Extraction from Czech E-mail Correspondence
Abstract:
Vycházíme z postupů extrakce časových informací a automatické klasifikace e-mailových zpráv již zavedených pro angličtinu. Námi navržené algoritmy jsou přizpůsobeny češtině a přináší několik podstatných vylepšení. V oblasti klasifikace zpráv pomocí tématických štítků práce kombinuje naivní Bayesův klasifikátor, morfologický analyzátor Ajka, časté n-gramy v korespondenci a regulární výrazy. Přínosem …moreAbstract:
We study automatic information extraction algorithms and automatic classification of e-mail correspondence algorithms used for English. Our proposed algorithms are adapted to Czech language and offers several significant improvements. In the field of classification by using the thematic labels our work combines the Bayesian naive classifier, the morphological analyzer Ajka, frequent n-grams in the …more
Language used: Czech
Date on which the thesis was submitted / produced: 25. 5. 2009
Identifier:
https://is.muni.cz/th/ypo62/
Thesis defence
- Date of defence: 23. 6. 2009
- Supervisor: doc. RNDr. Aleš Horák, Ph.D.
- Reader: RNDr. Vojtěch Kovář, Ph.D.
Citation record
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsBachelor programme / field:
Informatics / Informatics