Jak kvalita lemmatizace ovlivňuje výsledky vyhledávání dokumentů v českém jazyce – Petr Pytelka
Petr Pytelka
Master's thesis
Jak kvalita lemmatizace ovlivňuje výsledky vyhledávání dokumentů v českém jazyce
Effect of the Czech Stemming Algorithm on the Document Retrieval
Abstract:
Cílem práce je měření kvality lemmatizace pro český jazyk v systémech zpracování doku-mentů a analýza výsledků tohoto měření. V teoretické části práce je popsán princip plno-textového vyhledávání, možnosti realizace lemmatizace a běžné problémy, které je nutné řešit při zpracování přirozeného jazyka. V práci jsou diskutovány možnosti hodnocení kva-lity lemmatizace pomocí měření přesnosti a úplnosti …moreAbstract:
This thesis deals with the measurement of the quality of the stemming/lemmatization algo-rithm for the Czech language in document processing systems and provides an analysis of the results. The theoretical part of the thesis describes the principles of the full-text search, the possibilities of implementation as well as the common problems which have to be solved in connection with the processing of …more
Language used: Czech
Date on which the thesis was submitted / produced: 17. 5. 2012
Identifier:
http://www.vse.cz/vskp/eid/34929
Thesis defence
- Date of defence: 6. 2. 2013
- Supervisor: Petr Strossa
- Reader: Otakar Pinkas
Citation record
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- autentizovaným zaměstnancům ze stejné školy/fakulty
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Vysoká škola ekonomická v Prazehttp://www.vse.cz/vskp/eid/34929
Vysoká škola ekonomická v Praze
Master programme / field:
Aplikovaná informatika / Informační systémy a technologie