Jak kvalita lemmatizace ovlivňuje výsledky vyhledávání dokumentů v českém jazyce – Petr Pytelka
Petr Pytelka
Diplomová práce
Jak kvalita lemmatizace ovlivňuje výsledky vyhledávání dokumentů v českém jazyce
Effect of the Czech Stemming Algorithm on the Document Retrieval
Anotace:
Cílem práce je měření kvality lemmatizace pro český jazyk v systémech zpracování doku-mentů a analýza výsledků tohoto měření. V teoretické části práce je popsán princip plno-textového vyhledávání, možnosti realizace lemmatizace a běžné problémy, které je nutné řešit při zpracování přirozeného jazyka. V práci jsou diskutovány možnosti hodnocení kva-lity lemmatizace pomocí měření přesnosti a úplnosti …víceAbstract:
This thesis deals with the measurement of the quality of the stemming/lemmatization algo-rithm for the Czech language in document processing systems and provides an analysis of the results. The theoretical part of the thesis describes the principles of the full-text search, the possibilities of implementation as well as the common problems which have to be solved in connection with the processing of …více
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 17. 5. 2012
Identifikátor:
http://www.vse.cz/vskp/eid/34929
Obhajoba závěrečné práce
- Obhajoba proběhla 6. 2. 2013
- Vedoucí: Petr Strossa
- Oponent: Otakar Pinkas
Citační záznam
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- autentizovaným zaměstnancům ze stejné školy/fakulty
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Vysoká škola ekonomická v Prazehttp://www.vse.cz/vskp/eid/34929
Vysoká škola ekonomická v Praze
Magisterský studijní program / obor:
Aplikovaná informatika / Informační systémy a technologie