Petr Pytelka

Diplomová práce

Jak kvalita lemmatizace ovlivňuje výsledky vyhledávání dokumentů v českém jazyce

Effect of the Czech Stemming Algorithm on the Document Retrieval
Anotace:
Cílem práce je měření kvality lemmatizace pro český jazyk v systémech zpracování doku-mentů a analýza výsledků tohoto měření. V teoretické části práce je popsán princip plno-textového vyhledávání, možnosti realizace lemmatizace a běžné problémy, které je nutné řešit při zpracování přirozeného jazyka. V práci jsou diskutovány možnosti hodnocení kva-lity lemmatizace pomocí měření přesnosti a úplnosti …více
Abstract:
This thesis deals with the measurement of the quality of the stemming/lemmatization algo-rithm for the Czech language in document processing systems and provides an analysis of the results. The theoretical part of the thesis describes the principles of the full-text search, the possibilities of implementation as well as the common problems which have to be solved in connection with the processing of …více
 
 
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 17. 5. 2012

Obhajoba závěrečné práce

  • Obhajoba proběhla 6. 2. 2013
  • Vedoucí: Petr Strossa
  • Oponent: Otakar Pinkas

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • autentizovaným zaměstnancům ze stejné školy/fakulty
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Vysoká škola ekonomická v Praze
http://www.vse.cz/vskp/eid/34929

Vysoká škola ekonomická v Praze

Magisterský studijní program / obor:
Aplikovaná informatika / Informační systémy a technologie

Práce na příbuzné téma