Mgr. Jan Bušta

Bachelor's thesis

Výpočet četností výskytů hesel SČFI v korpusu

Computing Frequency of Headwords in Text Corpus
Abstract:
Práce popisuje hledání idiomů ze Slovníku české frazeologie a idiomatiky, z částí Výrazy slovesné a Výrazy neslovesné. Idiomy jsou fráze, jejichž struktura je navzájem rozdílná. Tomu se muselo přizpůsobit i jejich vyhledávání, aby byl pokryt co možná největší počet výskytů idiomů a nebyla zanesena chyba. K vyhledávání slovesných a neslovesných frází byl vytvořen dotaz, pomocí kterého je dotazován korpus …more
Abstract:
This thesis describes searching the idioms from the dictionary of Czech idioms which includes verb-based and non-verb-based phrases. Idioms are phrases which structure is very different. This influences the searching of them to find as much idioms as possible but with keeping the error-rate. To find the verb-basedas well as the non-verb-based phrases was created a general query. The application of …more
 
 
Language used: Czech
Date on which the thesis was submitted / produced: 5. 1. 2009

Thesis defence

  • Date of defence: 5. 2. 2009
  • Supervisor: doc. Mgr. Pavel Rychlý, Ph.D.
  • Reader: Mgr. Václav Němčík

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky