Bc. Jan Bušta

Master's thesis

Automatická extrakce slovesných idiomů z korpusu

Automatic retrieval of varbal idioms from corpora
Abstract:
Práce se zabývá porovnáním algoritmů pro automatickou extrakci idiomatických frází z korpusu, zkoumá různé přístupy pro řešení problému a do českého jazykového prostředí implementuje algoritmus A. Fazlyho a S. Stevensonové, který se zakládá na lexikální a syntaktické pevnosti vazeb v idiomech, které jsou tvořeny tranzitivním slovesem a jeho přímým předmětem.
Abstract:
This thesis describes comparison of algorithms for automatic extraction of idiomatic phrases from corpora, compare different approaches and implementing the algorithm of A. Fazly and S. Stevenson into Czech language environment. This algorithm is based on lexical and syntactical fixedness of binding in idioms, which are composed from transitive verb its direct object.
 
 
Language used: Czech
Date on which the thesis was submitted / produced: 9. 1. 2012

Thesis defence

  • Date of defence: 7. 2. 2012
  • Supervisor: RNDr. Miloš Jakubíček, Ph.D.
  • Reader: doc. Mgr. Pavel Rychlý, Ph.D.

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky