Bc. Jan Vaňáček

Master's thesis

Tvorba mluveného korpusu

Speech corpus building
Abstract:
Cílem práce je oblast mluvených korpusů pro menší jazyky (tzv. less-studied languages). Práce se zabývá současným stavem v oblasti budování korpusů pro tyto jazyky z pohledu počítačového zpracování přirozeného jazyka (NLP). Práce se zaměřuje na specifika při tvorbě korpusů s ohledem na práci v méně rozvinutých oblastech. A také na postupy, které mají zaručit získání kvalitních nahrávek, počínaje od …more
Abstract:
The goal of the thesis is an area of speech corpora for the less-studied languages. The work deals with the current state in building of corpora for these languages from the perspective of natural language processing (NLP). The work focuses on the specifics in creating corpora with regard to work in less developed areas. And it focuses also on some procedures to guarantee the acquisition of high-quality …more
 
 
Language used: Czech
Date on which the thesis was submitted / produced: 19. 12. 2011

Thesis defence

  • Date of defence: 8. 2. 2012
  • Supervisor: Mgr. Marek Grác, Ph.D.
  • Reader: Mgr. Dana Hlaváčková, Ph.D.

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky