Bc. Michal Cukr

Master's thesis

Český korpus příkladových vět

Czech corpus of example sentences
Abstract:
Cílem této práce bylo vytvoření českého textového korpusu příkladových vět pro speciální jazykově-výukové rozhraní SkELL. Jako zdroj textů jsme stáhli internetové domény a stránky zařazené do výběrových sklizní českého Webarchivu a dále českou Wikipedii včetně diskusí. Třetím zdrojem dat byla část korpusu novinek JSI. Stažené texty byly zpracovány nástroji pro korpusové zpracování a konečná textová …more
Abstract:
The purpose of this work was creating a Czech text corpus of sentence examples for a special language-learning interface SkELL. As source texts, we downloaded websites chosen for selective harvests by Czech Webarchiv and Czech Wikipedia including discussion. The third source is a part of JSI Newsfeed Corpus. Crawled texts were prepared by tools for corpus processing and the final text collection was …more
 
 
Language used: Czech
Date on which the thesis was submitted / produced: 22. 5. 2017

Thesis defence

  • Date of defence: 9. 6. 2017
  • Supervisor: Mgr. et Mgr. Vít Baisa, Ph.D.
  • Reader: RNDr. Zuzana Nevěřilová, Ph.D.

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Filozofická fakulta

Masaryk University

Faculty of Arts

Master programme / field:
Philology / Czech Language with Orientation on Computational Linguistics

Theses on a related topic