Bc. Jiří Kletečka

Bachelor's thesis

Chybový korpus z Wikipedie

Wikipedia Learner's Corpus
Abstract:
Tato bakalářská práce se zabývá automatizovanou tvorbou chybového korpusu z historie článků na Wikipedii. Takový korpus obsahuje nejnovější verze článků s anotacemi chyb získanými z historie jednotlivých editací. Pro tento účel byl navrhnut a naprogramován nástroj, který byl dále použit při tvorbě chybového korpusu z české jazykové mutace Wikipedie. Výsledný korpus byl umístěn na fakultní server a …more
Abstract:
This bachelor's thesis deals with an automated creation of error-annotated corpus from Wikipedia history of articles. Such corpus contains the newest versions of articles with marked errors obtained from their editing history. For that reason, a new tool was designed and implemented. After implementation, it was used in the process of corpus creation using Czech Wikipedia database dump and this corpus …more
 
 
Language used: English
Date on which the thesis was submitted / produced: 25. 5. 2017

Thesis defence

  • Date of defence: 27. 6. 2017
  • Supervisor: Mgr. et Mgr. Vít Baisa, Ph.D.
  • Reader: RNDr. Vít Suchomel

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky

Masaryk University

Faculty of Informatics

Bachelor programme / field:
Applied Informatics / Applied Informatics

Theses on a related topic