Bc. Jiří Kletečka
Bachelor's thesis
Chybový korpus z Wikipedie
Wikipedia Learner's Corpus
Abstract:
Tato bakalářská práce se zabývá automatizovanou tvorbou chybového korpusu z historie článků na Wikipedii. Takový korpus obsahuje nejnovější verze článků s anotacemi chyb získanými z historie jednotlivých editací. Pro tento účel byl navrhnut a naprogramován nástroj, který byl dále použit při tvorbě chybového korpusu z české jazykové mutace Wikipedie. Výsledný korpus byl umístěn na fakultní server a …moreAbstract:
This bachelor's thesis deals with an automated creation of error-annotated corpus from Wikipedia history of articles. Such corpus contains the newest versions of articles with marked errors obtained from their editing history. For that reason, a new tool was designed and implemented. After implementation, it was used in the process of corpus creation using Czech Wikipedia database dump and this corpus …more
Language used: English
Date on which the thesis was submitted / produced: 25. 5. 2017
Identifier:
https://is.muni.cz/th/bssy6/
Thesis defence
- Date of defence: 27. 6. 2017
- Supervisor: Mgr. et Mgr. Vít Baisa, Ph.D.
- Reader: RNDr. Vít Suchomel
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsBachelor programme / field:
Applied Informatics / Applied Informatics
Theses on a related topic
-
Parallel Corpus from Wikipedia
Adéla Štromajerová -
Common Translation Errors in Wikipedia Articles: A Corpus-based Study
Adéla Štromajerová