Bc. Jiří Kletečka
Bachelor's thesis
Chybový korpus z Wikipedie
Wikipedia Learner's Corpus
Anotácia:
Tato bakalářská práce se zabývá automatizovanou tvorbou chybového korpusu z historie článků na Wikipedii. Takový korpus obsahuje nejnovější verze článků s anotacemi chyb získanými z historie jednotlivých editací. Pro tento účel byl navrhnut a naprogramován nástroj, který byl dále použit při tvorbě chybového korpusu z české jazykové mutace Wikipedie. Výsledný korpus byl umístěn na fakultní server a …viacAbstract:
This bachelor's thesis deals with an automated creation of error-annotated corpus from Wikipedia history of articles. Such corpus contains the newest versions of articles with marked errors obtained from their editing history. For that reason, a new tool was designed and implemented. After implementation, it was used in the process of corpus creation using Czech Wikipedia database dump and this corpus …viac
Jazyk práce: English
Datum vytvoření / odevzdání či podání práce: 25. 5. 2017
Identifikátor:
https://is.muni.cz/th/bssy6/
Obhajoba závěrečné práce
- Obhajoba proběhla 27. 6. 2017
- Vedúci: Mgr. et Mgr. Vít Baisa, Ph.D.
- Oponent: RNDr. Vít Suchomel
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsBachelor programme / odbor:
Applied Informatics / Applied Informatics
Práce na příbuzné téma
-
Parallel Corpus from Wikipedia
Adéla Štromajerová -
Common Translation Errors in Wikipedia Articles: A Corpus-based Study
Adéla Štromajerová