Bc. Jiří Kletečka
Bakalářská práce
Chybový korpus z Wikipedie
Wikipedia Learner's Corpus
Anotace:
Tato bakalářská práce se zabývá automatizovanou tvorbou chybového korpusu z historie článků na Wikipedii. Takový korpus obsahuje nejnovější verze článků s anotacemi chyb získanými z historie jednotlivých editací. Pro tento účel byl navrhnut a naprogramován nástroj, který byl dále použit při tvorbě chybového korpusu z české jazykové mutace Wikipedie. Výsledný korpus byl umístěn na fakultní server a …víceAbstract:
This bachelor's thesis deals with an automated creation of error-annotated corpus from Wikipedia history of articles. Such corpus contains the newest versions of articles with marked errors obtained from their editing history. For that reason, a new tool was designed and implemented. After implementation, it was used in the process of corpus creation using Czech Wikipedia database dump and this corpus …více
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 25. 5. 2017
Identifikátor:
https://is.muni.cz/th/bssy6/
Obhajoba závěrečné práce
- Obhajoba proběhla 27. 6. 2017
- Vedoucí: Mgr. et Mgr. Vít Baisa, Ph.D.
- Oponent: RNDr. Vít Suchomel
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasarykova univerzita
Fakulta informatikyBakalářský studijní program / obor:
Aplikovaná informatika / Aplikovaná informatika
Práce na příbuzné téma
-
Parallel Corpus from Wikipedia
Adéla Štromajerová -
Common Translation Errors in Wikipedia Articles: A Corpus-based Study
Adéla Štromajerová