Bc. Jiří Kletečka

Bakalářská práce

Chybový korpus z Wikipedie

Wikipedia Learner's Corpus
Anotace:
Tato bakalářská práce se zabývá automatizovanou tvorbou chybového korpusu z historie článků na Wikipedii. Takový korpus obsahuje nejnovější verze článků s anotacemi chyb získanými z historie jednotlivých editací. Pro tento účel byl navrhnut a naprogramován nástroj, který byl dále použit při tvorbě chybového korpusu z české jazykové mutace Wikipedie. Výsledný korpus byl umístěn na fakultní server a …více
Abstract:
This bachelor's thesis deals with an automated creation of error-annotated corpus from Wikipedia history of articles. Such corpus contains the newest versions of articles with marked errors obtained from their editing history. For that reason, a new tool was designed and implemented. After implementation, it was used in the process of corpus creation using Czech Wikipedia database dump and this corpus …více
 
 
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 25. 5. 2017

Obhajoba závěrečné práce

  • Obhajoba proběhla 27. 6. 2017
  • Vedoucí: Mgr. et Mgr. Vít Baisa, Ph.D.
  • Oponent: RNDr. Vít Suchomel

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masarykova univerzita

Fakulta informatiky

Bakalářský studijní program / obor:
Aplikovaná informatika / Aplikovaná informatika

Práce na příbuzné téma