Bc. Martin Šmíd

Bachelor's thesis

Textové korpusy ze závěrečných prací

Text corpora from theses
Anotácia:
Cílem práce je vytvořit nástroj pro stahování závěrečných prací z Informačního systému a vybudovat z nich textové korpusy. První část práce přibližuje korpusovou lingvistiku a využití jazykových korpusů. Následuje popis problematiky rozpoznání jazyka, která je důležitá pro odfiltrování nežádoucích textů. Ve třetí části je popsána implementace navrženého programu.
Abstract:
The aim of this bachelor thesis is to create a tool for downloading students theses from the Information system and to build text corpora. The corpus linguistics field is described in the first part of this thesis. After that a description of a language identification follows, which is important for filtering unwanted texts. In the third part the description of the tool implementation is given.
 
 
Jazyk práce: Czech
Datum vytvoření / odevzdání či podání práce: 19. 5. 2016

Obhajoba závěrečné práce

  • Obhajoba proběhla 23. 6. 2016
  • Vedúci: Mgr. et Mgr. Vít Baisa, Ph.D.
  • Oponent: RNDr. Vít Suchomel

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masaryk University

Faculty of Informatics

Bachelor programme / odbor:
Informatics / Artificial Intelligence and Natural Language Processing