Bc. Martin Šmíd

Bakalářská práce

Textové korpusy ze závěrečných prací

Text corpora from theses
Anotace:
Cílem práce je vytvořit nástroj pro stahování závěrečných prací z Informačního systému a vybudovat z nich textové korpusy. První část práce přibližuje korpusovou lingvistiku a využití jazykových korpusů. Následuje popis problematiky rozpoznání jazyka, která je důležitá pro odfiltrování nežádoucích textů. Ve třetí části je popsána implementace navrženého programu.
Abstract:
The aim of this bachelor thesis is to create a tool for downloading students theses from the Information system and to build text corpora. The corpus linguistics field is described in the first part of this thesis. After that a description of a language identification follows, which is important for filtering unwanted texts. In the third part the description of the tool implementation is given.
 
 
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 19. 5. 2016

Obhajoba závěrečné práce

  • Obhajoba proběhla 23. 6. 2016
  • Vedoucí: Mgr. et Mgr. Vít Baisa, Ph.D.
  • Oponent: RNDr. Vít Suchomel

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masarykova univerzita

Fakulta informatiky

Bakalářský studijní program / obor:
Informatika / Umělá inteligence a zpracování přirozeného jazyka