Textové korpusy ze závěrečných prací – Bc. Martin Šmíd
Bc. Martin Šmíd
Bachelor's thesis
Textové korpusy ze závěrečných prací
Text corpora from theses
Anotácia:
Cílem práce je vytvořit nástroj pro stahování závěrečných prací z Informačního systému a vybudovat z nich textové korpusy. První část práce přibližuje korpusovou lingvistiku a využití jazykových korpusů. Následuje popis problematiky rozpoznání jazyka, která je důležitá pro odfiltrování nežádoucích textů. Ve třetí části je popsána implementace navrženého programu.Abstract:
The aim of this bachelor thesis is to create a tool for downloading students theses from the Information system and to build text corpora. The corpus linguistics field is described in the first part of this thesis. After that a description of a language identification follows, which is important for filtering unwanted texts. In the third part the description of the tool implementation is given.
Jazyk práce: Czech
Datum vytvoření / odevzdání či podání práce: 19. 5. 2016
Identifikátor:
https://is.muni.cz/th/anxmd/
Obhajoba závěrečné práce
- Obhajoba proběhla 23. 6. 2016
- Vedúci: Mgr. et Mgr. Vít Baisa, Ph.D.
- Oponent: RNDr. Vít Suchomel
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsBachelor programme / odbor:
Informatics / Artificial Intelligence and Natural Language Processing
Práce na příbuzné téma
-
Identifikace sporného autorství ve forenzní lingvistice
Battseren BATERDENE -
Translating (Ir)reversible Binomials: A Corpus Study
Tomáš Herlík -
Dummy subjects in English, Norwegian and German. A parallel corpus study.
Bohumila Chocholoušová -
Parallel Corpus from Wikipedia
Adéla Štromajerová -
Dummy subjects in English, Norwegian and German. A parallel corpus study.
Bohumila Chocholoušová -
Parallel Corpus in Sketch Engine: Creation and Data Mining
Magdaléna VYVIJALOVÁ -
Common Translation Errors in Wikipedia Articles: A Corpus-based Study
Adéla Štromajerová -
A hybrid approach to parallel text alignment
Adam Obrusník