Bc. Martin Šmíd
Bachelor's thesis
Textové korpusy ze závěrečných prací
Text corpora from theses
Abstract:
Cílem práce je vytvořit nástroj pro stahování závěrečných prací z Informačního systému a vybudovat z nich textové korpusy. První část práce přibližuje korpusovou lingvistiku a využití jazykových korpusů. Následuje popis problematiky rozpoznání jazyka, která je důležitá pro odfiltrování nežádoucích textů. Ve třetí části je popsána implementace navrženého programu.Abstract:
The aim of this bachelor thesis is to create a tool for downloading students theses from the Information system and to build text corpora. The corpus linguistics field is described in the first part of this thesis. After that a description of a language identification follows, which is important for filtering unwanted texts. In the third part the description of the tool implementation is given.
Language used: Czech
Date on which the thesis was submitted / produced: 19. 5. 2016
Identifier:
https://is.muni.cz/th/anxmd/
Thesis defence
- Date of defence: 23. 6. 2016
- Supervisor: Mgr. et Mgr. Vít Baisa, Ph.D.
- Reader: RNDr. Vít Suchomel
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsBachelor programme / field:
Informatics / Artificial Intelligence and Natural Language Processing
Theses on a related topic
-
Identifikace sporného autorství ve forenzní lingvistice
Battseren BATERDENE -
Translating (Ir)reversible Binomials: A Corpus Study
Tomáš Herlík -
Dummy subjects in English, Norwegian and German. A parallel corpus study.
Bohumila Chocholoušová -
Parallel Corpus from Wikipedia
Adéla Štromajerová -
Dummy subjects in English, Norwegian and German. A parallel corpus study.
Bohumila Chocholoušová -
Parallel Corpus in Sketch Engine: Creation and Data Mining
Magdaléna VYVIJALOVÁ -
Common Translation Errors in Wikipedia Articles: A Corpus-based Study
Adéla Štromajerová -
A hybrid approach to parallel text alignment
Adam Obrusník