Textové korpusy ze závěrečných prací

Šmíd, Martin

CS ENPrihlásiť sa Prihlásiť sa (EduID)

Theses dq09ut

Textové korpusy ze závěrečných prací – Bc. Martin Šmíd

Zpět na vyhledávání

Bc. Martin Šmíd

Bachelor's thesis

Textové korpusy ze závěrečných prací

Text corpora from theses

Anotácia:

Cílem práce je vytvořit nástroj pro stahování závěrečných prací z Informačního systému a vybudovat z nich textové korpusy. První část práce přibližuje korpusovou lingvistiku a využití jazykových korpusů. Následuje popis problematiky rozpoznání jazyka, která je důležitá pro odfiltrování nežádoucích textů. Ve třetí části je popsána implementace navrženého programu.

Abstract:

The aim of this bachelor thesis is to create a tool for downloading students theses from the Information system and to build text corpora. The corpus linguistics field is described in the first part of this thesis. After that a description of a language identification follows, which is important for filtering unwanted texts. In the third part the description of the tool implementation is given.

Kľúčové slová

jazykový korpus paralelní korpus korpusová lingvistika identifikace jazyka závěrečné práce Sketch Engine Python corpus parallel corpus corpus linguistics language identification theses

Jazyk práce: Czech

Datum vytvoření / odevzdání či podání práce: 19. 5. 2016

Identifikátor: https://is.muni.cz/th/anxmd/

Obhajoba závěrečné práce

Obhajoba proběhla 23. 6. 2016
Vedúci: Mgr. et Mgr. Vít Baisa, Ph.D.
Oponent: RNDr. Vít Suchomel

Citační záznam

Citovat tuto práci

Citace dle ISO 690:

ŠMÍD, Martin. \textit{Textové korpusy ze závěrečných prací} Online. Bakalárska práca. Brno: Masarykova univerzita, Faculty of Informatics. 2016. Dostupné z: https://theses.cz/id/dq09ut/. [cit. 2024-04-19].

{{Citace kvalifikační práce
 | příjmení = Šmíd
 | jméno = Martin
 | instituce = Masarykova univerzita, Faculty of Informatics
 | titul = Textové korpusy ze závěrečných prací
 | url = https://theses.cz/id/dq09ut/
 | typ práce = Bakalárska práca
 | vedoucí = Mgr. et Mgr. Vít Baisa, Ph.D.
 | rok = 2016
 | počet stran =
 | strany =
 | citace = 2024-04-19
 | poznámka =
 | jazyk = 
}}

Plný text práce

Obsah online archivu závěrečné práce

Zveřejněno v Theses:

světu

Jak jinak získat přístup k textu

Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Odkaz na adresář do lokálního úložiště instituce

Masaryk University

Faculty of Informatics

Bachelor programme / odbor:
Informatics / Artificial Intelligence and Natural Language Processing

Práce na příbuzné téma

Identifikace sporného autorství ve forenzní lingvistice
Battseren BATERDENE
Translating (Ir)reversible Binomials: A Corpus Study
Tomáš Herlík
Dummy subjects in English, Norwegian and German. A parallel corpus study.
Bohumila Chocholoušová
Parallel Corpus from Wikipedia
Adéla Štromajerová
Dummy subjects in English, Norwegian and German. A parallel corpus study.
Bohumila Chocholoušová
Parallel Corpus in Sketch Engine: Creation and Data Mining
Magdaléna VYVIJALOVÁ
Common Translation Errors in Wikipedia Articles: A Corpus-based Study
Adéla Štromajerová
A hybrid approach to parallel text alignment
Adam Obrusník

Všechny práce