Continuous automatic development of European parliamentary corpora – Bc. Ota Mikušek
Bc. Ota Mikušek
Bakalářská práce
Continuous automatic development of European parliamentary corpora
Continuous automatic development of European parliamentary corpora
Anotace:
Tato práce poskytuje nástroje pro průběžné a automatické vytváření korpusů ze stenoprotokolů parlamentů členských států EU. Nástroje zpracovávají 22 členských států EU a jejich 30 parlamentních komor. V současnosti se jedná o první sadu nástrojů tohoto rozsahu. Ačkoli z parlamentních dat již bylo vytvořeno mnoho korpusů, tyto nástroje se zabývají otázkou možnosti kontinuálního shromažďování a vytváření …víceAbstract:
This thesis provides tools for continuous and automatic development of corpora from European parliamentary protocols. The toolchain covers 22 EU member states and their 30 parliamentary chambers. It is the first set of tools of this scope to this day. While many corpora have already been built from parliamentary data, this set of tools addresses the issue of being able to collect and build such corpora …více
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 18. 5. 2023
Identifikátor:
https://is.muni.cz/th/ub78x/
Obhajoba závěrečné práce
- Obhajoba proběhla 26. 6. 2023
- Vedoucí: RNDr. Miloš Jakubíček, Ph.D.
- Oponent: RNDr. Vít Suchomel, Ph.D.
Citační záznam
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasarykova univerzita
Fakulta informatikyBakalářský studijní program / obor:
Informatika / Informatika
Práce na příbuzné téma
-
Corpus Processing for Foreign Language Learning
Daniil Khudiakov