Značkování nečeských tokenů v korpusech – Bc. Zuzana Pelikánová
Bc. Zuzana Pelikánová
Diplomová práce
Značkování nečeských tokenů v korpusech
Annotation of foreign material in corpora
Anotace:
Magisterská diplomová práce se zabývá současnými problémy při značkování mezijazykových homograf, cizojazyčných proprií a anglických slov ve webových korpusech. Cílem bylo vytvořit subkorpus problematicky značkovaných mezijazykových homograf, anotovat jej pomocí nově vznikajících nástrojů a zhodnotit jejich úspěšnost.Abstract:
This diploma thesis deals with current issues in morphological tagging of interlingual homographs, foreign proper nouns and other English tokens occurring in Czech web corpora. The main purpose is to present a subcorpus of English collocations containing interlingual homographs, which are presently incorrectly tagged as Czech words, retagging this subcorpus with several newly developed solutions and …více
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 17. 5. 2018
Identifikátor:
https://is.muni.cz/th/nmfdn/
Obhajoba závěrečné práce
- Obhajoba proběhla 8. 6. 2018
- Vedoucí: RNDr. Zuzana Nevěřilová, Ph.D.
- Oponent: RNDr. Adam Rambousek, Ph.D.
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Filozofická fakultaMasarykova univerzita
Filozofická fakultaMagisterský studijní program / obor:
Filologie / Český jazyk se specializací počítačová lingvistika
Práce na příbuzné téma
-
Pneumatický mechanismus přítlaku značkovače hadic
Andrzej Zemene -
RapCor Support
Michal Hala