Značkování nečeských tokenů v korpusech – Bc. Zuzana Pelikánová
Bc. Zuzana Pelikánová
Master's thesis
Značkování nečeských tokenů v korpusech
Annotation of foreign material in corpora
Anotácia:
Magisterská diplomová práce se zabývá současnými problémy při značkování mezijazykových homograf, cizojazyčných proprií a anglických slov ve webových korpusech. Cílem bylo vytvořit subkorpus problematicky značkovaných mezijazykových homograf, anotovat jej pomocí nově vznikajících nástrojů a zhodnotit jejich úspěšnost.Abstract:
This diploma thesis deals with current issues in morphological tagging of interlingual homographs, foreign proper nouns and other English tokens occurring in Czech web corpora. The main purpose is to present a subcorpus of English collocations containing interlingual homographs, which are presently incorrectly tagged as Czech words, retagging this subcorpus with several newly developed solutions and …viac
Jazyk práce: Czech
Datum vytvoření / odevzdání či podání práce: 17. 5. 2018
Identifikátor:
https://is.muni.cz/th/nmfdn/
Obhajoba závěrečné práce
- Obhajoba proběhla 8. 6. 2018
- Vedúci: RNDr. Zuzana Nevěřilová, Ph.D.
- Oponent: RNDr. Adam Rambousek, Ph.D.
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Filozofická fakultaMasaryk University
Faculty of ArtsMaster programme / odbor:
Philology / Czech Language with Orientation on Computational Linguistics
Práce na příbuzné téma
-
Pneumatický mechanismus přítlaku značkovače hadic
Andrzej Zemene -
RapCor Support
Michal Hala