Bc. Zuzana Pelikánová

Diplomová práce

Značkování nečeských tokenů v korpusech

Annotation of foreign material in corpora
Anotace:
Magisterská diplomová práce se zabývá současnými problémy při značkování mezijazykových homograf, cizojazyčných proprií a anglických slov ve webových korpusech. Cílem bylo vytvořit subkorpus problematicky značkovaných mezijazykových homograf, anotovat jej pomocí nově vznikajících nástrojů a zhodnotit jejich úspěšnost.
Abstract:
This diploma thesis deals with current issues in morphological tagging of interlingual homographs, foreign proper nouns and other English tokens occurring in Czech web corpora. The main purpose is to present a subcorpus of English collocations containing interlingual homographs, which are presently incorrectly tagged as Czech words, retagging this subcorpus with several newly developed solutions and …více
 
 
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 17. 5. 2018

Obhajoba závěrečné práce

  • Obhajoba proběhla 8. 6. 2018
  • Vedoucí: RNDr. Zuzana Nevěřilová, Ph.D.
  • Oponent: RNDr. Adam Rambousek, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Filozofická fakulta

Masarykova univerzita

Filozofická fakulta

Magisterský studijní program / obor:
Filologie / Český jazyk se specializací počítačová lingvistika

Práce na příbuzné téma