Bc. Zuzana Pelikánová

Master's thesis

Značkování nečeských tokenů v korpusech

Annotation of foreign material in corpora
Anotácia:
Magisterská diplomová práce se zabývá současnými problémy při značkování mezijazykových homograf, cizojazyčných proprií a anglických slov ve webových korpusech. Cílem bylo vytvořit subkorpus problematicky značkovaných mezijazykových homograf, anotovat jej pomocí nově vznikajících nástrojů a zhodnotit jejich úspěšnost.
Abstract:
This diploma thesis deals with current issues in morphological tagging of interlingual homographs, foreign proper nouns and other English tokens occurring in Czech web corpora. The main purpose is to present a subcorpus of English collocations containing interlingual homographs, which are presently incorrectly tagged as Czech words, retagging this subcorpus with several newly developed solutions and …viac
 
 
Jazyk práce: Czech
Datum vytvoření / odevzdání či podání práce: 17. 5. 2018

Obhajoba závěrečné práce

  • Obhajoba proběhla 8. 6. 2018
  • Vedúci: RNDr. Zuzana Nevěřilová, Ph.D.
  • Oponent: RNDr. Adam Rambousek, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Filozofická fakulta

Masaryk University

Faculty of Arts

Master programme / odbor:
Philology / Czech Language with Orientation on Computational Linguistics

Práce na příbuzné téma