Mgr. Marek Grác, Ph.D.

Doctoral thesis

Rapid Development of Language Resources

Rapid Development of Language Resources
Anotácia:
Počítačové zpracování přirozeného jazyka (NLP) je obor, který se nachází na pomezí lingvistiky a informatiky. Při zpracování jazyka jsou důležité nejen algoritmy, ale i datové zdroje specifické pro konkrétní jazyk, kterými jsou např. gramatiky, slovníky či korpusy. V současnosti dokážeme vytvářet obrovské jazykové zdroje pomocí automatických metod, ale na jejich trénování a testování je potřeba využívat …viac
Anotácia:
plikaci výrazně lepší výsledky. V této práci jsme prezentovali doporučení pro tvorbu jazykových zdrojů s cílem použití pro NLP aplikace. Prakticky jsme je ověřili na dvou příkladech, zaměřených na odlišné jazykové roviny: syntax a sémantiku. Oba výsledné zdroje jsou ve stavu funkčních prototypů, jejich velikost a kvalita je dostatečná na to, aby změny při jejich zapojení do vývoje NLP aplikací byly …viac
Abstract:
Natural language processing (NLP) is a field at the intersection of linguistics and informatics. In language processing, not only algorithms but also language-specific data sources are important, such as grammars, dictionaries or corpora. At present, we can create vast language resources using automatic methods, but their training and testing requires higher quality resources. However, their creation …viac
Abstract:
ional prototypes, the size and quality of which is sufficient for the changes resulting from their use in the development of NLP applications to be measurable. This was demonstrated on two examples, in both of which the results were significantly better due to the use of the new resources. More than one hundred annotators were involved in the implementation of the language resources, who thoroughly …viac
 
 
Jazyk práce: English
Datum vytvoření / odevzdání či podání práce: 30. 4. 2013

Obhajoba závěrečné práce

  • Obhajoba proběhla 26. 8. 2013
  • Vedúci: prof. PhDr. Karel Pala, CSc.
  • Oponent: doc. PhDr. Klára Osolsobě, Dr., Dr. Maciej Piasecki, Prof. Marko Tadić

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masaryk University

Faculty of Informatics

Doctoral programme / odbor:
Informatics (4-years) / Informatics

Práce na příbuzné téma