Bc. Jana Vrtělová

Bachelor's thesis

Analýza tvarů s nízkou frekvencí v mluvených korpusech řady ORAL

Analysis of the word forms with low frequency in spoken corpora ORAL
Abstract:
Bakalářská práce analyzuje slovní tvary s nízkou frekvencí v mluveném korpusu oral_v5. Kategorizuje ojedinělé výrazy, které nebyly automatickými nástroji označkovány, a popisuje vytvořené kategorie. Práce zhodnocuje výsledná data a vyčleňuje kategorii slovních tvarů, jimž by bylo možné i přes jejich ojedinělý výskyt přiřadit morfologickou značku. Výsledky práce mohou být využity ke zdokonalení transkripce …more
Abstract:
The bachelor's thesis analyses word forms with low frequency in spoken corpus oral_v5. It categorises rare word forms, which weren't tagged by automatic tools and describes the categories it created. The thesis evaluates final data and sets apart a category of word forms that have been morphologically tagged despite their sporadic occurrence. Results of this thesis might be used for improvement of …more
 
 
Language used: Czech
Date on which the thesis was submitted / produced: 7. 8. 2017

Thesis defence

  • Date of defence: 7. 9. 2017
  • Supervisor: Mgr. Dana Hlaváčková, Ph.D.
  • Reader: Mgr. Hana Žižková

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Filozofická fakulta

Masaryk University

Faculty of Arts

Bachelor programme / field:
Philology / Czech Language with Orientation on Computational Linguistics

Theses on a related topic