Bc. Jakub Jančo

Bachelor's thesis

Tvorba textových korpusů z blogů

Building text corpora from blogs
Abstract:
When processing and studying natural language is often the need to obtain a large amount of text. The text should contain coherent sentences and thoughts, to form a thought units, the which can be taught by programs and scientists can observe on them historical changes in languages. In order to do things on computers, it is good if text is tagged. Large collection of tagged text is called a corpus …viac
Abstract:
Pri spracovávaní a študovaní prirodzeného jazyka je často potreba získať veľké množstvo textu. Text by mal obsahovať súvislé vety a myšlienky a vytvárať tak myšlienkové celky, na ktorých sa dajú učiť programy a vedci na nich môžu pozorovať historické zmeny v jazyku. Aby sa do tohto procesu mohli zapojiť počítače, je vhodné aby bol text značkovaný. Veľké množsto značkovaného textu pokope sa nazýva aj …viac
 
 
Jazyk práce: Slovak
Datum vytvoření / odevzdání či podání práce: 7. 1. 2015

Obhajoba závěrečné práce

  • Obhajoba proběhla 4. 2. 2015
  • Vedúci: RNDr. Miloš Jakubíček, Ph.D.
  • Oponent: Mgr. et Mgr. Vít Baisa, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masaryk University

Faculty of Informatics

Bachelor programme / odbor:
Informatics / Artificial Intelligence and Natural Language Processing

Práce na příbuzné téma