Bc. Jakub Jančo

Bakalářská práce

Tvorba textových korpusů z blogů

Building text corpora from blogs
Abstract:
When processing and studying natural language is often the need to obtain a large amount of text. The text should contain coherent sentences and thoughts, to form a thought units, the which can be taught by programs and scientists can observe on them historical changes in languages. In order to do things on computers, it is good if text is tagged. Large collection of tagged text is called a corpus …více
Abstract:
Pri spracovávaní a študovaní prirodzeného jazyka je často potreba získať veľké množstvo textu. Text by mal obsahovať súvislé vety a myšlienky a vytvárať tak myšlienkové celky, na ktorých sa dajú učiť programy a vedci na nich môžu pozorovať historické zmeny v jazyku. Aby sa do tohto procesu mohli zapojiť počítače, je vhodné aby bol text značkovaný. Veľké množsto značkovaného textu pokope sa nazýva aj …více
 
 
Jazyk práce: slovenština
Datum vytvoření / odevzdání či podání práce: 7. 1. 2015

Obhajoba závěrečné práce

  • Obhajoba proběhla 4. 2. 2015
  • Vedoucí: RNDr. Miloš Jakubíček, Ph.D.
  • Oponent: Mgr. et Mgr. Vít Baisa, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masarykova univerzita

Fakulta informatiky

Bakalářský studijní program / obor:
Informatika / Umělá inteligence a zpracování přirozeného jazyka

Práce na příbuzné téma