Bc. Jakub Jančo

Bachelor's thesis

Tvorba textových korpusů z blogů

Building text corpora from blogs
Abstract:
When processing and studying natural language is often the need to obtain a large amount of text. The text should contain coherent sentences and thoughts, to form a thought units, the which can be taught by programs and scientists can observe on them historical changes in languages. In order to do things on computers, it is good if text is tagged. Large collection of tagged text is called a corpus …more
Abstract:
Pri spracovávaní a študovaní prirodzeného jazyka je často potreba získať veľké množstvo textu. Text by mal obsahovať súvislé vety a myšlienky a vytvárať tak myšlienkové celky, na ktorých sa dajú učiť programy a vedci na nich môžu pozorovať historické zmeny v jazyku. Aby sa do tohto procesu mohli zapojiť počítače, je vhodné aby bol text značkovaný. Veľké množsto značkovaného textu pokope sa nazýva aj …more
 
 
Language used: Slovak
Date on which the thesis was submitted / produced: 7. 1. 2015

Thesis defence

  • Date of defence: 4. 2. 2015
  • Supervisor: RNDr. Miloš Jakubíček, Ph.D.
  • Reader: Mgr. et Mgr. Vít Baisa, Ph.D.

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky

Masaryk University

Faculty of Informatics

Bachelor programme / field:
Informatics / Artificial Intelligence and Natural Language Processing

Theses on a related topic