Bc. Jakub Jančo
Bachelor's thesis
Tvorba textových korpusů z blogů
Building text corpora from blogs
Abstract:
When processing and studying natural language is often the need to obtain a large amount of text. The text should contain coherent sentences and thoughts, to form a thought units, the which can be taught by programs and scientists can observe on them historical changes in languages. In order to do things on computers, it is good if text is tagged. Large collection of tagged text is called a corpus …moreAbstract:
Pri spracovávaní a študovaní prirodzeného jazyka je často potreba získať veľké množstvo textu. Text by mal obsahovať súvislé vety a myšlienky a vytvárať tak myšlienkové celky, na ktorých sa dajú učiť programy a vedci na nich môžu pozorovať historické zmeny v jazyku. Aby sa do tohto procesu mohli zapojiť počítače, je vhodné aby bol text značkovaný. Veľké množsto značkovaného textu pokope sa nazýva aj …more
Language used: Slovak
Date on which the thesis was submitted / produced: 7. 1. 2015
Identifier:
https://is.muni.cz/th/gqlwq/
Thesis defence
- Date of defence: 4. 2. 2015
- Supervisor: RNDr. Miloš Jakubíček, Ph.D.
- Reader: Mgr. et Mgr. Vít Baisa, Ph.D.
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsBachelor programme / field:
Informatics / Artificial Intelligence and Natural Language Processing
Theses on a related topic
-
Obsahová analýza technologických blogů
Michael Irišek -
Product placement na blogu a míra jeho uvědomění spotřebitelem
Kristina Jančaříková