Bc. Jakub Jančo
Bachelor's thesis
Tvorba textových korpusů z blogů
Building text corpora from blogs
Abstract:
When processing and studying natural language is often the need to obtain a large amount of text. The text should contain coherent sentences and thoughts, to form a thought units, the which can be taught by programs and scientists can observe on them historical changes in languages. In order to do things on computers, it is good if text is tagged. Large collection of tagged text is called a corpus …viacAbstract:
Pri spracovávaní a študovaní prirodzeného jazyka je často potreba získať veľké množstvo textu. Text by mal obsahovať súvislé vety a myšlienky a vytvárať tak myšlienkové celky, na ktorých sa dajú učiť programy a vedci na nich môžu pozorovať historické zmeny v jazyku. Aby sa do tohto procesu mohli zapojiť počítače, je vhodné aby bol text značkovaný. Veľké množsto značkovaného textu pokope sa nazýva aj …viac
Jazyk práce: Slovak
Datum vytvoření / odevzdání či podání práce: 7. 1. 2015
Identifikátor:
https://is.muni.cz/th/gqlwq/
Obhajoba závěrečné práce
- Obhajoba proběhla 4. 2. 2015
- Vedúci: RNDr. Miloš Jakubíček, Ph.D.
- Oponent: Mgr. et Mgr. Vít Baisa, Ph.D.
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsBachelor programme / odbor:
Informatics / Artificial Intelligence and Natural Language Processing
Práce na příbuzné téma
-
Obsahová analýza technologických blogů
Michael Irišek -
Product placement na blogu a míra jeho uvědomění spotřebitelem
Kristina Jančaříková