Paralelizace časově náročných operací korpusového manažeru – Bc. Radoslav Rábara
Bc. Radoslav Rábara
Master's thesis
Paralelizace časově náročných operací korpusového manažeru
Parallelization of the corpus manager's time-consuming operations
Abstract:
Korpusový manažér Manatee dokáže spracovávať korpusy obsahujúce desiatky miliard slov. Pre takto veľké korpusy sú niektoré operácie s výsledkami vyhľadávania značne časovo náročné. Práca skúma možnosti paralelného spracovania vybraných operácií a to na viacerých jadrách jedného počítača i na zoskupení samostatných počítačov. Práca obsahuje i implementovaný systém pre paralelné vyhodnocovanie vybraných …moreAbstract:
The Manatee corpus manager can process large corpora containing billions of words. Some operations with search results from such large corpora can be time-consuming. This thesis provides and describes a system that enables computation of the selected operations in parallel. The system is evaluated on a single computer, and on a cluster of computers. The evaluation contains evaluation of the scalability …more
Language used: English
Date on which the thesis was submitted / produced: 30. 5. 2016
Identifier:
https://is.muni.cz/th/vdho2/
Thesis defence
- Date of defence: 27. 6. 2016
- Supervisor: doc. Mgr. Pavel Rychlý, Ph.D.
- Reader: RNDr. Miloš Jakubíček, Ph.D.
Citation record
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsMaster programme / field:
Applied Informatics / Applied Informatics