Bc. Radoslav Rábara

Master's thesis

Paralelizace časově náročných operací korpusového manažeru

Parallelization of the corpus manager's time-consuming operations
Abstract:
Korpusový manažér Manatee dokáže spracovávať korpusy obsahujúce desiatky miliard slov. Pre takto veľké korpusy sú niektoré operácie s výsledkami vyhľadávania značne časovo náročné. Práca skúma možnosti paralelného spracovania vybraných operácií a to na viacerých jadrách jedného počítača i na zoskupení samostatných počítačov. Práca obsahuje i implementovaný systém pre paralelné vyhodnocovanie vybraných …more
Abstract:
The Manatee corpus manager can process large corpora containing billions of words. Some operations with search results from such large corpora can be time-consuming. This thesis provides and describes a system that enables computation of the selected operations in parallel. The system is evaluated on a single computer, and on a cluster of computers. The evaluation contains evaluation of the scalability …more
 
 
Language used: English
Date on which the thesis was submitted / produced: 30. 5. 2016

Thesis defence

  • Date of defence: 27. 6. 2016
  • Supervisor: doc. Mgr. Pavel Rychlý, Ph.D.
  • Reader: RNDr. Miloš Jakubíček, Ph.D.

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky

Masaryk University

Faculty of Informatics

Master programme / field:
Applied Informatics / Applied Informatics

Theses on a related topic