Využití Spark pro zpracování dat na HPC infrastruktuře – Jiří Cága
Jiří Cága
Master's thesis
Využití Spark pro zpracování dat na HPC infrastruktuře
Spark for Data Processing on the HPC Infrastructure
Abstract:
Diplomová práce popisuje technologie Apache Hadoop a Spark. V první částí seznamuje jak s popisem technologií tak s implementací vybraných algoritmů za pomoci těchto technologií. Druhá část je věnována návrhu grafického klienta pro spouštění implementovaných algoritmů nad službou HPC as a Service. Hlavním cílem bylo porovnání různých implementací algoritmů s využitím Apache Hadoopu a Sparku nad rozsáhlými …moreAbstract:
Diploma thesis describes technologies an Apache Hadoop and a Spark. In first part it explains technologies and implementation selected algorithms. The second part is devode design graphic client for launching implemented algorithms on HPC as a Service. The main goal was compare different implementation algorithms with use Hadoop and Spark onto range of dataset on HPC infrastructure in technology center …more
Language used: Czech
Date on which the thesis was submitted / produced: 30. 4. 2018
Identifier:
http://hdl.handle.net/10084/128338
Thesis defence
- Date of defence: 4. 6. 2018
- Supervisor: Jan Martinovič
- Reader: Jan Kožusznik
Citation record
ISO 690-compliant citation record:
CÁGA, Jiří. \textit{Využití Spark pro zpracování dat na HPC infrastruktuře}. Online. Master's thesis. Ostrava: VŠB - Technical University of Ostrava, Fakulta elektrotechniky a informatiky. 2018. Available from: https://theses.cz/id/9x7e1m/.
Full text of thesis
Accessibility: Plné texty vysokoškolských kvalifikačních prací obhájených na Vysoké škole báňské - Technické univerzitě Ostrava jsou uloženy v repozitáři DSpace. Přístup k plným textům mají všichni uživatelé bez omezení. Přístup je omezen pouze ve výjimečných případech, zpravidla z důvodu ochrany duševního vlastnictví. Nepřístupné práce jsou označeny jako closedAccess nebo embargoedAccess. Tištěné verze prácí jsou uloženy v Ústřední knihovně VŠB-TUO a jsou prezenčně přístupné ve studovně diplomových prací. Další nakládání s prací (kopírování, opisy, MVS) se řídí Knihovní a výpůjčním řádem Ústřední knihovny VŠB-TUO.
Contents of on-line thesis archive
Published in Theses:- autentizovaným zaměstnancům ze stejné školy/fakulty
Other ways of accessing the text
Institution archiving the thesis and making it accessible: VŠB - Technická univerzita OstravaVŠB - Technical University of Ostrava
Fakulta elektrotechniky a informatikyMaster programme / field:
Informační a komunikační technologie / Informatika a výpočetní technika
Theses on a related topic
-
Identifikace cílů RNA vazných proteinů pomocí Machine Learning algoritmů
Eliška Chalupová -
Aplikace machine learning algoritmu na doporučení zboží ke koupi
Štěpán Kameník -
Machine Learning for Text Anomaly Detection
Alina Tsykynovska -
Localization of mobile devices using machine learning
Aleš Calábek -
Supervised and Unsupervised Machine Learning Methods for System Log Anomaly Detection
Júlia Ščensná -
Automate issue tagging and categorization using machine learning techniques
Michal Mokroš -
Machine learning analysis and cataloging of extragalactic sources
Matej Kosiba -
Deployment of a federated machine learning architecture on oncological data
Martin Kadaši