Analyzing Data Lakehouse: The Latest Evolution of Big Data Architectures and Its Benefits for Data Science – Ondřej Holub
Ondřej Holub
Master's thesis
Analyzing Data Lakehouse: The Latest Evolution of Big Data Architectures and Its Benefits for Data Science
Analýza data lakehouse: Nejnovější evoluce v big data architekturách a její přínosy pro data science
Abstract:
Data lakehouse je novou generací architektur distribuovaných platforem pro datovou analýzu, která v unifikovaném modelu spojuje klíčové výhody platforem data lake a data warehouse a umožňuje provádět různorodé data science a business intelligence úlohy nad společnou datovou základnou. Tato práce zkoumá nově přicházející architekturu data lakehouse a sadu souvisejících technologií pro předzpracování …moreAbstract:
The data lakehouse is a new-generation distributed data analytics platform architecture that combines key benefits of data lakes and warehouses into a unified design, reconciling diverse data science and business intelligence workloads over a common data foundation. This thesis examines the novel data lakehouse architecture and a set of associated data preprocessing and data science technologies and …more
Language used: English
Date on which the thesis was submitted / produced: 28. 4. 2022
Identifier:
https://vskp.vse.cz/eid/85749
Thesis defence
- Date of defence: 1. 6. 2022
- Supervisor: Petr Máša
- Reader: Jan Rauch
Citation record
ISO 690-compliant citation record:
HOLUB, Ondřej. \textit{Analyzing Data Lakehouse: The Latest Evolution of Big Data Architectures and Its Benefits for Data Science}. Online. Master's thesis. Praha: University of Economics, Prague. 2022. Available from: https://theses.cz/id/m1sq3t/.
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- autentizovaným zaměstnancům ze stejné školy/fakulty
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Vysoká škola ekonomická v Prazehttps://vskp.vse.cz/eid/85749
Vysoká škola ekonomická v Praze
Master programme / field:
Aplikovaná informatika / Znalostní a webové technologie
Theses on a related topic
-
Machine learning for isotropic and anisotropic weak interactions
Simona Dubcová -
Machine Learning for Text Anomaly Detection
Alina Tsykynovska -
Strojové učení na platformě Apache Spark
František Hylmar -
Přenesení extraktorů nástroje Plaso na platformu Apache Spark
Miroslav Baláž -
Automatizace testování softwaru na různých verzích platformy Apache Spark
Karolína Radovská -
Zpracování síťové komunikace v prostředí Apache Spark
Michal Béder -
Strojové učení v oblasti Big Data
Michal Šimánek -
Deploying Data Lake for Big Data Management
Tomáš Chomo