Ondřej Holub

Master's thesis

Analyzing Data Lakehouse: The Latest Evolution of Big Data Architectures and Its Benefits for Data Science

Analýza data lakehouse: Nejnovější evoluce v big data architekturách a její přínosy pro data science
Abstract:
Data lakehouse je novou generací architektur distribuovaných platforem pro datovou analýzu, která v unifikovaném modelu spojuje klíčové výhody platforem data lake a data warehouse a umožňuje provádět různorodé data science a business intelligence úlohy nad společnou datovou základnou. Tato práce zkoumá nově přicházející architekturu data lakehouse a sadu souvisejících technologií pro předzpracování …more
Abstract:
The data lakehouse is a new-generation distributed data analytics platform architecture that combines key benefits of data lakes and warehouses into a unified design, reconciling diverse data science and business intelligence workloads over a common data foundation. This thesis examines the novel data lakehouse architecture and a set of associated data preprocessing and data science technologies and …more
 
 
Language used: English
Date on which the thesis was submitted / produced: 28. 4. 2022

Thesis defence

  • Date of defence: 1. 6. 2022
  • Supervisor: Petr Máša
  • Reader: Jan Rauch

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • autentizovaným zaměstnancům ze stejné školy/fakulty
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Vysoká škola ekonomická v Praze
https://vskp.vse.cz/eid/85749

Vysoká škola ekonomická v Praze

Master programme / field:
Aplikovaná informatika / Znalostní a webové technologie