Jan Halama

Master's thesis

Řízení datové kvality v Hadoop Ecosystem

Data quality management in Hadoop Ecosystem
Abstract:
Tato diplomová práce se zabývá řízením kvality dat v nástrojích Hadoop Ecosystem. Cílem práce je vytvoření prototypu nástroje pro datové validace a monitoring v Threat Intelligence oddělení společnosti zabývající se kybernetickou bezpečností. Práce definuje pojem Big Data, jeho vztah a význam pro společnost řízenou daty a konkrétní Big Data technologii Hadoop. Hadoop je popsán včetně nástrojů Hadoop …more
Abstract:
This diploma thesis focusses on data quality management in Hadoop Ecosystem tools. The aim of this thesis is to create a prototype tool for data validation and monitoring in the Threat Intelligence department of a cyber security company. The thesis defines the concept of Big Data, its relationship and significance for a data-driven company and specific Big Data technology Hadoop. Hadoop is described …more
 
 
Language used: Czech
Date on which the thesis was submitted / produced: 2. 10. 2020

Thesis defence

  • Date of defence: 31. 5. 2021
  • Supervisor: Jan Pour
  • Reader: Vendula Píšová

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • autentizovaným zaměstnancům ze stejné školy/fakulty
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Vysoká škola ekonomická v Praze
https://vskp.vse.cz/eid/82616