Bc. Roman Zahradník

Master's thesis

Automatizované shromažďování a strukturalizace dat z webových zdrojů

Automatizované shromažďování a strukturalizace dat z webových zdrojů
Abstract:
Diplomová práce se zabývá vytvářením řešení pro průběžné získávání dat z webových zdrojů. Aplikace má na starosti automatické přecházení webových stránek, extrakci dat pomocí určených selektorů a jejich následnou normalizaci pro další zpracování pro dolování dat.
Abstract:
This diploma thesis deals with the creation of a solution for continuous data acquisition from web sources. The application is in charge of automatically navigating web pages, extracting data using dedicated selectors, and subsequently standardizing them for further processing for data mining.
Abstract:
Diplomová práca sa zaoberá vytvorením riešenia pre kontinuálne získavanie dát z webových zdrojov. Aplikácia má na starosti automatické prechádzanie webových stránok, extrakciu dát pomocou určených selektorov a ich následnú normalizáciu pre ďalšie spracovanie pre data mining.
 
 
Language used: Slovak
Date on which the thesis was submitted / produced: 21. 5. 2018

Thesis defence

  • Supervisor: doc. Ing. Jan Žižka, CSc.
  • Reader: Martin Vídeňský, externi

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • autentizovaným zaměstnancům ze stejné školy/fakulty
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Mendelova univerzita v Brně, Provozně ekonomická fakulta

Mendel University in Brno

Faculty of Business and Economics

Master programme / field:
Engineering Informatics / Automation Control and Informatics