Michal Pomykacz

Master's thesis

Hromadná extrakce dat veřejné správy do RDF

Bulk extraction of public administration data to RDF
Abstract:
Předložená diplomová práce se zabývá úlohou extrakce českých veřejných zakázek a extrakce číselníků a klasifikací, doplňujících informace k veřejným zakázkám. Cílem práce je realizovat pravidelnou extrakci zmíněných dat z formátů (HTML, XML a XSL), transformovat je do formátu RDF a zpřístupnit je ve formě Linked Data pomocí SPARQL koncového bodu. K dosažení cíle je třeba navrhnout a implementovat extrakční …more
Abstract:
The purpose of this work was to deal with data extraction from various formats (HTML, XML, XLS) and transformation for further processing. As the data sources were used Czech public contracts and related code lists and classifications. Main goal was to implement periodic data extraction, RDF transformation and publishing the output in form of Linked Data using SPARQL endpoint. It was necessary to design …more
 
 
Language used: Czech
Date on which the thesis was submitted / produced: 22. 1. 2013

Thesis defence

  • Date of defence: 10. 6. 2014
  • Supervisor: Vojtěch Svátek
  • Reader: Jindřich Mynarz

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • autentizovaným zaměstnancům ze stejné školy/fakulty
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Vysoká škola ekonomická v Praze
http://www.vse.cz/vskp/eid/41285