Automatická analýza kvality tabulkových datasetů – Václav Sobotka
Václav Sobotka
Bachelor's thesis
Automatická analýza kvality tabulkových datasetů
Automated quality analysis on tabular datasets
Abstract:
Práce se zaměřuje na samostatné tabulkové datasety a kvalitativní dimenze uchopitelné na této úrovni. Text diskutuje časté kvalitativní defekty tabulkových dat, jejich zdroje a možnosti automatické detekce těchto závad. Důraz je kladen na problémy pramenící z přímé interakce uživatelů se soubory datasetů. Mechanismy umožňující identifikaci popisovaných kvalitativních defektů byly implementovány v nástroji …moreAbstract:
The thesis targets some of data quality dimensions recognizable on the level of a solitary tabular dataset file (CSVs, spreadsheets). Within these quality dimensions, common issues, their sources, and the possibilities of their automated detection are discussed. Issues stemming from direct human interaction with the dataset are emphasized. Methods for identification of such issues were implemented …more
Language used: English
Date on which the thesis was submitted / produced: 26. 5. 2020
Identifier:
https://is.muni.cz/th/s777w/
Thesis defence
- Date of defence: 22. 6. 2020
- Supervisor: doc. RNDr. Tomáš Brázdil, Ph.D.
- Reader: Mgr. Jiří Vahala
Citation record
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsBachelor programme / field:
Informatics / Artificial Intelligence and Natural Language Processing
Theses on a related topic
- No theses on a related topic available.