Automatická analýza kvality tabulkových datasetů – Václav Sobotka
Václav Sobotka
Bakalářská práce
Automatická analýza kvality tabulkových datasetů
Automated quality analysis on tabular datasets
Anotace:
Práce se zaměřuje na samostatné tabulkové datasety a kvalitativní dimenze uchopitelné na této úrovni. Text diskutuje časté kvalitativní defekty tabulkových dat, jejich zdroje a možnosti automatické detekce těchto závad. Důraz je kladen na problémy pramenící z přímé interakce uživatelů se soubory datasetů. Mechanismy umožňující identifikaci popisovaných kvalitativních defektů byly implementovány v nástroji …víceAbstract:
The thesis targets some of data quality dimensions recognizable on the level of a solitary tabular dataset file (CSVs, spreadsheets). Within these quality dimensions, common issues, their sources, and the possibilities of their automated detection are discussed. Issues stemming from direct human interaction with the dataset are emphasized. Methods for identification of such issues were implemented …více
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 26. 5. 2020
Identifikátor:
https://is.muni.cz/th/s777w/
Obhajoba závěrečné práce
- Obhajoba proběhla 22. 6. 2020
- Vedoucí: doc. RNDr. Tomáš Brázdil, Ph.D.
- Oponent: Mgr. Jiří Vahala
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasarykova univerzita
Fakulta informatikyBakalářský studijní program / obor:
Informatika / Umělá inteligence a zpracování přirozeného jazyka
Práce na příbuzné téma
- Žádné práce na příbuzné téma.