Deduplikace dat a jejich využití – Bc. Pavel Klečanský
Bc. Pavel Klečanský
Diplomová práce
Deduplikace dat a jejich využití
Data deduplication and useage options
Anotace:
Diplomová práce se zabývá popisem problematiky deduplikace a spojování záznamu. Teoretická část zahrnuje celý proces deduplikace, od čištění dat až po klasifikaci. Práce také popisuje algoritmy, jako jsou Jaro-Winklerova vzdálenost, Levenshteinova vzdálenost, Damerau-Levenshteinova vzdálenost, Jaccardův index a podobnost Q-gramů. V praktické části práce je vytvořena knihovna, která umožňuje provádění …víceAbstract:
The thesis deals with the description of deduplication and record linkage. The theoretical part covers the whole workflow of deduplication, from data cleaning to classification. The thesis also describes algorithms such as Jaro-Winkler distance, Levenshtein distance, DamerauLevenshtein distance, Jaccard index and Q-gram similarity. In the practical part of the thesis, a library is developed to perform …více
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 17. 5. 2024
Zveřejnit od: 31. 12. 2999
Obhajoba závěrečné práce
- Vedoucí: Ing. Monika Borkovcová, Ph.D.
Citační záznam
Jak správně citovat práci
Klečanský, Pavel. Deduplikace dat a jejich využití. Pardubice, 2024. diplomová práce (Ing.). Univerzita Pardubice. Fakulta elektrotechniky a informatiky
Plný text práce
Právo: Autor si nepřeje zpřístupnění práce veřejnosti
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- Soubory jsou nedostupné.
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Univerzita Pardubice, Fakulta elektrotechniky a informatikyUniverzita Pardubice
Fakulta elektrotechniky a informatikyMagisterský studijní program / obor:
Informační technologie / Informační technologie
Práce na příbuzné téma
-
Kvalita dat OpenStreetMap a její závislost na charakteristikách území
Jakub Řehák -
Kvalita dat a informačních systémů a jejich vztah k bezpečnostní praxi
Lenka Relichová -
Optimalizace zpracování fMRI dat s ohledem na kontrolu kvality dat
Martin Gajdoš -
Kvalita dat VGI a OpenStreetMap
Jakub Řehák -
Reflexně seismický profil v Hornomoravském úvalu, interpretace dat a zhodnocení vlivu geometrie měření na kvalitu výsledných dat
Lukáš MALOUŠEK -
Možnosti posouzení kvality dat OpenStreetMap bez srovnání s jinou datovou sadou
Jana Grunová -
Vliv vlastností přispěvatelů na kvalitu dat OpenStreetMap
Grunová Grunová -
Analýza kvality prostorových dat půdních bloků LPIS v období 2004 až 2022
Eliška Křapová