Bc. Marek Skalický

Diplomová práce

Vyhledávání častých vzorů v rozsáhlých kolekcích dat

Finding frequent patterns in large collections of data
Anotace:
Cílem této práce je popsat problematiku hledání častých vzorů v datech. Uvést hlavní používané algoritmy a možnost škálování pro velké objemy dat. V druhé části práce algoritmy A-priory, TreeProjection, FP-growth a Eclat jsou otestovány na databázi obsahující klíčová slova obrázků. Jsou uvedeny výsledky analýzy výkonu. Z nich bylo zjištěno, že algoritmus Eclat je nejrychlejší se všemi testovanými daty …více
Abstract:
The main purpose of this thesis is to describe the problem of mining of frequent patterns. Major algorithms used for mining such knowledge are introduced, and a possibility of scalability is outlined. In the second half of this thesis A-priory, TreeProjection, GP-growth and Eclat algorithms are tested on a database of image keywords. Results from the performance comparison are presented. It was found …více
 
 
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 21. 5. 2018

Obhajoba závěrečné práce

  • Obhajoba proběhla 18. 6. 2018
  • Vedoucí: prof. Ing. Pavel Zezula, CSc.
  • Oponent: RNDr. Michal Batko, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masarykova univerzita

Fakulta informatiky

Magisterský studijní program / obor:
Aplikovaná informatika / Aplikovaná informatika