Bc. Marek Skalický

Master's thesis

Vyhledávání častých vzorů v rozsáhlých kolekcích dat

Finding frequent patterns in large collections of data
Abstract:
Cílem této práce je popsat problematiku hledání častých vzorů v datech. Uvést hlavní používané algoritmy a možnost škálování pro velké objemy dat. V druhé části práce algoritmy A-priory, TreeProjection, FP-growth a Eclat jsou otestovány na databázi obsahující klíčová slova obrázků. Jsou uvedeny výsledky analýzy výkonu. Z nich bylo zjištěno, že algoritmus Eclat je nejrychlejší se všemi testovanými daty …more
Abstract:
The main purpose of this thesis is to describe the problem of mining of frequent patterns. Major algorithms used for mining such knowledge are introduced, and a possibility of scalability is outlined. In the second half of this thesis A-priory, TreeProjection, GP-growth and Eclat algorithms are tested on a database of image keywords. Results from the performance comparison are presented. It was found …more
 
 
Language used: English
Date on which the thesis was submitted / produced: 21. 5. 2018

Thesis defence

  • Date of defence: 18. 6. 2018
  • Supervisor: prof. Ing. Pavel Zezula, CSc.
  • Reader: RNDr. Michal Batko, Ph.D.

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky