Vyhledávání častých vzorů v rozsáhlých kolekcích dat – Bc. Marek Skalický
Bc. Marek Skalický
Master's thesis
Vyhledávání častých vzorů v rozsáhlých kolekcích dat
Finding frequent patterns in large collections of data
Abstract:
Cílem této práce je popsat problematiku hledání častých vzorů v datech. Uvést hlavní používané algoritmy a možnost škálování pro velké objemy dat. V druhé části práce algoritmy A-priory, TreeProjection, FP-growth a Eclat jsou otestovány na databázi obsahující klíčová slova obrázků. Jsou uvedeny výsledky analýzy výkonu. Z nich bylo zjištěno, že algoritmus Eclat je nejrychlejší se všemi testovanými daty …moreAbstract:
The main purpose of this thesis is to describe the problem of mining of frequent patterns. Major algorithms used for mining such knowledge are introduced, and a possibility of scalability is outlined. In the second half of this thesis A-priory, TreeProjection, GP-growth and Eclat algorithms are tested on a database of image keywords. Results from the performance comparison are presented. It was found …more
Language used: English
Date on which the thesis was submitted / produced: 21. 5. 2018
Identifier:
https://is.muni.cz/th/aawbh/
Thesis defence
- Date of defence: 18. 6. 2018
- Supervisor: prof. Ing. Pavel Zezula, CSc.
- Reader: RNDr. Michal Batko, Ph.D.
Citation record
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsMaster programme / field:
Applied Informatics / Applied Informatics
Theses on a related topic
-
Implementace algoritmu pro klasifikaci založenou na asociačních pravidlech v jazyce Python
Jiří Filip -
Pattern Mining in Command Histories from Cybersecurity Training
Kristián Tkáčik -
Pattern Mining in Dynamic Graphs
Karel Vaculík -
Pattern Mining in Dynamic Graphs
Karel Vaculík -
Complex Data Analysis by Mining and Searching Operations
Jakub Peschel -
Efficient Algorithms for Mining Colossal Patterns in high Dimensional Databases
Thanh Long Nguyen -
Parallel Methods for Mining Frequent Sequential patterns
Quoc Bao Huynh