Framework pro auto-tuning paralelních kernelů – Bc. Filip Petrovič
Bc. Filip Petrovič
Diplomová práce
Framework pro auto-tuning paralelních kernelů
Framework for Parallel Kernels Auto-tuning
Anotace:
Výstupom tejto práce je framework pre auto-tuning paralelných kernelov, ktoré sú napísané v jazyku OpenCL alebo CUDA. Framework zahrňuje pokročilú funkcionalitu, vrátane podpory pre kompozície kernelov a online auto-tuning. Text práce popisuje API a vnútornú štruktúru frameworku a prezentuje viacero príkladov využitia frameworku pre optimalizáciu kernelov.Abstract:
The result of this thesis is a framework for auto-tuning of parallel kernels which are written in either OpenCL or CUDA language. The framework includes advanced functionality such as support for composite kernels and online auto-tuning. The thesis describes API and internal structure of the framework and presents several examples of its utilization for kernel optimization.
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 17. 5. 2018
Identifikátor:
https://is.muni.cz/th/a7xtl/
Obhajoba závěrečné práce
- Obhajoba proběhla 21. 6. 2018
- Vedoucí: RNDr. Jiří Filipovič, Ph.D.
- Oponent: doc. RNDr. Petr Holub, Ph.D.
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasarykova univerzita
Fakulta informatikyMagisterský studijní program / obor:
Aplikovaná informatika / Aplikovaná informatika
Práce na příbuzné téma
-
Auto-tuning vybraných výpočetních kernelů
Richard Trembecký -
CUDA Implementation of Pixelformat Conversions
Mário Hatalčík -
Efektivní implementace k-d stromu v prostředí CUDA
Vojtěch Řezáč -
Dekonvoluce jednokanálových snímků pro systém s grafickou kartou podporující CUDA
Ladislav Zítka -
Computing Strongly Connected Components with CUDA
Miroslav Stuhl -
Porovnání molekul proteinů za pomoci výpočtů technologie CUDA grafických karet nVidia
Tomáš Došek -
Generátor efektivního kódu fúzovaných CUDA kernelů
Bedřich Lakomý -
Zlepšení metody predikce výkonu fúzovaných CUDA kernelů
Peter Novák