Hluboké posilované učení s modelem prostředí a spojitými akcemi – Bc. Karol Kuna
Bc. Karol Kuna
Master's thesis
Hluboké posilované učení s modelem prostředí a spojitými akcemi
Model-Based Deep Reinforcement Learning with Continuous Actions
Anotácia:
Táto práca študuje využitie modelu prostredia v oblasti hlbokého učenia posilňovaním so spojitými akciami, kde tradičné metódy model prostredia nepoužívajú. Súčasťou práce je teoretický popis nového algoritmu, nazvaného „Deep Model Learning Actor-Critic“, ktorý porovnávame s existujúcou metódou „Deep Deterministic Policy Gradient“. Tieto metódy porovnávame z hľadiska schopnosti riešiť nové úlohy a …viacAbstract:
In this thesis, we study the application of an environment model to deep reinforcement learning with continuous actions, where contemporary methods are typically model-free. We give a theoretical description of a novel model-based actor-critic deep reinforcement learning technique that we developed, called Deep Model Learning Actor-Critic. We compare it with a model-free method, Deep Deterministic …viac
Jazyk práce: English
Datum vytvoření / odevzdání či podání práce: 22. 5. 2017
Identifikátor:
https://is.muni.cz/th/n9pwa/
Obhajoba závěrečné práce
- Obhajoba proběhla 19. 6. 2017
- Vedúci: doc. RNDr. Tomáš Brázdil, Ph.D.
- Oponent: RNDr. Vojtěch Řehák, Ph.D.
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsMaster programme / odbor:
Informatics / Artificial Intelligence and Natural Language Processing
Práce na příbuzné téma
-
Monte Carlo Tree Search in Deep Reinforcement Learning Algorithms
Richard Schwarz -
Monte Carlo Tree Search in Deep Reinforcement Learning Algorithms
Richard Schwarz -
Deep Risk-Constrained Reinforcement Learning with Safety Critics
Martin Gendiar -
Navigace v neznámém a pevně daném prostředí pomocí deep reinforcement learning algoritmu
Gabriela HRUBÁ -
Deep Reinforcement Learning for Decision Neuroscience
Faizanshaikh Abdulkhalil SHAIKH -
Grammatikfehlerkorrektur mit Deep Reinforcement Learning
Raj Kumar RANA