Hluboké posilované učení s modelem prostředí a spojitými akcemi

Kuna, Karol

CS ENPrihlásiť sa Prihlásiť sa (EduID)

Theses s61nos

Hluboké posilované učení s modelem prostředí a spojitými akcemi – Bc. Karol Kuna

Bc. Karol Kuna

Master's thesis

Hluboké posilované učení s modelem prostředí a spojitými akcemi

Model-Based Deep Reinforcement Learning with Continuous Actions

Anotácia:

Táto práca študuje využitie modelu prostredia v oblasti hlbokého učenia posilňovaním so spojitými akciami, kde tradičné metódy model prostredia nepoužívajú. Súčasťou práce je teoretický popis nového algoritmu, nazvaného „Deep Model Learning Actor-Critic“, ktorý porovnávame s existujúcou metódou „Deep Deterministic Policy Gradient“. Tieto metódy porovnávame z hľadiska schopnosti riešiť nové úlohy a …viac

Abstract:

In this thesis, we study the application of an environment model to deep reinforcement learning with continuous actions, where contemporary methods are typically model-free. We give a theoretical description of a novel model-based actor-critic deep reinforcement learning technique that we developed, called Deep Model Learning Actor-Critic. We compare it with a model-free method, Deep Deterministic …viac

Keywords

deep reinforcement learning model-based reinforcement learning actor-critic deep learning OpenAI Gym control continuous actions

Jazyk práce: English

Datum vytvoření / odevzdání či podání práce: 22. 5. 2017

Identifikátor: https://is.muni.cz/th/n9pwa/

Obhajoba závěrečné práce

Obhajoba proběhla 19. 6. 2017
Vedúci: doc. RNDr. Tomáš Brázdil, Ph.D.
Oponent: RNDr. Vojtěch Řehák, Ph.D.

Citační záznam

Citovat tuto práci

Citace dle ISO 690:

KUNA, Karol. \textit{Hluboké posilované učení s modelem prostředí a spojitými akcemi}. Online. Diplomová práca. Brno: Masarykova univerzita, Faculty of Informatics. 2017. Dostupné z: https://theses.cz/id/s61nos/.

{{Citace kvalifikační práce
 | příjmení = Kuna
 | jméno = Karol
 | instituce = Masarykova univerzita, Faculty of Informatics
 | titul = Hluboké posilované učení s modelem prostředí a spojitými akcemi
 | url = https://theses.cz/id/s61nos/
 | typ práce = Diplomová práca
 | vedoucí = doc. RNDr. Tomáš Brázdil, Ph.D.
 | rok = 2017
 | počet stran =
 | strany =
 | citace = 2024-11-10
 | poznámka =
 | jazyk = 
}}

Plný text práce

Obsah online archivu závěrečné práce

Zveřejněno v Theses:

světu

Jak jinak získat přístup k textu

Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Odkaz na adresář do lokálního úložiště instituce

Masaryk University

Faculty of Informatics

Master programme / odbor:
Informatics / Artificial Intelligence and Natural Language Processing

Práce na příbuzné téma

Monte Carlo Tree Search in Deep Reinforcement Learning Algorithms
Richard Schwarz
Monte Carlo Tree Search in Deep Reinforcement Learning Algorithms
Richard Schwarz
Deep Risk-Constrained Reinforcement Learning with Safety Critics
Martin Gendiar
Navigace v neznámém a pevně daném prostředí pomocí deep reinforcement learning algoritmu
Gabriela HRUBÁ
Deep Reinforcement Learning for Decision Neuroscience
Faizanshaikh Abdulkhalil SHAIKH
Grammatikfehlerkorrektur mit Deep Reinforcement Learning
Raj Kumar RANA