Risk-Sensitive Reinforcement Learning

Kadlčík, Marek

EN SKPřihlásit se Přihlásit se (EduID)

Theses 9eea9a

Risk-Sensitive Reinforcement Learning – Bc. Marek Kadlčík

Zpět na vyhledávání

Bc. Marek Kadlčík

Bakalářská práce

Risk-Sensitive Reinforcement Learning

Anotace:

Cílem standardních metod zpětnovazebního učení je maximalizovat očekávaný budoucí zisk. Ukazujeme motivaci pro zvážení risku při rozhodování, popisujeme zavedené definice risku a formulujeme odpovídající účelové fukce v kontextu zpětnovazebního učení. Nakonec poskytujememe rozsáhlý přehled existujících metod v literatuře pro jejich optimalizaci a uvádíme možné budoucích směry v této oblasti.

Abstract:

Standard reinforcement learning methods aim to maximize the average future returns. We show a motivation for consideration of risk in decision-making, describe established definitions of risk and formulate corresponding risk-constrained and risk-penalizing objectives in context of reinforcement learning. Finally, we provide an extensive overview of existing methods in the literature for their optimization …více

Keywords

reinforcement learning Markov decision process dynamic programming machine learning Monte Carlo Q-Learning REINFORCE Actor-critic expected utility mean-variance conditional value at risk CVaR risk of ruin chance-constraint

Jazyk práce: angličtina

Datum vytvoření / odevzdání či podání práce: 25. 5. 2021

Identifikátor: https://is.muni.cz/th/efw88/

Obhajoba závěrečné práce

Obhajoba proběhla 1. 7. 2021
Vedoucí: doc. RNDr. Vojtěch Řehák, Ph.D.
Oponent: RNDr. Petr Novotný, Ph.D.

Citační záznam

Citovat tuto práci

Citace dle ISO 690:

KADLČÍK, Marek. \textit{Risk-Sensitive Reinforcement Learning}. Online. Bakalářská práce. Brno: Masarykova univerzita, Fakulta informatiky. 2021. Dostupné z: https://theses.cz/id/9eea9a/.

{{Citace kvalifikační práce
 | příjmení = Kadlčík
 | jméno = Marek
 | instituce = Masarykova univerzita, Fakulta informatiky
 | titul = Risk-Sensitive Reinforcement Learning
 | url = https://theses.cz/id/9eea9a/
 | typ práce = Bakalářská práce
 | vedoucí = doc. RNDr. Vojtěch Řehák, Ph.D.
 | rok = 2021
 | počet stran =
 | strany =
 | citace = 2024-10-05
 | poznámka =
 | jazyk = 
}}

Plný text práce

Obsah online archivu závěrečné práce

Zveřejněno v Theses:

světu

Jak jinak získat přístup k textu

Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Odkaz na adresář do lokálního úložiště instituce

Masarykova univerzita

Fakulta informatiky

Bakalářský studijní program / obor:
Informatika / Umělá inteligence a zpracování přirozeného jazyka

Práce na příbuzné téma

Score-driven Models for Value at Risk and Expected Shortfall
Kateřina Nováková
Value at Risk: Historická simulace, variančně kovarianční metoda a Monte Carlo simulace
Adam Felcman
Pareto Front Estimation in Risk-Constrained Markov Decision Processes
Martin Kurečka
Reinforcement Learning of Risk-Averse Policies in Markov Decision Processes
Jiří Vahala
Model Tuning with Reinforcement Learning from Human Advice
Thomas RIEDL
Reinforcement Learning for the Game of Battleship
Tomáš Kancko
Risk-Aversion in Algorithms for Poker
Martin Horáček