Risk-Sensitive Reinforcement Learning – Bc. Marek Kadlčík
Bc. Marek Kadlčík
Bakalářská práce
Risk-Sensitive Reinforcement Learning
Risk-Sensitive Reinforcement Learning
Anotace:
Cílem standardních metod zpětnovazebního učení je maximalizovat očekávaný budoucí zisk. Ukazujeme motivaci pro zvážení risku při rozhodování, popisujeme zavedené definice risku a formulujeme odpovídající účelové fukce v kontextu zpětnovazebního učení. Nakonec poskytujememe rozsáhlý přehled existujících metod v literatuře pro jejich optimalizaci a uvádíme možné budoucích směry v této oblasti.Abstract:
Standard reinforcement learning methods aim to maximize the average future returns. We show a motivation for consideration of risk in decision-making, describe established definitions of risk and formulate corresponding risk-constrained and risk-penalizing objectives in context of reinforcement learning. Finally, we provide an extensive overview of existing methods in the literature for their optimization …více
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 25. 5. 2021
Identifikátor:
https://is.muni.cz/th/efw88/
Obhajoba závěrečné práce
- Obhajoba proběhla 1. 7. 2021
- Vedoucí: doc. RNDr. Vojtěch Řehák, Ph.D.
- Oponent: RNDr. Petr Novotný, Ph.D.
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasarykova univerzita
Fakulta informatikyBakalářský studijní program / obor:
Informatika / Umělá inteligence a zpracování přirozeného jazyka
Práce na příbuzné téma
-
Score-driven Models for Value at Risk and Expected Shortfall
Kateřina Nováková -
Value at Risk: Historická simulace, variančně kovarianční metoda a Monte Carlo simulace
Adam Felcman -
Pareto Front Estimation in Risk-Constrained Markov Decision Processes
Martin Kurečka -
Reinforcement Learning of Risk-Averse Policies in Markov Decision Processes
Jiří Vahala -
Model Tuning with Reinforcement Learning from Human Advice
Thomas RIEDL -
Reinforcement Learning for the Game of Battleship
Tomáš Kancko -
Risk-Aversion in Algorithms for Poker
Martin Horáček