Pareto Front Estimation in Risk-Constrained Markov Decision Processes – Bc. Martin Kurečka
Bc. Martin Kurečka
Master's thesis
Pareto Front Estimation in Risk-Constrained Markov Decision Processes
Pareto Front Estimation in Risk-Constrained Markov Decision Processes
Abstract:
Předmětem práce je optimalizace Markovovských rozhodovacích procesů s omezením (CMDP) pomocí metody MCTS. Cílem CMDP je nalézt strategii maximalizující odměnu při současném udržení penalizace pod předem danou hranicí. Náš přínos je dvojí. Za prvé podrobně zkoumáme stávající algoritmy založené na MCTS (jmenovitě CC-POMCP a RAMCP) a demonstrujeme koncepční problémy v jejich návrhu. Za druhé představujeme …moreAbstract:
The topic of the thesis is the optimisation of constrained Markov decision processes (CMDPs) using Monte Carlo tree search. CMDPs aim to find a control policy maximising a reward signal while keeping a penalty signal below a specified threshold. Our contribution is two-fold. Firstly, we provide a detailed examination of existing MCTS-based algorithms, CC-POMCP and RAMCP, and reveal and demonstrate …more
Language used: English
Date on which the thesis was submitted / produced: 15. 12. 2023
Identifier:
https://is.muni.cz/th/mcgrs/
Thesis defence
- Date of defence: 14. 2. 2024
- Supervisor: doc. RNDr. Petr Novotný, Ph.D.
- Reader: doc. RNDr. Tomáš Brázdil, Ph.D.
Citation record
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsMaster programme / field:
Theoretical computer science / Discrete algorithms and models
Theses on a related topic
-
Risk-Sensitive Reinforcement Learning
Marek Kadlčík -
Black-Box Hyperparameter Tuning for Risk-Constrained Reinforcement Learning Algorithm
Ján Petrák -
Deep Risk-Constrained Reinforcement Learning with Safety Critics
Martin Gendiar -
Reinforcement Learning of Risk-Averse Policies in Markov Decision Processes
Jiří Vahala -
Úcta k zemřelým jako projev víry a lásky
Veronika Davidová