Sampling Methods for Risk-Averse MDP Solvers – Bc. Václav Nevyhoštěný
Bc. Václav Nevyhoštěný
Bachelor's thesis
Sampling Methods for Risk-Averse MDP Solvers
Sampling Methods for Risk-Averse MDP Solvers
Abstract:
Mnoho situací v reálném světě v oborech jako robotika, ekonomie, atd., mohou být modelované jako stochastická prostředí s omezeními. Je známo, že nalezení optimálního chování v těchto prostředích je NP-hard. Formálně je definujeme pomocí omezených Markovových rozhodovacích procesů. Tato práce se zaměřuje na vzorkovací metody plánovacích algoritmů pro MDPs rozšířené o omezení rizika. Navrhuje nový algoritmus …moreAbstract:
Many real-world situations in fields such as robotics, economics, etc., can be modeled as stochastic environments with constraints. Finding optimal behavior in these environments is known to be NP-hard. They are formally defined using constrained Markov decision processes. This thesis focuses on the sampling methods of planning algorithms for MDPs extended for a risk constraint. It introduces a new …more
Language used: English
Date on which the thesis was submitted / produced: 18. 5. 2023
Identifier:
https://is.muni.cz/th/nlmru/
Thesis defence
- Date of defence: 26. 6. 2023
- Supervisor: RNDr. Petr Novotný, Ph.D.
- Reader: RNDr. Vít Musil, Ph.D.
Citation record
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsBachelor programme / field:
Informatics / Informatics