Bc. Martin Kurečka

Diplomová práce

Pareto Front Estimation in Risk-Constrained Markov Decision Processes

Pareto Front Estimation in Risk-Constrained Markov Decision Processes
Anotace:
Předmětem práce je optimalizace Markovovských rozhodovacích procesů s omezením (CMDP) pomocí metody MCTS. Cílem CMDP je nalézt strategii maximalizující odměnu při současném udržení penalizace pod předem danou hranicí. Náš přínos je dvojí. Za prvé podrobně zkoumáme stávající algoritmy založené na MCTS (jmenovitě CC-POMCP a RAMCP) a demonstrujeme koncepční problémy v jejich návrhu. Za druhé představujeme …více
Abstract:
The topic of the thesis is the optimisation of constrained Markov decision processes (CMDPs) using Monte Carlo tree search. CMDPs aim to find a control policy maximising a reward signal while keeping a penalty signal below a specified threshold. Our contribution is two-fold. Firstly, we provide a detailed examination of existing MCTS-based algorithms, CC-POMCP and RAMCP, and reveal and demonstrate …více
 
 
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 15. 12. 2023

Obhajoba závěrečné práce

  • Obhajoba proběhla 14. 2. 2024
  • Vedoucí: doc. RNDr. Petr Novotný, Ph.D.
  • Oponent: doc. RNDr. Tomáš Brázdil, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masarykova univerzita

Fakulta informatiky

Magisterský studijní program / obor:
Teoretická informatika / Diskrétní algoritmy a modely