Reinforcement Learning of Risk-Averse Policies in Markov Decision Processes

Vahala, Jiří

CS ENPrihlásiť sa Prihlásiť sa (EduID)

Theses eoq4da

Reinforcement Learning of Risk-Averse Policies in Markov Decision Processes – Bc. Jiří Vahala

Zpět na vyhledávání

Bc. Jiří Vahala

Master's thesis

Reinforcement Learning of Risk-Averse Policies in Markov Decision Processes

Anotácia:

Optimalizace průměrné kumulované odměny za nejistoty výsledku je stěžejní problém v mnoha aplikacích. Typické metody posilovaného učení se soustředí pouze na maximalizaci průmřené kumulované odměny bez jakéhokoli přihlížení k risku. Tato práce shrnuje již existujicí metody zaobírající se maximalizací nejistého výsledku a navrhuje nový algoritmus posilovaného učení Ralf0, který optimalizuje strategie …viac

Abstract:

Optimizing the expected cumulative reward under uncertainty is a crucial problem in many applications. A typical reinforcement learning approach is to maximize the expected cumulative reward without any sense of risk. In this thesis, we summarize already existing risk-averse learning techniques and introduce a new reinforcement learning algorithm Ralf0, which optimizes risk-averse policies without …viac

Keywords

Ralf0 Risk-averse Reinforcement learning Policy MCTS MDP

Jazyk práce: English

Datum vytvoření / odevzdání či podání práce: 20. 5. 2019

Identifikátor: https://is.muni.cz/th/gv8zz/

Obhajoba závěrečné práce

Obhajoba proběhla 18. 6. 2019
Vedúci: doc. RNDr. Tomáš Brázdil, Ph.D.
Oponent: Mgr. Branislav Bošanský, Ph.D.

Citační záznam

Citovat tuto práci

Citace dle ISO 690:

VAHALA, Jiří. \textit{Reinforcement Learning of Risk-Averse Policies in Markov Decision Processes}. Online. Diplomová práca. Brno: Masarykova univerzita, Faculty of Informatics. 2019. Dostupné z: https://theses.cz/id/eoq4da/.

@MastersThesis{Vahala2019thesis,
AUTHOR = "Vahala, Jiří",
TITLE = "Reinforcement Learning of Risk-Averse Policies in Markov Decision Processes [online]",
YEAR = "2019 [cit. 2024-11-11]",
TYPE = "Diplomová práca",
SCHOOL = "Masarykova univerzita, Faculty of InformaticsBrno",
NOTE = "SUPERVISOR: doc. RNDr. Tomáš Brázdil, Ph.D.",
URL = "https://theses.cz/id/eoq4da/",
}

@MastersThesis{Vahala2019thesis,
AUTHOR = {Vahala, Jiří},
TITLE = {Reinforcement Learning of Risk-Averse Policies in Markov Decision Processes},
YEAR = {2019},
TYPE = {Diplomová práca},
INSTITUTION = {Masarykova univerzita, Faculty of Informatics},
LOCATION = {Brno},
SUPERVISOR = {doc. RNDr. Tomáš Brázdil, Ph.D.},
URL = {https://theses.cz/id/eoq4da/},
URL_DATE = {2024-11-11},
}

{{Citace kvalifikační práce
 | příjmení = Vahala
 | jméno = Jiří
 | instituce = Masarykova univerzita, Faculty of Informatics
 | titul = Reinforcement Learning of Risk-Averse Policies in Markov Decision Processes
 | url = https://theses.cz/id/eoq4da/
 | typ práce = Diplomová práca
 | vedoucí = doc. RNDr. Tomáš Brázdil, Ph.D.
 | rok = 2019
 | počet stran =
 | strany =
 | citace = 2024-11-11
 | poznámka =
 | jazyk = 
}}

Plný text práce

Obsah online archivu závěrečné práce

Zveřejněno v Theses:

světu

Jak jinak získat přístup k textu

Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Odkaz na adresář do lokálního úložiště instituce

Masaryk University

Faculty of Informatics

Master programme / odbor:
Informatics / Artificial Intelligence and Natural Language Processing

Práce na příbuzné téma

Sampling Methods for Risk-Averse MDP Solvers
Václav Nevyhoštěný
Experimental Evaluation of Risk-Averse Planners
Martin Bendel
Sampling Methods for Risk-Averse MDP Solvers
Václav Nevyhoštěný
Extending the Synthesis Algorithm for Consumption MDPs with LTL Objectives
Dávid Meluš
Vacant taxi routing in Markov Decision Process (MDP)
Nurbulat Shektbayev