Bc. Jiří Vahala

Master's thesis

Reinforcement Learning of Risk-Averse Policies in Markov Decision Processes

Reinforcement Learning of Risk-Averse Policies in Markov Decision Processes
Anotácia:
Optimalizace průměrné kumulované odměny za nejistoty výsledku je stěžejní problém v mnoha aplikacích. Typické metody posilovaného učení se soustředí pouze na maximalizaci průmřené kumulované odměny bez jakéhokoli přihlížení k risku. Tato práce shrnuje již existujicí metody zaobírající se maximalizací nejistého výsledku a navrhuje nový algoritmus posilovaného učení Ralf0, který optimalizuje strategie …viac
Abstract:
Optimizing the expected cumulative reward under uncertainty is a crucial problem in many applications. A typical reinforcement learning approach is to maximize the expected cumulative reward without any sense of risk. In this thesis, we summarize already existing risk-averse learning techniques and introduce a new reinforcement learning algorithm Ralf0, which optimizes risk-averse policies without …viac
 
 
Jazyk práce: English
Datum vytvoření / odevzdání či podání práce: 20. 5. 2019

Obhajoba závěrečné práce

  • Obhajoba proběhla 18. 6. 2019
  • Vedúci: doc. RNDr. Tomáš Brázdil, Ph.D.
  • Oponent: Mgr. Branislav Bošanský, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masaryk University

Faculty of Informatics

Master programme / odbor:
Informatics / Artificial Intelligence and Natural Language Processing