Bc. Martin Gendiar

Master's thesis

Deep Risk-Constrained Reinforcement Learning with Safety Critics

Deep Risk-Constrained Reinforcement Learning with Safety Critics
Abstract:
Táto diplomová práca sa zaoberá skúmaním zlepšovania bezpečnosti v rámci hlbokého spätnoväzobného učenia, najmä vo vysoko rizikových prostrediach. Hlavným prínosom tohto výskumu je vývoj a integrácia nového bezpečnostného kritika v rámci algoritmu proximal policy optimization. Táto inovácia má za cieľ vyvážiť maximalizáciu odmeny s minimalizáciou rizika, čím zabezpečuje bezpečnejšie rozhodovacie procesy …more
Abstract:
This thesis addresses the need for enhanced safety in deep reinforcement learning frameworks, particularly in high-risk environments. The central contribution of this research is the development and integration of a novel safety critic within the proximal policy optimization framework. This innovation aims to balance reward maximization with risk minimization, ensuring safer decision-making processes …more
 
 
Language used: English
Date on which the thesis was submitted / produced: 21. 5. 2024

Thesis defence

  • Date of defence: 18. 6. 2024
  • Supervisor: doc. RNDr. Petr Novotný, Ph.D.
  • Reader: doc. RNDr. Tomáš Brázdil, Ph.D.

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky