Bc. Martin Gendiar

Diplomová práce

Deep Risk-Constrained Reinforcement Learning with Safety Critics

Deep Risk-Constrained Reinforcement Learning with Safety Critics
Anotace:
Táto diplomová práca sa zaoberá skúmaním zlepšovania bezpečnosti v rámci hlbokého spätnoväzobného učenia, najmä vo vysoko rizikových prostrediach. Hlavným prínosom tohto výskumu je vývoj a integrácia nového bezpečnostného kritika v rámci algoritmu proximal policy optimization. Táto inovácia má za cieľ vyvážiť maximalizáciu odmeny s minimalizáciou rizika, čím zabezpečuje bezpečnejšie rozhodovacie procesy …více
Abstract:
This thesis addresses the need for enhanced safety in deep reinforcement learning frameworks, particularly in high-risk environments. The central contribution of this research is the development and integration of a novel safety critic within the proximal policy optimization framework. This innovation aims to balance reward maximization with risk minimization, ensuring safer decision-making processes …více
 
 
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 21. 5. 2024

Obhajoba závěrečné práce

  • Obhajoba proběhla 18. 6. 2024
  • Vedoucí: doc. RNDr. Petr Novotný, Ph.D.
  • Oponent: doc. RNDr. Tomáš Brázdil, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky