Deep Risk-Constrained Reinforcement Learning with Safety Critics

Gendiar, Martin

EN SKPřihlásit se Přihlásit se (EduID)

Theses 46xb92

Deep Risk-Constrained Reinforcement Learning with Safety Critics – Bc. Martin Gendiar

Zpět na vyhledávání

Bc. Martin Gendiar

Diplomová práce

Deep Risk-Constrained Reinforcement Learning with Safety Critics

Anotace:

Táto diplomová práca sa zaoberá skúmaním zlepšovania bezpečnosti v rámci hlbokého spätnoväzobného učenia, najmä vo vysoko rizikových prostrediach. Hlavným prínosom tohto výskumu je vývoj a integrácia nového bezpečnostného kritika v rámci algoritmu proximal policy optimization. Táto inovácia má za cieľ vyvážiť maximalizáciu odmeny s minimalizáciou rizika, čím zabezpečuje bezpečnejšie rozhodovacie procesy …více

Abstract:

This thesis addresses the need for enhanced safety in deep reinforcement learning frameworks, particularly in high-risk environments. The central contribution of this research is the development and integration of a novel safety critic within the proximal policy optimization framework. This innovation aims to balance reward maximization with risk minimization, ensuring safer decision-making processes …více

Keywords

reinforcement learning safety critic proximal policy optimization risk actor-critic machine learning deep learning

Jazyk práce: angličtina

Datum vytvoření / odevzdání či podání práce: 21. 5. 2024

Identifikátor: https://is.muni.cz/th/pbhey/

Obhajoba závěrečné práce

Obhajoba proběhla 18. 6. 2024
Vedoucí: doc. RNDr. Petr Novotný, Ph.D.
Oponent: doc. RNDr. Tomáš Brázdil, Ph.D.

Citační záznam

Citovat tuto práci

Citace dle ISO 690:

GENDIAR, Martin. \textit{Deep Risk-Constrained Reinforcement Learning with Safety Critics}. Online. Diplomová práce. Brno: Masarykova univerzita, Fakulta informatiky. 2024. Dostupné z: https://theses.cz/id/46xb92/.

{{Citace kvalifikační práce
 | příjmení = Gendiar
 | jméno = Martin
 | instituce = Masarykova univerzita, Fakulta informatiky
 | titul = Deep Risk-Constrained Reinforcement Learning with Safety Critics
 | url = https://theses.cz/id/46xb92/
 | typ práce = Diplomová práce
 | vedoucí = doc. RNDr. Petr Novotný, Ph.D.
 | rok = 2024
 | počet stran =
 | strany =
 | citace = 2024-06-27
 | poznámka =
 | jazyk = 
}}

Plný text práce

Obsah online archivu závěrečné práce

Zveřejněno v Theses:

světu

Jak jinak získat přístup k textu

Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Odkaz na adresář do lokálního úložiště instituce

Masarykova univerzita

Fakulta informatiky

Magisterský studijní program / obor:
Umělá inteligence a zpracování dat / Strojové učení a umělá inteligence

Práce na příbuzné téma

Assessing Policy Optimization agents using Algorithmic IQ test
Petr Zeman
Risk-Sensitive Reinforcement Learning
Marek Kadlčík
Detection of Diabetic Retinopathy using Deep Learning and Transfer Learning Techniques with Oversampling to Address Imbalanced Dataset
Teodora RANĐELOVIĆ
Project of Managing Credit Risk of the Selected Portfolio of the Bank Risk Exposures by using the Methods of Basel III.
Galina Saenko
Risk management in internationally diversified portfolio and its foreign exchange risk mitigation
Anna Vasylchenko
Psychosocial determinants of antiretroviral therapy adherence amongst key populations (groups at high risk for HIV due to risk behaviors) in Abia State, Nigeria.
Osaro Solomon Efionayi
Risk Management of Chinese Enterprises
Yian Chen
Dynamics of Exchange Rates in Selected Emerging Markets in Risk-on/Risk-off Periods
David Ivanov

Všechny práce