Bc. Ján Petrák

Diplomová práce

Black-Box Hyperparameter Tuning for Risk-Constrained Reinforcement Learning Algorithm

Black-Box Hyperparameter Tuning for Risk-Constrained Reinforcement Learning Algorithm
Anotace:
Táto práca poskytuje prehľad novodobých prístupov k optimalizácii hyperparametrov, ako aj prehľad plánovacieho algoritmu s obmedzeným riskom RAlph, vrátane jeho veľkého množstva hyperparameterov. Práca pokračuje uvedením nevyhnutných súčastí potrebných pre optimalizáciu RAlpových hyperparametrov, ako je napríklad definíca cieľovej funkcie. Po krátkom popise implementácie, práca prezentuje výsledky …více
Abstract:
The thesis summarizes modern approaches to hyperparameter tuning, followed by a presentation of a risk-constrained reinforcement learning algorithm RAlph, including its wide range of hyperparameters that substantially influence its performance. The continuation of the thesis comprises the necessary setup for tuning RAlph's hyperparameters, such as the definition of an appropriate objective function …více
 
 
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 14. 12. 2021

Obhajoba závěrečné práce

  • Obhajoba proběhla 3. 2. 2022
  • Vedoucí: RNDr. Petr Novotný, Ph.D.
  • Oponent: doc. RNDr. Tomáš Brázdil, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masarykova univerzita

Fakulta informatiky

Magisterský studijní program / obor:
Počítačové systémy, komunikace a bezpečnost / Počítačové sítě a komunikace

Práce na příbuzné téma

  • Žádné práce na příbuzné téma.