Model Tuning with Reinforcement Learning from Human Advice – Thomas RIEDL
Thomas RIEDL
Master's thesis
Model Tuning with Reinforcement Learning from Human Advice
Abstract:
In this thesis, the concept of reinforcement learning from human advice is applied to the task of model tuning. The overall objective is to integrate evaluative feedback into the training process of reinforcement learning to fine-tune a Multi-Layer-Perceptron model according to specific stakeholder requirements. The concept is especially effective for natural, unconstrained requirements, which are …viac
Jazyk práce: English
Datum vytvoření / odevzdání či podání práce: 8. 2. 2024
Obhajoba závěrečné práce
- Vedúci: prof. Dr. Patrick Glauner
Citační záznam
Jak správně citovat práci
RIEDL, Thomas. Model Tuning with Reinforcement Learning from Human Advice. České Budějovice, 2024. diplomová práce (Mgr.). JIHOČESKÁ UNIVERZITA V ČESKÝCH BUDĚJOVICÍCH. Přírodovědecká fakulta
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- Soubory jsou nedostupné do 8. 2. 2027
- Po tomto datu bude práce dostupná: světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: JIHOČESKÁ UNIVERZITA V ČESKÝCH BUDĚJOVICÍCH, Přírodovědecká fakultaUNIVERSITY OF SOUTH BOHEMIA IN ČESKÉ BUDĚJOVICE
Faculty of ScienceMaster programme / odbor:
Artificial Intelligence and Data Science / Artificial Intelligence and Data Science
Práce na příbuzné téma
- Žádné práce na příbuzné téma.