Model Tuning with Reinforcement Learning from Human Advice

RIEDL, Thomas

CS ENPrihlásiť sa Prihlásiť sa (EduID)

Theses foxaof

Model Tuning with Reinforcement Learning from Human Advice – Thomas RIEDL

Zpět na vyhledávání

Thomas RIEDL

Master's thesis

Model Tuning with Reinforcement Learning from Human Advice

Abstract:

In this thesis, the concept of reinforcement learning from human advice is applied to the task of model tuning. The overall objective is to integrate evaluative feedback into the training process of reinforcement learning to fine-tune a Multi-Layer-Perceptron model according to specific stakeholder requirements. The concept is especially effective for natural, unconstrained requirements, which are …viac

Jazyk práce: English

Datum vytvoření / odevzdání či podání práce: 8. 2. 2024

Obhajoba závěrečné práce

Vedúci: prof. Dr. Patrick Glauner

Citační záznam

Citovat tuto práci

Citace dle ISO 690:

RIEDL, Thomas. \textit{Model Tuning with Reinforcement Learning from Human Advice}. Online. Diplomová práca. České Budějovice: Jihočeská univerzita v Českých Budějovicích, Faculty of Science. 2024. Dostupné z: https://theses.cz/id/foxaof/.

@MastersThesis{RIEDL2024thesis,
AUTHOR = "RIEDL, Thomas",
TITLE = "Model Tuning with Reinforcement Learning from Human Advice [online]",
YEAR = "2024 [cit. 2024-05-28]",
TYPE = "Diplomová práca",
SCHOOL = "Jihočeská univerzita v Českých Budějovicích, Faculty of ScienceČeské Budějovice",
NOTE = "SUPERVISOR: prof. Dr. Patrick Glauner",
URL = "https://theses.cz/id/foxaof/",
}

@MastersThesis{RIEDL2024thesis,
AUTHOR = {RIEDL, Thomas},
TITLE = {Model Tuning with Reinforcement Learning from Human Advice},
YEAR = {2024},
TYPE = {Diplomová práca},
INSTITUTION = {Jihočeská univerzita v Českých Budějovicích, Faculty of Science},
LOCATION = {České Budějovice},
SUPERVISOR = {prof. Dr. Patrick Glauner},
URL = {https://theses.cz/id/foxaof/},
URL_DATE = {2024-05-28},
}

{{Citace kvalifikační práce
 | příjmení = RIEDL
 | jméno = Thomas
 | instituce = Jihočeská univerzita v Českých Budějovicích, Faculty of Science
 | titul = Model Tuning with Reinforcement Learning from Human Advice
 | url = https://theses.cz/id/foxaof/
 | typ práce = Diplomová práca
 | vedoucí = prof. Dr. Patrick Glauner
 | rok = 2024
 | počet stran =
 | strany =
 | citace = 2024-05-28
 | poznámka =
 | jazyk = 
}}

Jak správně citovat práci

RIEDL, Thomas. Model Tuning with Reinforcement Learning from Human Advice. České Budějovice, 2024. diplomová práce (Mgr.). JIHOČESKÁ UNIVERZITA V ČESKÝCH BUDĚJOVICÍCH. Přírodovědecká fakulta

Plný text práce

Obsah online archivu závěrečné práce

Zveřejněno v Theses:

Soubory jsou nedostupné do 8. 2. 2027
Po tomto datu bude práce dostupná: světu

Jak jinak získat přístup k textu

Instituce archivující a zpřístupňující práci: JIHOČESKÁ UNIVERZITA V ČESKÝCH BUDĚJOVICÍCH, Přírodovědecká fakulta

Odkaz na soubor do lokálního úložiště instituce

UNIVERSITY OF SOUTH BOHEMIA IN ČESKÉ BUDĚJOVICE

Faculty of Science

Master programme / odbor:
Artificial Intelligence and Data Science / Artificial Intelligence and Data Science

Práce na příbuzné téma

Žádné práce na příbuzné téma.