Reinforcement Learning for Optimizing Agent Strategies – Michal SEJÁK
Michal SEJÁK
Bakalářská práce
Reinforcement Learning for Optimizing Agent Strategies
Reinforcement Learning for Optimizing Agent Strategies
Abstract:
Agenti zpětnovazebného učení v současnosti patří mezi nejlepší způsoby, jak řešit obecné úlohy. Konkrétně algoritmus AlphaGo Zero (AZ) se v hraní mnoha deskových her drží v současnosti na nejvyšších příčkách. Nicméně, hodí se pouze na práci s deterministickými adverzálními prostředími a jako takový nenachází ve skutečném světě mnohá uplatnění, jelikož obdržení veškeré informace o běžných procesech …víceAbstract:
Reinforcement learning agents are one of the best methods of general problem solving. The algorithm AlphaGo Zero (AZ) in particular achieved state-of-the-art results in solving multiple board games. However, it is suited only for solving adversary deterministic environments and finds few real-life applications, as finding complete information about real-life processes is next to impossible. In our …více
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 7. 5. 2020
Zveřejnit od: 31. 12. 2999
Obhajoba závěrečné práce
- Vedoucí: Ing. Miloslav Konopík, Ph.D.
Citační záznam
Jak správně citovat práci
SEJÁK, Michal. Reinforcement Learning for Optimizing Agent Strategies. Plzeň, 2020. bakalářská práce (Bc.). ZÁPADOČESKÁ UNIVERZITA V PLZNI. Fakulta aplikovaných věd
Plný text práce
Právo: Autor si nepřeje zpřístupnění práce veřejnosti
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- Soubory jsou nedostupné.
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: ZÁPADOČESKÁ UNIVERZITA V PLZNI, Fakulta aplikovaných vědVázaný výtisk práce naleznete v Univerzitní knihovně ZČU, více na http://www.knihovna.zcu.cz/kvalifikacni-prace/
ZÁPADOČESKÁ UNIVERZITA V PLZNI
Fakulta aplikovaných vědBakalářský studijní program / obor:
Inženýrská informatika / Informatika
Práce na příbuzné téma
-
Využití zpětnovazebné učení a induktivní syntézy pro konstukci robustních kontroléru v POMDPs
David Hudák -
Emoční inteligence v pracovním prostředí
Aneta Kaslová -
VYUŽITÍ UMĚLÉ INTELIGENCE V MARKETINGU
Daria Lukyanenko -
Analyzing Cooperation in Organizations through the Agent-Based Modeling Approach
Josef Spurný -
Knowledge management as an agent of culture change
Alina Sabitova -
Adaptive Jenkins Agent Plugin
Simon Kobyda -
Multi agent model of epidemics with socially stratified social network
Juraj Krampl -
The role of populist attitudes in populist support: The key agent or a fifth wheel?
Veronika Dostálová