Reinforcement Learning for Optimizing Agent Strategies – Michal SEJÁK
Michal SEJÁK
Bachelor's thesis
Reinforcement Learning for Optimizing Agent Strategies
Reinforcement Learning for Optimizing Agent Strategies
Abstract:
Agenti zpětnovazebného učení v současnosti patří mezi nejlepší způsoby, jak řešit obecné úlohy. Konkrétně algoritmus AlphaGo Zero (AZ) se v hraní mnoha deskových her drží v současnosti na nejvyšších příčkách. Nicméně, hodí se pouze na práci s deterministickými adverzálními prostředími a jako takový nenachází ve skutečném světě mnohá uplatnění, jelikož obdržení veškeré informace o běžných procesech …moreAbstract:
Reinforcement learning agents are one of the best methods of general problem solving. The algorithm AlphaGo Zero (AZ) in particular achieved state-of-the-art results in solving multiple board games. However, it is suited only for solving adversary deterministic environments and finds few real-life applications, as finding complete information about real-life processes is next to impossible. In our …more
Language used: English
Date on which the thesis was submitted / produced: 7. 5. 2020
Accessible from:: 31. 12. 2999
Thesis defence
- Supervisor: Ing. Miloslav Konopík, Ph.D.
Citation record
The right form of listing the thesis as a source quoted
SEJÁK, Michal. Reinforcement Learning for Optimizing Agent Strategies. Plzeň, 2020. bakalářská práce (Bc.). ZÁPADOČESKÁ UNIVERZITA V PLZNI. Fakulta aplikovaných věd
Full text of thesis
Accessibility: Autor si nepřeje zpřístupnění práce veřejnosti
Contents of on-line thesis archive
Published in Theses:- Soubory jsou nedostupné.
Other ways of accessing the text
Institution archiving the thesis and making it accessible: ZÁPADOČESKÁ UNIVERZITA V PLZNI, Fakulta aplikovaných vědVázaný výtisk práce naleznete v Univerzitní knihovně ZČU, více na http://www.knihovna.zcu.cz/kvalifikacni-prace/
University of West Bohemia
Faculty of Applied SciencesBachelor programme / field:
Computer Science and Engineering / Information Technologies
Theses on a related topic
-
Využití zpětnovazebné učení a induktivní syntézy pro konstukci robustních kontroléru v POMDPs
David Hudák -
Emoční inteligence v pracovním prostředí
Aneta Kaslová -
VYUŽITÍ UMĚLÉ INTELIGENCE V MARKETINGU
Daria Lukyanenko -
Analyzing Cooperation in Organizations through the Agent-Based Modeling Approach
Josef Spurný -
Adaptive Jenkins Agent Plugin
Simon Kobyda -
Knowledge management as an agent of culture change
Alina Sabitova -
Multi agent model of epidemics with socially stratified social network
Juraj Krampl -
The role of populist attitudes in populist support: The key agent or a fifth wheel?
Veronika Dostálová