Experimental Evaluation of Risk-Averse Planners – Bc. Martin Bendel
Bc. Martin Bendel
Bachelor's thesis
Experimental Evaluation of Risk-Averse Planners
Experimental Evaluation of Risk-Averse Planners
Abstract:
Strojové učenie je na popredí Informatiky. Algoritmy, ktoré využívajú posilované učenie, jedno z jeho paradigiem, bývajú etrémne náročné na beh. Potrebujú veľa zdrojov procesoru, veľa pamäte a veľa času na ich beh. To spomaľuje ich vývoj a používanie. Každý spôsob ako ich prácu zjednodušiť a urýchliť sú veľmi vyhľadávané a, ak je to možné, by byť využitý. Jeden z týchto algoritmov je nový Ralph0. Táto …moreAbstract:
Machine learning is at the forefront of Informatics. Algorithms using one of its paradigms, reinforcement learning, tend to be extremely difficult to run. Loads of CPU resources, big memory size and a lot of time to run are necessary. This results in slow development and usage. Any way to make their work simpler and faster is highly sought after and, if possible, should be used. One of these algorithms …more
Language used: English
Date on which the thesis was submitted / produced: 25. 5. 2021
Identifier:
https://is.muni.cz/th/g9snw/
Thesis defence
- Date of defence: 1. 7. 2021
- Supervisor: RNDr. Petr Novotný, Ph.D.
- Reader: doc. RNDr. Vojtěch Řehák, Ph.D.
Citation record
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsBachelor programme / field:
Applied Informatics / Applied Informatics
Theses on a related topic
-
Monte Carlo Tree Search in Deep Reinforcement Learning Algorithms
Richard Schwarz -
Monte Carlo Tree Search in Verification of Markov Decision Processes
Ondřej Slámečka -
Navigace bludištěm pomocí prohledávání stromu metodou Monte Carlo
Ján Petrák -
Monte Carlo vyhledávácí techniky v deskových hrách
Radomír ŠKRABAL -
Monte Carlo Tree Search in Verification of Markov Decision Processes
Ondřej Slámečka -
Synthesizing Resource-Shielded Policies for Partially Observable Markov Decision Processes
Šimon Brlej -
Risk-Sensitive Reinforcement Learning
Marek Kadlčík -
Model Tuning with Reinforcement Learning from Human Advice
Thomas RIEDL