Experimental Evaluation of Risk-Averse Planners – Bc. Martin Bendel
Bc. Martin Bendel
Bakalářská práce
Experimental Evaluation of Risk-Averse Planners
Experimental Evaluation of Risk-Averse Planners
Anotace:
Strojové učenie je na popredí Informatiky. Algoritmy, ktoré využívajú posilované učenie, jedno z jeho paradigiem, bývajú etrémne náročné na beh. Potrebujú veľa zdrojov procesoru, veľa pamäte a veľa času na ich beh. To spomaľuje ich vývoj a používanie. Každý spôsob ako ich prácu zjednodušiť a urýchliť sú veľmi vyhľadávané a, ak je to možné, by byť využitý. Jeden z týchto algoritmov je nový Ralph0. Táto …víceAbstract:
Machine learning is at the forefront of Informatics. Algorithms using one of its paradigms, reinforcement learning, tend to be extremely difficult to run. Loads of CPU resources, big memory size and a lot of time to run are necessary. This results in slow development and usage. Any way to make their work simpler and faster is highly sought after and, if possible, should be used. One of these algorithms …více
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 25. 5. 2021
Identifikátor:
https://is.muni.cz/th/g9snw/
Obhajoba závěrečné práce
- Obhajoba proběhla 1. 7. 2021
- Vedoucí: RNDr. Petr Novotný, Ph.D.
- Oponent: doc. RNDr. Vojtěch Řehák, Ph.D.
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasarykova univerzita
Fakulta informatikyBakalářský studijní program / obor:
Aplikovaná informatika / Aplikovaná informatika
Práce na příbuzné téma
-
Monte Carlo Tree Search in Deep Reinforcement Learning Algorithms
Richard Schwarz -
Monte Carlo Tree Search in Verification of Markov Decision Processes
Ondřej Slámečka -
Navigace bludištěm pomocí prohledávání stromu metodou Monte Carlo
Ján Petrák -
Monte Carlo vyhledávácí techniky v deskových hrách
Radomír ŠKRABAL -
Monte Carlo Tree Search in Verification of Markov Decision Processes
Ondřej Slámečka -
Synthesizing Resource-Shielded Policies for Partially Observable Markov Decision Processes
Šimon Brlej -
Risk-Sensitive Reinforcement Learning
Marek Kadlčík -
Model Tuning with Reinforcement Learning from Human Advice
Thomas RIEDL