Experimental Evaluation of Risk-Averse Planners – Bc. Martin Bendel
Bc. Martin Bendel
Bachelor's thesis
Experimental Evaluation of Risk-Averse Planners
Experimental Evaluation of Risk-Averse Planners
Anotácia:
Strojové učenie je na popredí Informatiky. Algoritmy, ktoré využívajú posilované učenie, jedno z jeho paradigiem, bývajú etrémne náročné na beh. Potrebujú veľa zdrojov procesoru, veľa pamäte a veľa času na ich beh. To spomaľuje ich vývoj a používanie. Každý spôsob ako ich prácu zjednodušiť a urýchliť sú veľmi vyhľadávané a, ak je to možné, by byť využitý. Jeden z týchto algoritmov je nový Ralph0. Táto …viacAbstract:
Machine learning is at the forefront of Informatics. Algorithms using one of its paradigms, reinforcement learning, tend to be extremely difficult to run. Loads of CPU resources, big memory size and a lot of time to run are necessary. This results in slow development and usage. Any way to make their work simpler and faster is highly sought after and, if possible, should be used. One of these algorithms …viac
Jazyk práce: English
Datum vytvoření / odevzdání či podání práce: 25. 5. 2021
Identifikátor:
https://is.muni.cz/th/g9snw/
Obhajoba závěrečné práce
- Obhajoba proběhla 1. 7. 2021
- Vedúci: RNDr. Petr Novotný, Ph.D.
- Oponent: doc. RNDr. Vojtěch Řehák, Ph.D.
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsBachelor programme / odbor:
Applied Informatics / Applied Informatics
Práce na příbuzné téma
-
Monte Carlo Tree Search in Deep Reinforcement Learning Algorithms
Richard Schwarz -
Monte Carlo Tree Search in Verification of Markov Decision Processes
Ondřej Slámečka -
Navigace bludištěm pomocí prohledávání stromu metodou Monte Carlo
Ján Petrák -
Monte Carlo vyhledávácí techniky v deskových hrách
Radomír ŠKRABAL -
Monte Carlo Tree Search in Verification of Markov Decision Processes
Ondřej Slámečka -
Synthesizing Resource-Shielded Policies for Partially Observable Markov Decision Processes
Šimon Brlej -
Risk-Sensitive Reinforcement Learning
Marek Kadlčík -
Model Tuning with Reinforcement Learning from Human Advice
Thomas RIEDL