Search Algorithms for Stochastic Grid-World Maze Navigation – Bc. Pavol Zaťko
Bc. Pavol Zaťko
Master's thesis
Search Algorithms for Stochastic Grid-World Maze Navigation
Search Algorithms for Stochastic Grid-World Maze Navigation
Anotácia:
Táto práca porovnáva schopnosť viacerých algoritmov vytvárať stratégie na prehľadávanie bludiska napriek tomu, že robot vykonávajúci akcie vybrané algoritmami sa môže dopúšťať chýb. Algoritmom bolo dovolené obmedzene dlho v bludisku trénovať, potom sa v ňom museli rýchlo dostať k čo najviac cieľom. Okrem iných algoritmov sa táto práca zameriava hlavne na Monte Carlo tree search a Q-learning a pokúša …viacAbstract:
This thesis compares the ability of multiple algorithms to create strategies for navigating a maze despite the errors of the robot executing the actions chosen by the algorithms. The algorithms were allowed to train in a maze for a limited amount of time, then they were expected to quickly reach as many goals in it as possible. Among other algorithms, this thesis focuses in particular on Monte Carlo …viac
Jazyk práce: English
Datum vytvoření / odevzdání či podání práce: 18. 5. 2021
Identifikátor:
https://is.muni.cz/th/ehu2k/
Obhajoba závěrečné práce
- Obhajoba proběhla 21. 6. 2021
- Vedúci: RNDr. Petr Novotný, Ph.D.
- Oponent: doc. RNDr. Tomáš Brázdil, Ph.D.
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsMaster programme / odbor:
Theoretical computer science / Algorithms and Computational Models
Práce na příbuzné téma
-
Monte Carlo Tree Search in Deep Reinforcement Learning Algorithms
Richard Schwarz -
Monte Carlo Tree Search in Verification of Markov Decision Processes
Ondřej Slámečka -
Navigace bludištěm pomocí prohledávání stromu metodou Monte Carlo
Ján Petrák -
Monte Carlo vyhledávácí techniky v deskových hrách
Radomír ŠKRABAL -
Navigace v neznámém a pevně daném prostředí pomocí deep reinforcement learning algoritmu
Gabriela HRUBÁ