Search Algorithms for Stochastic Grid-World Maze Navigation – Bc. Pavol Zaťko
Bc. Pavol Zaťko
Diplomová práce
Search Algorithms for Stochastic Grid-World Maze Navigation
Search Algorithms for Stochastic Grid-World Maze Navigation
Anotace:
Táto práca porovnáva schopnosť viacerých algoritmov vytvárať stratégie na prehľadávanie bludiska napriek tomu, že robot vykonávajúci akcie vybrané algoritmami sa môže dopúšťať chýb. Algoritmom bolo dovolené obmedzene dlho v bludisku trénovať, potom sa v ňom museli rýchlo dostať k čo najviac cieľom. Okrem iných algoritmov sa táto práca zameriava hlavne na Monte Carlo tree search a Q-learning a pokúša …víceAbstract:
This thesis compares the ability of multiple algorithms to create strategies for navigating a maze despite the errors of the robot executing the actions chosen by the algorithms. The algorithms were allowed to train in a maze for a limited amount of time, then they were expected to quickly reach as many goals in it as possible. Among other algorithms, this thesis focuses in particular on Monte Carlo …více
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 18. 5. 2021
Identifikátor:
https://is.muni.cz/th/ehu2k/
Obhajoba závěrečné práce
- Obhajoba proběhla 21. 6. 2021
- Vedoucí: RNDr. Petr Novotný, Ph.D.
- Oponent: doc. RNDr. Tomáš Brázdil, Ph.D.
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasarykova univerzita
Fakulta informatikyMagisterský studijní program / obor:
Teoretická informatika / Algoritmy výpočetních modelů
Práce na příbuzné téma
-
Monte Carlo Tree Search in Deep Reinforcement Learning Algorithms
Richard Schwarz -
Monte Carlo Tree Search in Verification of Markov Decision Processes
Ondřej Slámečka -
Navigace bludištěm pomocí prohledávání stromu metodou Monte Carlo
Ján Petrák -
Monte Carlo vyhledávácí techniky v deskových hrách
Radomír ŠKRABAL -
Navigace v neznámém a pevně daném prostředí pomocí deep reinforcement learning algoritmu
Gabriela HRUBÁ