Synthesizing Resource-Shielded Policies for Partially Observable Markov Decision Processes – Bc. Šimon Brlej
Bc. Šimon Brlej
Bachelor's thesis
Synthesizing Resource-Shielded Policies for Partially Observable Markov Decision Processes
Synthesizing Resource-Shielded Policies for Partially Observable Markov Decision Processes
Anotácia:
Čiastočne pozorovateľné Markovove Rozhodovacie Procesy (POMDP) s obmedzenými zdrojmi umožňujú modelovanie prostredia, kde agent potrebuje sledovať zmenšujúci sa zdroj s neistými pozorovaniami jeho pozície v danom prostredí. Cieľom tejto práce bolo vytvoriť nástroj, v ktorom je implementovaný nový algoritmus pre optimalizáciu bezpečného dosahovania cieľov v cieľovo zameraných POMDP s obmedzenými zdrojmi …viacAbstract:
Partially Observable Markov Decision Processes with resource constraints allow modeling of an environment where the agent needs to keep track of a diminishing resource under uncertain observations of its position in the environment. The goal of this thesis was to create a tool implementing a new algorithm for optimizing safe goal-reachability in goal-oriented resource-constrained POMDPs by combining …viac
Jazyk práce: English
Datum vytvoření / odevzdání či podání práce: 19. 5. 2022
Identifikátor:
https://is.muni.cz/th/hvby2/
Obhajoba závěrečné práce
- Obhajoba proběhla 30. 6. 2022
- Vedúci: RNDr. Petr Novotný, Ph.D.
- Oponent: RNDr. Vít Musil, Ph.D.
Citační záznam
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsBachelor programme / odbor:
Informatics / Artificial Intelligence and Natural Language Processing