Synthesizing Resource-Shielded Policies for Partially Observable Markov Decision Processes – Bc. Šimon Brlej
Bc. Šimon Brlej
Bakalářská práce
Synthesizing Resource-Shielded Policies for Partially Observable Markov Decision Processes
Synthesizing Resource-Shielded Policies for Partially Observable Markov Decision Processes
Anotace:
Čiastočne pozorovateľné Markovove Rozhodovacie Procesy (POMDP) s obmedzenými zdrojmi umožňujú modelovanie prostredia, kde agent potrebuje sledovať zmenšujúci sa zdroj s neistými pozorovaniami jeho pozície v danom prostredí. Cieľom tejto práce bolo vytvoriť nástroj, v ktorom je implementovaný nový algoritmus pre optimalizáciu bezpečného dosahovania cieľov v cieľovo zameraných POMDP s obmedzenými zdrojmi …víceAbstract:
Partially Observable Markov Decision Processes with resource constraints allow modeling of an environment where the agent needs to keep track of a diminishing resource under uncertain observations of its position in the environment. The goal of this thesis was to create a tool implementing a new algorithm for optimizing safe goal-reachability in goal-oriented resource-constrained POMDPs by combining …více
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 19. 5. 2022
Identifikátor:
https://is.muni.cz/th/hvby2/
Obhajoba závěrečné práce
- Obhajoba proběhla 30. 6. 2022
- Vedoucí: RNDr. Petr Novotný, Ph.D.
- Oponent: RNDr. Vít Musil, Ph.D.
Citační záznam
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasarykova univerzita
Fakulta informatikyBakalářský studijní program / obor:
Informatika / Umělá inteligence a zpracování přirozeného jazyka