Rozhodovací stromy pro rodiny Markovských rozhodovacích procesů
but.committee | doc. Mgr. Adam Rogalewicz, Ph.D. (předseda) doc. RNDr. Pavel Smrž, Ph.D. (člen) doc. Ing. František Zbořil, CSc. (člen) Dr. Ing. Petr Peringer (člen) Ing. Aleš Smrčka, Ph.D. (člen) Ing. Ondřej Lengál, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. | cs |
but.jazyk | angličtina (English) | |
but.program | Informační technologie a umělá inteligence | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Češka, Milan | en |
dc.contributor.author | Dokoupil, Ladislav | en |
dc.contributor.referee | Macák, Filip | en |
dc.date.accessioned | 2025-06-27T04:00:17Z | |
dc.date.available | 2025-06-27T04:00:17Z | |
dc.date.created | 2025 | cs |
dc.description.abstract | Markovské rozhodovací procesy (MDP) poskytují základní rámec pro sekvenční rozhodování v podmínkách nejistoty. Praktické systémy však často zahrnují strukturální variace, které nejlépe modelují rodiny MDP (f-MDP). Výzvou je syntéza kompaktních a interpretovatelných kontrolerů pokrývajících celou rodinu, jelikož existující přístupy mohou být příliš konzervativní a vést k rozsáhlým, obtížně interpretovatelným kontrolerům. Tato práce představuje nové techniky k řešení těchto problémů. Navrhujeme dva klíčové, ortogonální přínosy: (1) heuristický přístup pro generování minimálních kontrolerů z původních kontrolerů a (2) novou transformaci, která redukuje problém rodiny MDP na problém klasického MDP pomocí herní abstrakce, jež modeluje nejhorší možné systémové variace. Tato transformace umožňuje syntetizovat alternativní kontrolery s využitím stávajících nástrojů pro syntézu, a to při zachování korektnosti. Dále zavádíme sjednocenou reprezentaci pomocí rozhodovacích stromů, zahrnující strom mapování kandidátů a sjednocený strom kontrolerů. Tato struktura poskytuje globálně kompaktní a interpretovatelné řešení pro celou f-MDP, přičemž minimalizuje redundanci oproti správě samostatných, často tabulárních kontrolerů. Naše metody, implementované jako rozšíření nástroje PAYNT, experimentálně prokazují výrazné zmenšení velikosti kontrolerů a zlepšení jejich interpretovatelnosti, často s přijatelným kompromisem v čase syntézy. | en |
dc.description.abstract | Markov Decision Processes (MDPs) provide a fundamental framework for sequential decision making under uncertainty. However, practical systems often involve structural variations, best modeled by families of MDPs (f-MDPs). The challenge lies in synthesizing compact and interpretable policies covering the entire family, as existing approaches can be overly conservative, yielding large, difficult-to-interpret policies. This thesis presents novel techniques to address these issues. We propose two key orthogonal contributions: (1) a heuristic-based pruning approach to generate minimal controllers from the initial policies, and (2) a novel transformation that reduces family to an MDP problem, by leveraging a game abstraction to model worst-case system variations. Such transformation allows us to synthesize alternative policies using existing synthesis tools, while maintaining correctness. We further introduce a unified decision tree representation, comprising a candidate mapping tree and a unified policy tree. This structure provides a globally compact and interpretable solution for the entire f-MDP, minimizing redundancy compared to managing separate, often tabular, controllers. Implemented as an extension to the PAYNT tool, our methods are experimentally shown to substantially reduce controller size and improve interpretability, often with an acceptable trade-off in synthesis time. | cs |
dc.description.mark | A | cs |
dc.identifier.citation | DOKOUPIL, L. Rozhodovací stromy pro rodiny Markovských rozhodovacích procesů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025. | cs |
dc.identifier.other | 162927 | cs |
dc.identifier.uri | https://hdl.handle.net/11012/255109 | |
dc.language.iso | en | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Markovovy rozhodovací procesy | en |
dc.subject | Rodiny MDP | en |
dc.subject | Rozhodovací stromy | en |
dc.subject | Kompaktní kontrolery | en |
dc.subject | Interpretovatelné kontrolery | en |
dc.subject | Optimalizace kontrolerů | en |
dc.subject | Stochastické hry | en |
dc.subject | Markov Decision Processes | cs |
dc.subject | Families of MDPs | cs |
dc.subject | Decision Trees | cs |
dc.subject | Compact Controllers | cs |
dc.subject | Interpretable Controllers | cs |
dc.subject | Policy Optimization | cs |
dc.subject | Stochastic Games | cs |
dc.title | Rozhodovací stromy pro rodiny Markovských rozhodovacích procesů | en |
dc.title.alternative | Decision trees for multi-environment Markov Decision Processes | cs |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2025-06-26 | cs |
dcterms.modified | 2025-06-26-09:22:57 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 162927 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.06.27 06:00:17 | en |
sync.item.modts | 2025.06.27 05:34:05 | en |
thesis.discipline | Matematické metody | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav inteligentních systémů | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |