Rozhodovací stromy pro rodiny Markovských rozhodovacích procesů

Dokoupil, Ladislav

Rozhodovací stromy pro rodiny Markovských rozhodovacích procesů

but.committee	doc. Mgr. Adam Rogalewicz, Ph.D. (předseda) doc. RNDr. Pavel Smrž, Ph.D. (člen) doc. Ing. František Zbořil, CSc. (člen) Dr. Ing. Petr Peringer (člen) Ing. Aleš Smrčka, Ph.D. (člen) Ing. Ondřej Lengál, Ph.D. (člen)	cs
but.defence	Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.	cs
but.jazyk	angličtina (English)
but.program	Informační technologie a umělá inteligence	cs
but.result	práce byla úspěšně obhájena	cs
dc.contributor.advisor	Češka, Milan	en
dc.contributor.author	Dokoupil, Ladislav	en
dc.contributor.referee	Macák, Filip	en
dc.date.created	2025	cs
dc.description.abstract	Markovské rozhodovací procesy (MDP) poskytují základní rámec pro sekvenční rozhodování v podmínkách nejistoty. Praktické systémy však často zahrnují strukturální variace, které nejlépe modelují rodiny MDP (f-MDP). Výzvou je syntéza kompaktních a interpretovatelných kontrolerů pokrývajících celou rodinu, jelikož existující přístupy mohou být příliš konzervativní a vést k rozsáhlým, obtížně interpretovatelným kontrolerům. Tato práce představuje nové techniky k řešení těchto problémů. Navrhujeme dva klíčové, ortogonální přínosy: (1) heuristický přístup pro generování minimálních kontrolerů z původních kontrolerů a (2) novou transformaci, která redukuje problém rodiny MDP na problém klasického MDP pomocí herní abstrakce, jež modeluje nejhorší možné systémové variace. Tato transformace umožňuje syntetizovat alternativní kontrolery s využitím stávajících nástrojů pro syntézu, a to při zachování korektnosti. Dále zavádíme sjednocenou reprezentaci pomocí rozhodovacích stromů, zahrnující strom mapování kandidátů a sjednocený strom kontrolerů. Tato struktura poskytuje globálně kompaktní a interpretovatelné řešení pro celou f-MDP, přičemž minimalizuje redundanci oproti správě samostatných, často tabulárních kontrolerů. Naše metody, implementované jako rozšíření nástroje PAYNT, experimentálně prokazují výrazné zmenšení velikosti kontrolerů a zlepšení jejich interpretovatelnosti, často s přijatelným kompromisem v čase syntézy.	en
dc.description.abstract	Markov Decision Processes (MDPs) provide a fundamental framework for sequential decision making under uncertainty. However, practical systems often involve structural variations, best modeled by families of MDPs (f-MDPs). The challenge lies in synthesizing compact and interpretable policies covering the entire family, as existing approaches can be overly conservative, yielding large, difficult-to-interpret policies. This thesis presents novel techniques to address these issues. We propose two key orthogonal contributions: (1) a heuristic-based pruning approach to generate minimal controllers from the initial policies, and (2) a novel transformation that reduces family to an MDP problem, by leveraging a game abstraction to model worst-case system variations. Such transformation allows us to synthesize alternative policies using existing synthesis tools, while maintaining correctness. We further introduce a unified decision tree representation, comprising a candidate mapping tree and a unified policy tree. This structure provides a globally compact and interpretable solution for the entire f-MDP, minimizing redundancy compared to managing separate, often tabular, controllers. Implemented as an extension to the PAYNT tool, our methods are experimentally shown to substantially reduce controller size and improve interpretability, often with an acceptable trade-off in synthesis time.	cs
dc.description.mark	A	cs
dc.identifier.citation	DOKOUPIL, L. Rozhodovací stromy pro rodiny Markovských rozhodovacích procesů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.	cs
dc.identifier.other	162927	cs
dc.identifier.uri	http://hdl.handle.net/11012/255109
dc.language.iso	en	cs
dc.publisher	Vysoké učení technické v Brně. Fakulta informačních technologií	cs
dc.rights	Standardní licenční smlouva - přístup k plnému textu bez omezení	cs
dc.subject	Markovovy rozhodovací procesy	en
dc.subject	Rodiny MDP	en
dc.subject	Rozhodovací stromy	en
dc.subject	Kompaktní kontrolery	en
dc.subject	Interpretovatelné kontrolery	en
dc.subject	Optimalizace kontrolerů	en
dc.subject	Stochastické hry	en
dc.subject	Markov Decision Processes	cs
dc.subject	Families of MDPs	cs
dc.subject	Decision Trees	cs
dc.subject	Compact Controllers	cs
dc.subject	Interpretable Controllers	cs
dc.subject	Policy Optimization	cs
dc.subject	Stochastic Games	cs
dc.title	Rozhodovací stromy pro rodiny Markovských rozhodovacích procesů	en
dc.title.alternative	Decision trees for multi-environment Markov Decision Processes	cs
dc.type	Text	cs
dc.type.driver	masterThesis	en
dc.type.evskp	diplomová práce	cs
dcterms.dateAccepted	2025-06-26	cs
dcterms.modified	2025-06-26-09:22:57	cs
eprints.affiliatedInstitution.faculty	Fakulta informačních technologií	cs
sync.item.dbid	162927	en
sync.item.dbtype	ZP	en
sync.item.insts	2025.08.27 02:04:35	en
sync.item.modts	2025.08.26 20:11:49	en
thesis.discipline	Matematické metody	cs
thesis.grantor	Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav inteligentních systémů	cs
thesis.level	Inženýrský	cs
thesis.name	Ing.	cs

Files

Original bundle

Now showing 1 - 2 of 2

Name:: final-thesis.pdf
Size:: 1.32 MB
Format:: Adobe Portable Document Format
Description:: file final-thesis.pdf

Download

Name:: review_162927.html
Size:: 11.91 KB
Format:: Hypertext Markup Language
Description:: file review_162927.html

Download

Collections

2025