Zpětnovazebné učení pro POMDPs s využitím modelů

Smíšková, Lucie

Zpětnovazebné učení pro POMDPs s využitím modelů

but.committee	doc. Ing. Lukáš Burget, Ph.D. (předseda) Ing. Radek Kočí, Ph.D. (člen) Ing. Michal Hradiš, Ph.D. (člen) Ing. Jiří Hynek, Ph.D. (člen) Ing. Lukáš Kekely, Ph.D. (člen)	cs
but.defence	Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Komise ohodnotila práci stupněm 4F, protože práce má nízkou kvalitu textu a nedostatečný rozsah popisu experimentální části. Komise shledala nedostatky práce natolik závažné, že se práci rozhodla hodnotit jako nevyhovující.	cs
but.jazyk	angličtina (English)
but.program	Informační technologie	cs
but.result	práce nebyla úspěšně obhájena	cs
dc.contributor.advisor	Češka, Milan	en
dc.contributor.author	Smíšková, Lucie	en
dc.contributor.referee	Andriushchenko, Roman	en
dc.date.created	2024	cs
dc.description.abstract	Markovské rozhodovací procesy s částečným pozorováním nám umožňují modelovat systémy obsahující stavovou neurčitost. Jsou užitečné, pokud máme pouze částečné informace o stavech (tak zvaná pozorování). Cílem této práce bylo vyvinout metodu kombinující induktivní syntézu a zpětnovazebné učení k vytvoření co nejlepšího konečně stavového kontroléru. Tato metoda poté byla implementována jako rozšíření nástroje PAYNT.	en
dc.description.abstract	Partially observable Markov decision processes allow us to model systems containing state uncertainty. They are useful when we have only partial information about the states ( so called observations). The aim of this thesis was to develop a method combining inductive synthesis and reinforcement learning to develop the best possible finite-state controller. This method was then implemented as an extension to the tool PAYNT.	cs
dc.description.mark	D	cs
dc.identifier.citation	SMÍŠKOVÁ, L. Zpětnovazebné učení pro POMDPs s využitím modelů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.	cs
dc.identifier.other	156973	cs
dc.identifier.uri	http://hdl.handle.net/11012/247505
dc.language.iso	en	cs
dc.publisher	Vysoké učení technické v Brně. Fakulta informačních technologií	cs
dc.rights	Standardní licenční smlouva - přístup k plnému textu bez omezení	cs
dc.subject	Markovské rozhodovací procesy s částečným pozorováním	en
dc.subject	Konečně stavovový kontroler	en
dc.subject	syntéza	en
dc.subject	zpětnovazebné učení	en
dc.subject	rekurentní neuronové sítě	en
dc.subject	Partially observable Markov decision processes	cs
dc.subject	Finite State Controller	cs
dc.subject	Synthesis	cs
dc.subject	Reinforcement learning	cs
dc.subject	recurrent neural network	cs
dc.title	Zpětnovazebné učení pro POMDPs s využitím modelů	en
dc.title.alternative	Model-Based Reinforcement Learning for POMDPs	cs
dc.type	Text	cs
dc.type.driver	bachelorThesis	en
dc.type.evskp	bakalářská práce	cs
dcterms.dateAccepted	2024-06-12	cs
dcterms.modified	2024-08-22-13:05:20	cs
eprints.affiliatedInstitution.faculty	Fakulta informačních technologií	cs
sync.item.dbid	156973	en
sync.item.dbtype	ZP	en
sync.item.insts	2025.03.18 21:01:38	en
sync.item.modts	2025.01.15 11:57:19	en
thesis.discipline	Informační technologie	cs
thesis.grantor	Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav inteligentních systémů	cs
thesis.level	Bakalářský	cs
thesis.name	Bc.	cs

Files

Original bundle

Now showing 1 - 2 of 2

Name:: final-thesis.pdf
Size:: 998 KB
Format:: Adobe Portable Document Format
Description:: file final-thesis.pdf

Download

Name:: review_156973.html
Size:: 11.15 KB
Format:: Hypertext Markup Language
Description:: file review_156973.html

Download

Collections

2024