Zpětnovazebné učení pro POMDPs s využitím modelů
but.committee | doc. Ing. Lukáš Burget, Ph.D. (předseda) Ing. Radek Kočí, Ph.D. (člen) Ing. Michal Hradiš, Ph.D. (člen) Ing. Jiří Hynek, Ph.D. (člen) Ing. Lukáš Kekely, Ph.D. (člen) | cs |
but.defence | Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Komise ohodnotila práci stupněm 4F, protože práce má nízkou kvalitu textu a nedostatečný rozsah popisu experimentální části. Komise shledala nedostatky práce natolik závažné, že se práci rozhodla hodnotit jako nevyhovující. | cs |
but.jazyk | angličtina (English) | |
but.program | Informační technologie | cs |
but.result | práce nebyla úspěšně obhájena | cs |
dc.contributor.advisor | Češka, Milan | en |
dc.contributor.author | Smíšková, Lucie | en |
dc.contributor.referee | Andriushchenko, Roman | en |
dc.date.created | 2024 | cs |
dc.description.abstract | Markovské rozhodovací procesy s částečným pozorováním nám umožňují modelovat systémy obsahující stavovou neurčitost. Jsou užitečné, pokud máme pouze částečné informace o stavech (tak zvaná pozorování). Cílem této práce bylo vyvinout metodu kombinující induktivní syntézu a zpětnovazebné učení k vytvoření co nejlepšího konečně stavového kontroléru. Tato metoda poté byla implementována jako rozšíření nástroje PAYNT. | en |
dc.description.abstract | Partially observable Markov decision processes allow us to model systems containing state uncertainty. They are useful when we have only partial information about the states ( so called observations). The aim of this thesis was to develop a method combining inductive synthesis and reinforcement learning to develop the best possible finite-state controller. This method was then implemented as an extension to the tool PAYNT. | cs |
dc.description.mark | D | cs |
dc.identifier.citation | SMÍŠKOVÁ, L. Zpětnovazebné učení pro POMDPs s využitím modelů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024. | cs |
dc.identifier.other | 156973 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/247505 | |
dc.language.iso | en | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Markovské rozhodovací procesy s částečným pozorováním | en |
dc.subject | Konečně stavovový kontroler | en |
dc.subject | syntéza | en |
dc.subject | zpětnovazebné učení | en |
dc.subject | rekurentní neuronové sítě | en |
dc.subject | Partially observable Markov decision processes | cs |
dc.subject | Finite State Controller | cs |
dc.subject | Synthesis | cs |
dc.subject | Reinforcement learning | cs |
dc.subject | recurrent neural network | cs |
dc.title | Zpětnovazebné učení pro POMDPs s využitím modelů | en |
dc.title.alternative | Model-Based Reinforcement Learning for POMDPs | cs |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2024-06-12 | cs |
dcterms.modified | 2024-08-22-13:05:20 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 156973 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 21:01:38 | en |
sync.item.modts | 2025.01.15 11:57:19 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav inteligentních systémů | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |