Zpětnovazebné učení pro POMDPs s využitím modelů
but.committee | prof. Ing. Adam Herout, Ph.D. (předseda) prof. Ing. Tomáš Hruška, CSc. (člen) Ing. Tomáš Milet, Ph.D. (člen) doc. Ing. Michal Bidlo, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen) | cs |
but.defence | Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm D. | cs |
but.jazyk | angličtina (English) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Češka, Milan | en |
dc.contributor.author | Smíšková, Lucie | en |
dc.contributor.referee | Andriushchenko, Roman | en |
dc.date.created | 2024 | cs |
dc.description.abstract | Markovské rozhodovací procesy s částečným pozorováním nám umožňují modelovat systémy obsahující stavovou neurčitost. Jsou užitečné, pokud máme pouze částečné informace o stavech (tak zvaná pozorování). Cílem této práce bylo vyvinout metodu kombinující induktivní syntézu a zpětnovazebné učení k vytvoření co nejlepšího konečně stavového kontroléru. Tato metoda poté byla implementována jako rozšíření nástroje PAYNT. | en |
dc.description.abstract | Partially observable Markov decision processes allow us to model systems containing state uncertainty. They are useful when we have only partial information about the states ( so called observations). The aim of this thesis was to develop a method combining inductive synthesis and reinforcement learning to develop the best possible finite-state controller. This method was then implemented as an extension to the tool PAYNT. | cs |
dc.description.mark | D | cs |
dc.identifier.citation | SMÍŠKOVÁ, L. Zpětnovazebné učení pro POMDPs s využitím modelů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024. | cs |
dc.identifier.other | 162598 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/249561 | |
dc.language.iso | en | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Markovské rozhodovací procesy s částečným pozorováním | en |
dc.subject | Konečně stavovový kontroler | en |
dc.subject | syntéza | en |
dc.subject | zpětnovazebné učení | en |
dc.subject | rekurentní neuronové sítě | en |
dc.subject | Partially observable Markov decision processes | cs |
dc.subject | Finite State Controller | cs |
dc.subject | Synthesis | cs |
dc.subject | Reinforcement learning | cs |
dc.subject | recurrent neural network | cs |
dc.title | Zpětnovazebné učení pro POMDPs s využitím modelů | en |
dc.title.alternative | Model-Based Reinforcement Learning for POMDPs | cs |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2024-08-22 | cs |
dcterms.modified | 2024-08-22-13:05:20 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 162598 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 21:02:11 | en |
sync.item.modts | 2025.01.15 11:52:20 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav inteligentních systémů | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |