Posilované učení pro 3D hry

but.committeeprof. Ing. Adam Herout, Ph.D. (předseda) doc. Mgr. Adam Rogalewicz, Ph.D. (místopředseda) doc. Ing. Michal Bidlo, Ph.D. (člen) doc. Ing. Martin Čadík, Ph.D. (člen) Ing. Zbyněk Křivka, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D. Otázky u obhajoby: Co ještě dosaženému řešení chybí do skutečně funkčního agenta hrajícího Doom? Jak byste pokračoval dále? Proč se postava ve videu, které jste promítal, pouze točí na místě? Ve vaši práci je větší množství grafů bez popisů os. Můžete prosím objasnit význam veličin?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorHradiš, Michalcs
dc.contributor.authorBeránek, Michalcs
dc.contributor.refereeHerout, Adamcs
dc.date.created2019cs
dc.description.abstractPráce se zabývá učením neuronové sítě na jednoduchých úlohách v prostředí 3D střílečky Doom, zprostředkovaném výzkumnou platformou ViZDoom. Hlavním cílem je vytvoření agenta, který se učí na několika úlohách zároveň. Použitým algoritmem posilovaného učení je Rainbow, který kombinuje několik vylepšení algoritmu DQN. Pro učení na více úlohách jsem navrhnul a otestoval dvě různé architektury sítě. Jedna z nich byla úspěšná a po relativně krátké době trénování dokázal agent získat téměř 50 % z maximální možné odměny. Klíčovým prvkem úspěchu je Embedding vrstva pro parametrický popis prostředí jednotlivých úloh. Hlavním zjištěním je, že Rainbow je schopen učit se v 3D prostředí a s pomocí Embedding vrstvy i na více úlohách zároveň.cs
dc.description.abstractThesis deals with neural network learning on simple tasks in 3D shooter Doom, mediated by research platform ViZDoom. The main goal is to create an agent, which is able to learn multiple tasks simultaneously. Reinforcement learning algorithm used to achieve this goal is called Rainbow, which combines several improvements of DQN algorithm. I proposed and experimented with two different architectures of neural network for learning multiple tasks. One of them was successful and after a relatively short period of learning it reached almost 50% of maximum possible reward. The key element of this achievement is an Embedding layer for parametric description of task environment. The main discovery is, that Rainbow is able to learn in 3D environment and with the help of Embedding layer, it is able to learn on multiple tasks simultaneously.en
dc.description.markDcs
dc.identifier.citationBERÁNEK, M. Posilované učení pro 3D hry [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2019.cs
dc.identifier.other122266cs
dc.identifier.urihttp://hdl.handle.net/11012/180305
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectneuronová síťcs
dc.subjectposilované učenícs
dc.subjectzpětnovazební učenícs
dc.subjectViZDoomcs
dc.subjectpřenesené učenícs
dc.subjectalgoritmus Rainbowcs
dc.subjectPyTorchcs
dc.subjectEmbedding vrstvacs
dc.subjectneural networken
dc.subjectreinforcement learningen
dc.subjectViZDoomen
dc.subjecttransfer learningen
dc.subjectRainbow algorithmen
dc.subjectPyTorchen
dc.subjectEmbedding layeren
dc.titlePosilované učení pro 3D hrycs
dc.title.alternativeReinforcement Learning for 3D Gamesen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2019-06-11cs
dcterms.modified2019-07-08-13:31:36cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid122266en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 19:26:37en
sync.item.modts2025.01.15 22:03:39en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
1.3 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-22181_v.pdf
Size:
85.78 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-22181_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-22181_o.pdf
Size:
87.92 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-22181_o.pdf
Loading...
Thumbnail Image
Name:
review_122266.html
Size:
1.42 KB
Format:
Hypertext Markup Language
Description:
file review_122266.html
Collections