Posilované učení pro hru typu Bomberman

but.committeedoc. RNDr. Pavel Smrž, Ph.D. (předseda) doc. RNDr. Jitka Kreslíková, CSc. (místopředseda) Ing. Ivana Burgetová, Ph.D. (člen) Ing. Aleš Smrčka, Ph.D. (člen) Ing. Josef Strnadel, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: Jaké by bylo nastavení toho nejjednoduššího prostředí, metod, jejich parametrů, abyste ověřil funkčnost systému a schopnosti úspěšného naučení agenta? Kde vidíte klíčové problémy ve Vašem postupu, že se Vám nepodařilo natrénovat úspěšného agenta? Co vás vedlo k výběru prostředí, které jste použil?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorHradiš, Michalcs
dc.contributor.authorAdamčiak, Jakubcs
dc.contributor.refereeBeran, Vítězslavcs
dc.date.created2022cs
dc.description.abstractCieľom tejto bakalárksej práce je návrh, implementácia a trénovanie modelov posilňovaného učenia na hru typu Bomberman. Je postavená na prostredí Bomberland od firmy CoderOne. Toto prostredie bolo vyvinuté za účelom vzdelávania a výskumu v odvetí umelej inteligencie. V tejto práci rozoberám rôzne nastavenia a problémy s implementovaním agenta do prostredia. Vyskúšal som 2 politiky (MLP a CNN), 2 algoritmy (PPO a A2C) a 5 druhov neurónových sietí pre extrakciu vlastností za pomoci knižníc stable baselines 3 a pytorch. Celkový čas trénovania týchto modelov bol dokopy 1207 reálnych hodín, 4168 strojových hodín a 271 miliónov herných krokov. Aj keď bolo trénovanie neúspešné, táto práca ukazuje proces implementácie modelu posilňovaného učenia do prostredia Gym.cs
dc.description.abstractThis bachelor's thesis aims to develop, implement and train reinforcement learning models for a Bomberman-type game. It is based on Bomberland environment from CoderOne. This environment was created for education and research in the field of artificial intelligence. In this thesis I tackle the settings and problems of implementing agent into the environment. I used 2 policies (MLP and CNN), 2 algorithms (PPO and A2C) and 5 setups of neural networks for feature extraction with the use of libraries stable baselines 3 and pytorch. Total training time resulted in 1207 real-world hours, 4168 computing hours and 271 milions of time steps. Although the training was not successful, this thesis shows the process of implementing a reinforcement learning model into a Gym environment.en
dc.description.markCcs
dc.identifier.citationADAMČIAK, J. Posilované učení pro hru typu Bomberman [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2022.cs
dc.identifier.other145321cs
dc.identifier.urihttp://hdl.handle.net/11012/207436
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectumelá inteligenciacs
dc.subjectAIcs
dc.subjectstrojové učeniecs
dc.subjectMLcs
dc.subjectposilované učeniecs
dc.subjectRLcs
dc.subjectkonvolučné neurónové sietecs
dc.subjectCNNcs
dc.subjectPPOcs
dc.subjectA2Ccs
dc.subjectpythoncs
dc.subjectstable baselines3cs
dc.subjectai-gymcs
dc.subjectpytorchcs
dc.subjecthrycs
dc.subjectbombermancs
dc.subjectartificial inteligenceen
dc.subjectAIen
dc.subjectmachine learningen
dc.subjectMLen
dc.subjectreinforcement learningen
dc.subjectRLen
dc.subjectconvolutional neural networksen
dc.subjectCNNen
dc.subjectPPOen
dc.subjectA2Cen
dc.subjectpythonen
dc.subjectstable baselines3en
dc.subjectai-gymen
dc.subjectpytorchen
dc.subjectgamesen
dc.subjectbombermanen
dc.titlePosilované učení pro hru typu Bombermancs
dc.title.alternativeReinforcement Learning for Bomberman Type Gameen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2022-06-16cs
dcterms.modified2023-06-12-22:49:39cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid145321en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 19:43:45en
sync.item.modts2025.01.17 10:54:56en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
7.12 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-25173_v.pdf
Size:
86.47 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-25173_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-25173_o.pdf
Size:
128.83 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-25173_o.pdf
Loading...
Thumbnail Image
Name:
review_145321.html
Size:
1.44 KB
Format:
Hypertext Markup Language
Description:
file review_145321.html
Collections