Posilované učení pro hru typu Bomberman
but.committee | doc. RNDr. Pavel Smrž, Ph.D. (předseda) doc. RNDr. Jitka Kreslíková, CSc. (místopředseda) Ing. Ivana Burgetová, Ph.D. (člen) Ing. Aleš Smrčka, Ph.D. (člen) Ing. Josef Strnadel, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: Jaké by bylo nastavení toho nejjednoduššího prostředí, metod, jejich parametrů, abyste ověřil funkčnost systému a schopnosti úspěšného naučení agenta? Kde vidíte klíčové problémy ve Vašem postupu, že se Vám nepodařilo natrénovat úspěšného agenta? Co vás vedlo k výběru prostředí, které jste použil? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Hradiš, Michal | cs |
dc.contributor.author | Adamčiak, Jakub | cs |
dc.contributor.referee | Beran, Vítězslav | cs |
dc.date.created | 2022 | cs |
dc.description.abstract | Cieľom tejto bakalárksej práce je návrh, implementácia a trénovanie modelov posilňovaného učenia na hru typu Bomberman. Je postavená na prostredí Bomberland od firmy CoderOne. Toto prostredie bolo vyvinuté za účelom vzdelávania a výskumu v odvetí umelej inteligencie. V tejto práci rozoberám rôzne nastavenia a problémy s implementovaním agenta do prostredia. Vyskúšal som 2 politiky (MLP a CNN), 2 algoritmy (PPO a A2C) a 5 druhov neurónových sietí pre extrakciu vlastností za pomoci knižníc stable baselines 3 a pytorch. Celkový čas trénovania týchto modelov bol dokopy 1207 reálnych hodín, 4168 strojových hodín a 271 miliónov herných krokov. Aj keď bolo trénovanie neúspešné, táto práca ukazuje proces implementácie modelu posilňovaného učenia do prostredia Gym. | cs |
dc.description.abstract | This bachelor's thesis aims to develop, implement and train reinforcement learning models for a Bomberman-type game. It is based on Bomberland environment from CoderOne. This environment was created for education and research in the field of artificial intelligence. In this thesis I tackle the settings and problems of implementing agent into the environment. I used 2 policies (MLP and CNN), 2 algorithms (PPO and A2C) and 5 setups of neural networks for feature extraction with the use of libraries stable baselines 3 and pytorch. Total training time resulted in 1207 real-world hours, 4168 computing hours and 271 milions of time steps. Although the training was not successful, this thesis shows the process of implementing a reinforcement learning model into a Gym environment. | en |
dc.description.mark | C | cs |
dc.identifier.citation | ADAMČIAK, J. Posilované učení pro hru typu Bomberman [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2022. | cs |
dc.identifier.other | 145321 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/207436 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | umelá inteligencia | cs |
dc.subject | AI | cs |
dc.subject | strojové učenie | cs |
dc.subject | ML | cs |
dc.subject | posilované učenie | cs |
dc.subject | RL | cs |
dc.subject | konvolučné neurónové siete | cs |
dc.subject | CNN | cs |
dc.subject | PPO | cs |
dc.subject | A2C | cs |
dc.subject | python | cs |
dc.subject | stable baselines3 | cs |
dc.subject | ai-gym | cs |
dc.subject | pytorch | cs |
dc.subject | hry | cs |
dc.subject | bomberman | cs |
dc.subject | artificial inteligence | en |
dc.subject | AI | en |
dc.subject | machine learning | en |
dc.subject | ML | en |
dc.subject | reinforcement learning | en |
dc.subject | RL | en |
dc.subject | convolutional neural networks | en |
dc.subject | CNN | en |
dc.subject | PPO | en |
dc.subject | A2C | en |
dc.subject | python | en |
dc.subject | stable baselines3 | en |
dc.subject | ai-gym | en |
dc.subject | pytorch | en |
dc.subject | games | en |
dc.subject | bomberman | en |
dc.title | Posilované učení pro hru typu Bomberman | cs |
dc.title.alternative | Reinforcement Learning for Bomberman Type Game | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2022-06-16 | cs |
dcterms.modified | 2023-06-12-22:49:39 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 145321 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 19:43:45 | en |
sync.item.modts | 2025.01.17 10:54:56 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 7.12 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-25173_v.pdf
- Size:
- 86.47 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-25173_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-25173_o.pdf
- Size:
- 128.83 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-25173_o.pdf
Loading...
- Name:
- review_145321.html
- Size:
- 1.44 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_145321.html