but.committee	doc. RNDr. Pavel Smrž, Ph.D. (předseda) doc. RNDr. Jitka Kreslíková, CSc. (místopředseda) Ing. Ivana Burgetová, Ph.D. (člen) Ing. Aleš Smrčka, Ph.D. (člen) Ing. Josef Strnadel, Ph.D. (člen)	cs
but.defence	Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: Jaké by bylo nastavení toho nejjednoduššího prostředí, metod, jejich parametrů, abyste ověřil funkčnost systému a schopnosti úspěšného naučení agenta? Kde vidíte klíčové problémy ve Vašem postupu, že se Vám nepodařilo natrénovat úspěšného agenta? Co vás vedlo k výběru prostředí, které jste použil?	cs
but.jazyk	čeština (Czech)
but.program	Informační technologie	cs
but.result	práce byla úspěšně obhájena	cs
dc.contributor.advisor	Hradiš, Michal	cs
dc.contributor.author	Adamčiak, Jakub	cs
dc.contributor.referee	Beran, Vítězslav	cs
dc.date.created	2022	cs
dc.description.abstract	Cieľom tejto bakalárksej práce je návrh, implementácia a trénovanie modelov posilňovaného učenia na hru typu Bomberman. Je postavená na prostredí Bomberland od firmy CoderOne. Toto prostredie bolo vyvinuté za účelom vzdelávania a výskumu v odvetí umelej inteligencie. V tejto práci rozoberám rôzne nastavenia a problémy s implementovaním agenta do prostredia. Vyskúšal som 2 politiky (MLP a CNN), 2 algoritmy (PPO a A2C) a 5 druhov neurónových sietí pre extrakciu vlastností za pomoci knižníc stable baselines 3 a pytorch. Celkový čas trénovania týchto modelov bol dokopy 1207 reálnych hodín, 4168 strojových hodín a 271 miliónov herných krokov. Aj keď bolo trénovanie neúspešné, táto práca ukazuje proces implementácie modelu posilňovaného učenia do prostredia Gym.	cs
dc.description.abstract	This bachelor's thesis aims to develop, implement and train reinforcement learning models for a Bomberman-type game. It is based on Bomberland environment from CoderOne. This environment was created for education and research in the field of artificial intelligence. In this thesis I tackle the settings and problems of implementing agent into the environment. I used 2 policies (MLP and CNN), 2 algorithms (PPO and A2C) and 5 setups of neural networks for feature extraction with the use of libraries stable baselines 3 and pytorch. Total training time resulted in 1207 real-world hours, 4168 computing hours and 271 milions of time steps. Although the training was not successful, this thesis shows the process of implementing a reinforcement learning model into a Gym environment.	en
dc.description.mark	C	cs
dc.identifier.citation	ADAMČIAK, J. Posilované učení pro hru typu Bomberman [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2022.	cs
dc.identifier.other	145321	cs
dc.identifier.uri	http://hdl.handle.net/11012/207436
dc.language.iso	cs	cs
dc.publisher	Vysoké učení technické v Brně. Fakulta informačních technologií	cs
dc.rights	Standardní licenční smlouva - přístup k plnému textu bez omezení	cs
dc.subject	umelá inteligencia	cs
dc.subject	AI	cs
dc.subject	strojové učenie	cs
dc.subject	ML	cs
dc.subject	posilované učenie	cs
dc.subject	RL	cs
dc.subject	konvolučné neurónové siete	cs
dc.subject	CNN	cs
dc.subject	PPO	cs
dc.subject	A2C	cs
dc.subject	python	cs
dc.subject	stable baselines3	cs
dc.subject	ai-gym	cs
dc.subject	pytorch	cs
dc.subject	hry	cs
dc.subject	bomberman	cs
dc.subject	artificial inteligence	en
dc.subject	AI	en
dc.subject	machine learning	en
dc.subject	ML	en
dc.subject	reinforcement learning	en
dc.subject	RL	en
dc.subject	convolutional neural networks	en
dc.subject	CNN	en
dc.subject	PPO	en
dc.subject	A2C	en
dc.subject	python	en
dc.subject	stable baselines3	en
dc.subject	ai-gym	en
dc.subject	pytorch	en
dc.subject	games	en
dc.subject	bomberman	en
dc.title	Posilované učení pro hru typu Bomberman	cs
dc.title.alternative	Reinforcement Learning for Bomberman Type Game	en
dc.type	Text	cs
dc.type.driver	bachelorThesis	en
dc.type.evskp	bakalářská práce	cs
dcterms.dateAccepted	2022-06-16	cs
dcterms.modified	2023-06-12-22:49:39	cs
eprints.affiliatedInstitution.faculty	Fakulta informačních technologií	cs
sync.item.dbid	145321	en
sync.item.dbtype	ZP	en
sync.item.insts	2025.03.18 19:43:45	en
sync.item.modts	2025.01.17 10:54:56	en
thesis.discipline	Informační technologie	cs
thesis.grantor	Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií	cs
thesis.level	Bakalářský	cs
thesis.name	Bc.	cs

Posilované učení pro hru typu Bomberman

Files

Original bundle

Collections