Hraní her pomocí neuronových sítí
but.committee | prof. Ing. Adam Herout, Ph.D. (předseda) doc. Ing. Ondřej Ryšavý, Ph.D. (místopředseda) Ing. Bohuslav Křena, Ph.D. (člen) doc. Ing. Tomáš Martínek, Ph.D. (člen) doc. RNDr. Michal Novák, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm výborně (A) . Otázky u obhajoby: Jaké rozšíření oproti vaší implementaci jsou nutné k hraní složitějších stavových her jako Doom, na kterých byl DQN uváděn v článku který ho prezentoval? Proč se vaše implementace DDQN přestane učit po několik desítkách tisíc epizod? Co by jí pomohlo? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Hradiš, Michal | cs |
dc.contributor.author | Buchal, Petr | cs |
dc.contributor.referee | Kolář, Martin | cs |
dc.date.created | 2018 | cs |
dc.description.abstract | Cílem této práce je naučit neuronovou síť pohybu v prostředích s klasickou kontrolou řízení, hraní tahové hry 2048 a několika Atari her. Jedná se o oblast zpětnovazebního učení. Jako zpětnovazební algoritmus využívající neuronové sítě jsem použil Hluboké Q-učení. Ten jsem pro zvýšení efektivity učení obohatil o několik vylepšení. Mezi vylepšení patří přidání cílové sítě, DDQN, duální architektura neuronové sítě a prioritní vzpomínková paměť. Experimenty s klasickou kontrolou řízení zjistily, že nejvíce zvedá efektivitu učení přidání cílové sítě. V prostředích her dosáhlo Hluboké Q-učení několikanásobně lepších výsledků než náhodný hráč. Výsledky a jejich analýza mohou být využity ke vhledu do problematiky zpětnovazebních algoritmů využívajících neuronové sítě a zdokonalení použitých postupů. | cs |
dc.description.abstract | The aim of this bachelor thesis is to teach a neural network solving classic control theory problems and playing the turn-based game 2048 and several Atari games. It is about the process of the reinforcement learning. I used the Deep Q-learning reinforcement learning algorithm which uses a neural networks. In order to improve a learning efficiency, I enriched the algorithm with several improvements. The enhancements include the addition of a target network, DDQN, dueling neural network architecture and priority experience replay memory. The experiments with classic control theory problems found out that the learning efficiency is most increased by adding a target network. In the game environments, the Deep Q-learning has achieved several times better results than a random player. The results and their analysis can be used for an insight to reinforcement learning algorithms using neural networks and to improve the used techniques. | en |
dc.description.mark | A | cs |
dc.identifier.citation | BUCHAL, P. Hraní her pomocí neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2018. | cs |
dc.identifier.other | 114760 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/85237 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Strojové učení | cs |
dc.subject | Zpětnovazební učení | cs |
dc.subject | Neuronové sítě | cs |
dc.subject | Q-učení | cs |
dc.subject | Hluboké Q-učení | cs |
dc.subject | Machine learning | en |
dc.subject | Reinforcement learning | en |
dc.subject | Neural networks | en |
dc.subject | Q-learning | en |
dc.subject | Deep Q-learning | en |
dc.title | Hraní her pomocí neuronových sítí | cs |
dc.title.alternative | Playing Games Using Neural Networks | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2018-06-13 | cs |
dcterms.modified | 2020-05-10-16:13:21 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 114760 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 19:08:43 | en |
sync.item.modts | 2025.01.15 14:44:19 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 4.24 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-20907_v.pdf
- Size:
- 85.52 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-20907_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-20907_o.pdf
- Size:
- 88.74 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-20907_o.pdf
Loading...
- Name:
- review_114760.html
- Size:
- 1.43 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_114760.html