Hluboké učení AI v herních prostředích
Loading...
Date
Authors
Glós, Kristián
ORCID
Advisor
Referee
Mark
D
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Práca sa zaoberá analýzou algoritmov hlbokého učenia a ich schopností splňovať úlohy v herných prostrediach vývojového prostredia Unity. Ďalej sa pokúša vyhľadávať a špecifikovať možné využitia hlbokého učenia a neurónových sietí pre využitie pri vývoji počítačových hier. Využívame na to posilované učenie, imitačné učenie, a neuroevolúciu, pričom sa posilované učenie používalo počas celého vývoja hernej scény. Vyhodnocovanie a analýza prebiehali púštaním sietí v rôznych podmienkach herných scén a iných faktorov.
This thesis is focused on analysing deep learning algorithms and their ability to complete given tasks implemented in game environments created via the Unity game engine. Secondary objective was to research and specify possible use-cases of deep learning during game development. The algorithms used fall into Reinforcement learning, Imitation learning and Neuroevolution, while Reinforcement learning was used throughout the whole game scene development cycle. Analysis and results were collected through training the networks in different game scene states and other factors.
This thesis is focused on analysing deep learning algorithms and their ability to complete given tasks implemented in game environments created via the Unity game engine. Secondary objective was to research and specify possible use-cases of deep learning during game development. The algorithms used fall into Reinforcement learning, Imitation learning and Neuroevolution, while Reinforcement learning was used throughout the whole game scene development cycle. Analysis and results were collected through training the networks in different game scene states and other factors.
Description
Keywords
Hlboké učenie, Strojové učenie, Umelá inteligencia, Posilované učenie, Imitačné učenie, GAIL, Q-učenie, PPO, knihovňa ML-agents, Unity, Herné prostredia, Agenti, Strojové učenie, odmeny, odmeny a tresty, Genetické algoritmy, neuroevolúcia, NEAT, Evolučné stratégie, Markovské rozhodovacie procesy, neurónové siete, Deep Learning, Machine learning, AI, Reinforcement Learning, Imitation Learning, GAIL, Q-Learning, Proximal Policy Optimalization, ML-agents, Unity, Game environments, Agents, rewards and penalties, Genetic Algorithms, Neuroevolution, Neuroevolution of Augmented Topologies, Evolution Strategies, Markov Decision Process, Neural network
Citation
GLÓS, K. Hluboké učení AI v herních prostředích [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2021.
Document type
Document version
Date of access to the full text
Language of document
sk
Study field
Informační technologie
Comittee
doc. Ing. František Zbořil, Ph.D. (předseda)
doc. Mgr. Adam Rogalewicz, Ph.D. (místopředseda)
Ing. Michal Hradiš, Ph.D. (člen)
Ing. Lukáš Kekely, Ph.D. (člen)
Ing. Vladimír Veselý, Ph.D. (člen)
Date of acceptance
2021-06-15
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D. Otázky u obhajoby: Objasněte prosím počáteční podmínky experimentů uvedených v sekci 4.1. Jakými algoritmy bylo dosaženo prezentovaných výsledků? Jak vypadala architektura neuronové sítě? Co reprezentují vstupy a výstupy sítě? Experimentoval jste s hyperparametry? Vysvětlete prosím co ilustrují obrázky 4.1(a) a (b). Co reprezentují jednotlivé průběhy vizualizované oranžovou a modrou barvou? Jaký je vztah mezi neuronovou sítí a posilovaným učením? Co považujete za nejnáročnější část vaši práce, na co jste nejvíc hrdý? Jak jste zjišťoval výhody a nevýhody jednotlivých přístupů? Považujete výsledné natrénování agentů za úspěšné? Byla by vaše metoda použitelná i pro složitější hru?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení