Zpětnovazební učení pro řešení herních algoritmů

but.committeeprof. Ing. Zdeněk Smékal, CSc. (předseda) doc. Ing. Radim Burget, Ph.D. (místopředseda) Ing. David Kubánek, Ph.D. (člen) Ing. Pavel Mašek, Ph.D. (člen) Ing. Tomáš Gerlich (člen) Ing. Ivan Míča, Ph.D. (člen) Ing. Jan Karásek, Ph.D. (člen)cs
but.defenceJak se liší konvoluční síť od běžné neuronové sítě? Popište strukturu vámi vytvořené sítě. Vysvětlete zpětné šíření chyby. Vysvětlete pojem drop-out. Vysvětlete, proč jste zvolila rozměr pracovního prostoru 70x70 pixelů?cs
but.jazykčeština (Czech)
but.programElektrotechnika, elektronika, komunikační a řídicí technikacs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorKolařík, Martincs
dc.contributor.authorDaňhelová, Janacs
dc.contributor.refereeUher, Václavcs
dc.date.accessioned2018-06-14T11:03:10Z
dc.date.available2018-06-14T11:03:10Z
dc.date.created2018cs
dc.description.abstractBakalářská práce Zpětnovazební učení pro řešení herních algoritmů je rozdělena do dvou částí. V teoretické části jsou popsány a srovnávány základní metody zpětnovazebního učení, přičemž zvláštní pozornost je věnována metodám aktivního učení – Q-učení a hlubokému učení. Praktická část je zaměřena na aplikaci metody deep learning na hru Had. Výsledky jsou prezentovány ve formě programu napsaného v programovacím jazyku Python, který se skládá z herního prostředí vytvořeného v PyGame, modelu konvoluční neuronové sítě zkonstruovaného v knihovně Keras a herního agenta. Výstupem programu je několik typů datasetů ve formátu csv. Získaná data, obsahující hodnoty jednotlivých parametrů jako počet epoch, přesnost, ztráta nebo výše odměny, mohou být následně použita jako podklady pro další zpracování.cs
dc.description.abstractThe bachelor thesis Reinforcement learning for solving game algorithms is divided into two distinct parts. The theoretical part describes and compares the fundamental methods of reinforcement learning with special attention to the methods of active learning – Q-learning and deep learning. In the practical part the deep q-learning technique is chosen for testing and applied to the case of the Snake game. The results are presented in the form of program written in Python programming language, which consists of the game environment created in PyGame, the model of convolutional neural network designed in Keras and agent playing the game. As an output of the program there are several types of datasets in CSV format. The gained data containing the values of parameters like number of epochs, accuracy, loss or the amount of the reward can later be used for further processing.en
dc.description.markAcs
dc.identifier.citationDAŇHELOVÁ, J. Zpětnovazební učení pro řešení herních algoritmů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2018.cs
dc.identifier.other110275cs
dc.identifier.urihttp://hdl.handle.net/11012/82371
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectzpětnovazební učenícs
dc.subjectHadcs
dc.subjecthluboké učenícs
dc.subjectkonvoluční neuronová síťcs
dc.subjectherní algoritmuscs
dc.subjectPyGamecs
dc.subjectKerascs
dc.subjectPython 3.5cs
dc.subjectreinforcement learningen
dc.subjectSnakeen
dc.subjectdeep learningen
dc.subjectconvolutional neural networken
dc.subjectgame algorithmen
dc.subjectPyGameen
dc.subjectKerasen
dc.subjectPython 3.5en
dc.titleZpětnovazební učení pro řešení herních algoritmůcs
dc.title.alternativeReinforcement learning for solving game algorithmsen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2018-06-14cs
dcterms.modified2018-06-15-10:24:13cs
eprints.affiliatedInstitution.facultyFakulta elektrotechniky a komunikačních technologiícs
sync.item.dbid110275en
sync.item.dbtypeZPen
sync.item.insts2021.11.12 15:02:22en
sync.item.modts2021.11.12 13:49:57en
thesis.disciplineTeleinformatikacs
thesis.grantorVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav telekomunikacícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
8.16 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
appendix-1.zip
Size:
2.68 MB
Format:
zip
Description:
appendix-1.zip
Loading...
Thumbnail Image
Name:
review_110275.html
Size:
3.67 KB
Format:
Hypertext Markup Language
Description:
review_110275.html
Collections