Hraní nedeterministických her s učením

but.committeeprof. RNDr. Milan Češka, CSc. (předseda) doc. Ing. Vladimír Janoušek, Ph.D. (místopředseda) Ing. Ivana Burgetová, Ph.D. (člen) Doc. Ing. Zdeněk Havlice, CSc. (člen) doc. Ing. Jan Kořenek, Ph.D. (člen) Dr. Ing. Petr Peringer (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorZbořil, Františekcs
dc.contributor.authorBukovský, Marekcs
dc.contributor.refereeRozman, Jaroslavcs
dc.date.created2011cs
dc.description.abstractPráce se věnuje studiu a implementaci metod použitých pro učení z průběhu hraní. Zvolenou hrou pro tuhle práci jsou Vrhcáby. Algoritmus použitý pro učení neuronové sítě se nazývá učení z časového rozdílu s použitím stop vhodnosti. Tento algoritmus je známý i pod jménem TD(lambda). V teoretické části práce jsou popsány algoritmy pro hraní her bez učení, úvod do posilovaného učení, učení z časových rozdílů a úvod do umělých úvod neuronových sítí. Praktická část se zabývá aplikováním kombinace neuronových sítí a TD(lambda) algoritmů.cs
dc.description.abstractThe thesis is dedicated to the study and implementation of methods used for learning from the course of playing. The chosen game for this thesis is Backgammon. The algorithm used for training neural networks is called the temporal difference learning with use of eligible traces. This algorithm is also known as TD(lambda). The theoretical part describes algorithms for playing games without learning, introduction to reinforcement learning, temporal difference learning and introduction to artificial neural networks. The practical part deals with application of combination of neural networks and TD(lambda) algorithms.en
dc.description.markCcs
dc.identifier.citationBUKOVSKÝ, M. Hraní nedeterministických her s učením [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2011.cs
dc.identifier.other42477cs
dc.identifier.urihttp://hdl.handle.net/11012/54193
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectVrhcábycs
dc.subjectnedeterministické hrycs
dc.subjectumělé neurónové sítěcs
dc.subjectposilované učenícs
dc.subjectučení z časového rozdílucs
dc.subjecthraní her s učenímcs
dc.subjectBackgammonen
dc.subjectnondeterministic gamesen
dc.subjectartificial neural networken
dc.subjectreinforcement learningen
dc.subjecttemporal difference learningen
dc.subjectplaying games with learningen
dc.titleHraní nedeterministických her s učenímcs
dc.title.alternativePlaying of Nondeterministic Games with Learningen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2011-06-21cs
dcterms.modified2020-05-09-23:42:26cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid42477en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 14:52:27en
sync.item.modts2025.01.16 00:51:02en
thesis.disciplineInteligentní systémycs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav inteligentních systémůcs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
888.06 KB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_42477.html
Size:
1.44 KB
Format:
Hypertext Markup Language
Description:
file review_42477.html
Collections