Optimalizace řízení s pomocí zpětnovazebního učení na platformě Robocode

but.committeedoc. Ing. Petr Mlýnek, Ph.D. (předseda) doc. Ing. Ivo Lattenberg, Ph.D. (místopředseda) Ing. Radim Číž, Ph.D. (člen) Ing. Stanislav Uchytil, Ph. D. (člen) Ing. Vojtěch Myška, Ph.D. (člen) Ing. Michal Mahút (člen)cs
but.defenceStudent prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta. Otázky komise, rozprava: 1) Ovládá se v aréně pozue jeden tank a ostatní mají své role předprogramované? - Student vysvětlil otázku. 2) V práci není vidět GUI, pouze popis, ani nebylo prezentováno. Implementoval jste jej tedy? - Student vysvětlil otázku. Otázky oponenta, posudek: 1) V kapitole 2.1 jsou uvedeny údaje o době volání Python skriptu. Na základě kolika měření byly získány prezentované hodnoty? - Student vysvětlil otázku. 2) V textu práce je uvedeno, že platforma vyžaduje JDK ve verzi 11 a vyšší. Avšak v příloze „A – Volání programu“ je zmíněna potřeba JDK 1.8 od IBM. Který z požadavků platí a je nutná konkrétní IBM distribuce? - Student vysvětlil otázku.cs
but.jazykčeština (Czech)
but.programTelekomunikační a informační technikacs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorBurget, Radimcs
dc.contributor.authorPastušek, Václavcs
dc.contributor.refereeMyška, Vojtěchcs
dc.date.created2024cs
dc.description.abstractTato diplomová práce se zabývá optimalizací řízení tankového robota v prostředí Robocode za využití zpětnovazebního učení. Komplexita tohoto problému spadá do třídy EXPSPACE, což představuje výzvu, kterou nelze podcenit. Teoretická část práce pečlivě zkoumá platformu Robocode, koncepty zpětnovazebního učení a příslušné algoritmy, zatímco praktická část se zaměřuje na optimalizaci agenta, implementaci zpětnovazebních algoritmů a vytvoření uživatelsky přívětivého rozhraní pro snadné trénování a testování modelů. V rámci práce bylo natrénováno a otestováno celkem 64 modelů, jejichž data a parametry jsou vzájemně srovnávány a prezentovány v přiložených databázích a grafech. Nejlepší výsledky v průměrném počtu zásahů na epizodu dosáhly modely s označením v0.8.0 a v1.0.0. U prvního z nich se projevila určitá schopnost vyhýbání se střelám, zatímco u druhého byly pozorovány úspěšnější zásahy.cs
dc.description.abstractThis master's thesis focuses on optimizing the control of a tank robot in the Robocode environment using reinforcement learning. The complexity of this problem falls into the EXPSPACE class, presenting a challenge that cannot be underestimated. The theoretical part of the thesis meticulously examines the Robocode platform, concepts of reinforcement learning, and relevant algorithms, while the practical part focuses on optimizing the agent, implementing reinforcement learning algorithms, and creating a user-friendly interface for easy training and testing of models. A total of 64 models were trained and tested as part of the thesis, with their data and parameters compared and presented in accompanying databases and graphs. The best results in terms of average hits per episode were achieved by models labeled v0.8.0 and v1.0.0. The first model exhibited a certain ability to evade shots, while the second model showed more successful hits.en
dc.description.markBcs
dc.identifier.citationPASTUŠEK, V. Optimalizace řízení s pomocí zpětnovazebního učení na platformě Robocode [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024.cs
dc.identifier.other159155cs
dc.identifier.urihttp://hdl.handle.net/11012/246086
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectRobocodecs
dc.subjectstrojové učenícs
dc.subjectzpětnovazební učenícs
dc.subjectepizodická paměťcs
dc.subjectQ-učenícs
dc.subjecthluboké učenícs
dc.subjecthluboká Q síťcs
dc.subjectTCP/IPcs
dc.subjectklient-servercs
dc.subjectJavacs
dc.subjectPythoncs
dc.subjectTensorFlowcs
dc.subjectdatabázecs
dc.subjectuživatelské rozhranícs
dc.subjectRobocodeen
dc.subjectmachine learningen
dc.subjectreinforcement learningen
dc.subjectepisodic memoryen
dc.subjectQ-learningen
dc.subjectdeep learningen
dc.subjectdeep Q networken
dc.subjectTCP/IPen
dc.subjectclient-serveren
dc.subjectJavaen
dc.subjectPythonen
dc.subjectTensorFlowen
dc.subjectdatabaseen
dc.subjectuser interfaceen
dc.titleOptimalizace řízení s pomocí zpětnovazebního učení na platformě Robocodecs
dc.title.alternativeOptimization of control using reinforcement learning on the Robocode platformen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2024-06-06cs
dcterms.modified2024-06-07-07:50:53cs
eprints.affiliatedInstitution.facultyFakulta elektrotechniky a komunikačních technologiícs
sync.item.dbid159155en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 14:42:03en
sync.item.modts2025.01.15 15:38:30en
thesis.disciplinebez specializacecs
thesis.grantorVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav telekomunikacícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
3.32 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
appendix-1.zip
Size:
11.85 MB
Format:
Unknown data format
Description:
file appendix-1.zip
Loading...
Thumbnail Image
Name:
review_159155.html
Size:
5.91 KB
Format:
Hypertext Markup Language
Description:
file review_159155.html
Collections