Optimalizace řízení s pomocí zpětnovazebního učení na platformě Robocode
but.committee | doc. Ing. Petr Mlýnek, Ph.D. (předseda) doc. Ing. Ivo Lattenberg, Ph.D. (místopředseda) Ing. Radim Číž, Ph.D. (člen) Ing. Stanislav Uchytil, Ph. D. (člen) Ing. Vojtěch Myška, Ph.D. (člen) Ing. Michal Mahút (člen) | cs |
but.defence | Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta. Otázky komise, rozprava: 1) Ovládá se v aréně pozue jeden tank a ostatní mají své role předprogramované? - Student vysvětlil otázku. 2) V práci není vidět GUI, pouze popis, ani nebylo prezentováno. Implementoval jste jej tedy? - Student vysvětlil otázku. Otázky oponenta, posudek: 1) V kapitole 2.1 jsou uvedeny údaje o době volání Python skriptu. Na základě kolika měření byly získány prezentované hodnoty? - Student vysvětlil otázku. 2) V textu práce je uvedeno, že platforma vyžaduje JDK ve verzi 11 a vyšší. Avšak v příloze „A – Volání programu“ je zmíněna potřeba JDK 1.8 od IBM. Který z požadavků platí a je nutná konkrétní IBM distribuce? - Student vysvětlil otázku. | cs |
but.jazyk | čeština (Czech) | |
but.program | Telekomunikační a informační technika | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Burget, Radim | cs |
dc.contributor.author | Pastušek, Václav | cs |
dc.contributor.referee | Myška, Vojtěch | cs |
dc.date.created | 2024 | cs |
dc.description.abstract | Tato diplomová práce se zabývá optimalizací řízení tankového robota v prostředí Robocode za využití zpětnovazebního učení. Komplexita tohoto problému spadá do třídy EXPSPACE, což představuje výzvu, kterou nelze podcenit. Teoretická část práce pečlivě zkoumá platformu Robocode, koncepty zpětnovazebního učení a příslušné algoritmy, zatímco praktická část se zaměřuje na optimalizaci agenta, implementaci zpětnovazebních algoritmů a vytvoření uživatelsky přívětivého rozhraní pro snadné trénování a testování modelů. V rámci práce bylo natrénováno a otestováno celkem 64 modelů, jejichž data a parametry jsou vzájemně srovnávány a prezentovány v přiložených databázích a grafech. Nejlepší výsledky v průměrném počtu zásahů na epizodu dosáhly modely s označením v0.8.0 a v1.0.0. U prvního z nich se projevila určitá schopnost vyhýbání se střelám, zatímco u druhého byly pozorovány úspěšnější zásahy. | cs |
dc.description.abstract | This master's thesis focuses on optimizing the control of a tank robot in the Robocode environment using reinforcement learning. The complexity of this problem falls into the EXPSPACE class, presenting a challenge that cannot be underestimated. The theoretical part of the thesis meticulously examines the Robocode platform, concepts of reinforcement learning, and relevant algorithms, while the practical part focuses on optimizing the agent, implementing reinforcement learning algorithms, and creating a user-friendly interface for easy training and testing of models. A total of 64 models were trained and tested as part of the thesis, with their data and parameters compared and presented in accompanying databases and graphs. The best results in terms of average hits per episode were achieved by models labeled v0.8.0 and v1.0.0. The first model exhibited a certain ability to evade shots, while the second model showed more successful hits. | en |
dc.description.mark | B | cs |
dc.identifier.citation | PASTUŠEK, V. Optimalizace řízení s pomocí zpětnovazebního učení na platformě Robocode [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024. | cs |
dc.identifier.other | 159155 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/246086 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Robocode | cs |
dc.subject | strojové učení | cs |
dc.subject | zpětnovazební učení | cs |
dc.subject | epizodická paměť | cs |
dc.subject | Q-učení | cs |
dc.subject | hluboké učení | cs |
dc.subject | hluboká Q síť | cs |
dc.subject | TCP/IP | cs |
dc.subject | klient-server | cs |
dc.subject | Java | cs |
dc.subject | Python | cs |
dc.subject | TensorFlow | cs |
dc.subject | databáze | cs |
dc.subject | uživatelské rozhraní | cs |
dc.subject | Robocode | en |
dc.subject | machine learning | en |
dc.subject | reinforcement learning | en |
dc.subject | episodic memory | en |
dc.subject | Q-learning | en |
dc.subject | deep learning | en |
dc.subject | deep Q network | en |
dc.subject | TCP/IP | en |
dc.subject | client-server | en |
dc.subject | Java | en |
dc.subject | Python | en |
dc.subject | TensorFlow | en |
dc.subject | database | en |
dc.subject | user interface | en |
dc.title | Optimalizace řízení s pomocí zpětnovazebního učení na platformě Robocode | cs |
dc.title.alternative | Optimization of control using reinforcement learning on the Robocode platform | en |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2024-06-06 | cs |
dcterms.modified | 2024-06-07-07:50:53 | cs |
eprints.affiliatedInstitution.faculty | Fakulta elektrotechniky a komunikačních technologií | cs |
sync.item.dbid | 159155 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.26 14:42:03 | en |
sync.item.modts | 2025.01.15 15:38:30 | en |
thesis.discipline | bez specializace | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav telekomunikací | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |
Files
Original bundle
1 - 3 of 3
Loading...
- Name:
- final-thesis.pdf
- Size:
- 3.32 MB
- Format:
- Adobe Portable Document Format
- Description:
- file final-thesis.pdf
Loading...
- Name:
- appendix-1.zip
- Size:
- 11.85 MB
- Format:
- Unknown data format
- Description:
- file appendix-1.zip
Loading...
- Name:
- review_159155.html
- Size:
- 5.91 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_159155.html