Posilované učení pro hraní robotického fotbalu
Loading...
Date
Authors
Klanica, Jan
Advisor
Referee
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
ORCID
Abstract
Práce zkoumá dopad omezeného zrakového vnímání na efektivitu víceagentního posilovaného učení v robotickém fotbale simulovaném v prostředí Google Research Football pomocí metody MAT. Jsou rozlišovány dva stupně omezení zraku: zúžení horizontálního zorného pole na 180° a zúžení na 180° v kombinaci s blokováním výhledu ostatními hráči. Součástí řešení je paměťový modul, jehož cílem je kompenzovat zrakové omezení. Provedeným výzkumem bylo zjištěno, že v jednoduchých situacích je vliv omezení zanedbatelný, zatímco u náročnějších her klesá úspěšnost variant se zrakovým omezením až o 20 %. Uvedený paměťový modul se jako kompenzace neosvědčil. Výsledky potvrzují, že pro úspěšný přenos naučených strategií z virtuálního prostředí na skutečné roboty je nutné v simulaci věrně modelovat senzorická omezení zraku.
This work investigates the impact of limited visual perception on the effectiveness of multi-agent reinforcement learning in a robotic football simulated in the Google Research Football environment using the MAT method. Two degrees of visual constraints are distinguished: 180° horizontal field of view narrowing, and 180° narrowing combined with blocking of vision by other players. The solution includes a memory module to compensate for the visual limitation. The research carried out found that in simple situations the effect of the constraint is negligible, while in more challenging games the success rate of variants with visual limitation drops by up to 20 %. The memory module was not successful as a compensation. The results confirm that to successfully transfer learned strategies from the virtual environment to real robots, it is necessary to faithfully model the sensory constraints of vision in the simulation.
This work investigates the impact of limited visual perception on the effectiveness of multi-agent reinforcement learning in a robotic football simulated in the Google Research Football environment using the MAT method. Two degrees of visual constraints are distinguished: 180° horizontal field of view narrowing, and 180° narrowing combined with blocking of vision by other players. The solution includes a memory module to compensate for the visual limitation. The research carried out found that in simple situations the effect of the constraint is negligible, while in more challenging games the success rate of variants with visual limitation drops by up to 20 %. The memory module was not successful as a compensation. The results confirm that to successfully transfer learned strategies from the virtual environment to real robots, it is necessary to faithfully model the sensory constraints of vision in the simulation.
Description
Keywords
posilované učení pro hraní fotbalu , víceagentní transformátor , omezení zrakového vnímání , Google Research Football , přenos strategie do reálného světa , reinforcement learning for soccer , multi-agent transformer , limitations of visual perception , Google Research Football , sim-to-real transfer
Citation
KLANICA, J. Posilované učení pro hraní robotického fotbalu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
doc. Ing. František Zbořil, CSc. (předseda)
Ing. Aleš Smrčka, Ph.D. (člen)
Ing. Jan Pluskal, Ph.D. (člen)
doc. Ing. Michal Španěl, Ph.D. (člen)
Ing. Josef Strnadel, Ph.D. (člen)
Date of acceptance
2025-06-18
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.
Result of defence
práce byla úspěšně obhájena
