Návrh a realizace simulačniho modelu dvounohého robotu
Loading...
Date
Authors
Meško, Marek
Advisor
Referee
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta strojního inženýrství
ORCID
Abstract
Táto diplomová práca sa zaoberá návrhom a realizáciou simulačného modelu dvojnohého robota s využitím metód učenia posilňovaním (RL), ktorého cieľom je schopnosť pohybovať sa vpred. V teoretickej časti je spracovaná rešerš metód učenia posilňovaním so zameraním na algoritmus Proximal Policy Optimization (PPO), prehľad dostupných simulačných prostredí a analýza vybraných humanoidných robotov. V praktickej časti je podrobne analyzovaný proces tvorby modelu robota v Unified Robot Description Format (URDF) a v simulačnom prostredí MuJoCo, pričom sú tieto prístupy aj vzájomne porovnané. Následne sú prezentované experimenty vykonané v prostredí Walker2D, ktoré slúžia ako základ pre ďalšiu aplikáciu na vlastný model robota PAWO. Na záver sú získané poznatky prenesené do simulačného prostredia PAWO s cieľom dosiahnuť stabilnú a plynulú chôdzu v simulačnom prostredí PyBullet.
This diploma thesis deals with the design and implementation of a simulation model of a bipedal robot using reinforcement learning (RL) methods, the goal of which is the ability to move forward. The theoretical part includes a search for reinforcement learning methods with a focus on the Proximal Policy Optimization (PPO) algorithm, an overview of available simulation environments and an analysis of selected humanoid robots. The practical part analyses in detail the process of creating a robot model in Unified Robot Description Format (URDF) and in the MuJoCo simulation environment, these approaches are also compared with each other. Subsequently, experiments performed in the Walker2D environment are presented, which serve as a basis for further application to the own PAWO robot model. Finally, the acquired knowledge is transferred to the PAWO simulation environment in order to achieve stable and smooth walking.
This diploma thesis deals with the design and implementation of a simulation model of a bipedal robot using reinforcement learning (RL) methods, the goal of which is the ability to move forward. The theoretical part includes a search for reinforcement learning methods with a focus on the Proximal Policy Optimization (PPO) algorithm, an overview of available simulation environments and an analysis of selected humanoid robots. The practical part analyses in detail the process of creating a robot model in Unified Robot Description Format (URDF) and in the MuJoCo simulation environment, these approaches are also compared with each other. Subsequently, experiments performed in the Walker2D environment are presented, which serve as a basis for further application to the own PAWO robot model. Finally, the acquired knowledge is transferred to the PAWO simulation environment in order to achieve stable and smooth walking.
Description
Keywords
Učenie posilňovaním , PPO , PyBullet , URDF , MuJoCo , Dvojnohý robot , Walker2D , PAWO , Simulačné prostredie , Odmenová funkcia , Reinforcement learning , PPO , PyBullet , URDF , MuJoCo , Bipedal robot , Walker2D , PAWO , Simulation environment , Reward function
Citation
MEŠKO, M. Návrh a realizace simulačniho modelu dvounohého robotu [online]. Brno: Vysoké učení technické v Brně. Fakulta strojního inženýrství. 2025.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
bez specializace
Comittee
RNDr. Vladimír Opluštil (předseda)
doc. Ing. Robert Grepl, Ph.D. (místopředseda)
doc. Ing. Jiří Krejsa, Ph.D. (člen)
doc. Ing. Radoslav Cipín, Ph.D. (člen)
Ing. Dalibor Červinka, Ph.D. (člen)
Ing. Michal Bastl, Ph.D. (člen)
Ing. Peter Zavadinka, Ph.D. (člen)
Ing. Roman Adámek, Ph.D. (člen)
Date of acceptance
2025-06-10
Defence
Při obhajobě student nejprve prezentoval svoji diplomovou práci, následně byly přečteny posudky a student odpovídal na dotazy oponenta. Poté byly členy komise položeny následující otázky:
Jak funguje zpětná vazba? Jak robot spadne? Co je „PPO“?
Obhajoba byla komisí hodnocena jako velmi dobrá.
Result of defence
práce byla úspěšně obhájena
