Aplikace posilovaného učení v řízení autonomního vozidla

but.committeeprof. Dr. Ing. Jan Černocký (předseda) doc. Ing. Lukáš Burget, Ph.D. (místopředseda) doc. RNDr. Milan Češka, Ph.D. (člen) Ing. Michal Hradiš, Ph.D. (člen) Ing. Jaroslav Rozman, Ph.D. (člen) doc. Ing. František Zbořil, CSc. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: Je možné srovnat Váš systém s jinými systémy a pokud ano, jak si obstojí Váš 'perfektně naučený' systém, jak občas píšete, vůči těmto? Platí vztah 2.9 pro všechny politiky PI? Můžete toto demonstrovat s použitím vztahů 2.7 a 2.8?cs
but.jazykčeština (Czech)
but.programInformační technologie a umělá inteligencecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorJanoušek, Vladimírcs
dc.contributor.authorVosol, Davidcs
dc.contributor.refereeZbořil, Františekcs
dc.date.accessioned2022-06-24T06:55:48Z
dc.date.available2022-06-24T06:55:48Z
dc.date.created2022cs
dc.description.abstractTato práce se zabývá problematikou posilovaného učení aplikovaného na úlohu autonomního řízení vozidla. Nejprve je probrána nezbytná teorie posilovaného učení, která je zakončena představením nejmodernějších aktor-kritik metod. Z nich je vybrána metoda Proximal Policy Optimization , která je následně aplikována na tuto úlohu. Pro tento účel je také zvolen závodní simulátor TORCS. Naším cílem je naučit v simulovaném prostředí agenta autonomně řídit, s ohledem na jeho budoucí aplikaci v reálném prostředí v podobě zmenšeného RC modelu vozidla. Za tímto účelem jsou simulovány podmínky vzdáleného učení a ovládání vozidla v cloudu a to v podobě simulace ztráty paketů s daty od senzorů a aktuátorů nebo simulace zašuměných dat. Také jsou provedeny experimenty s cílem zjistit nejmenší počet senzorů, se kterým je agent schopen se úlohu naučit. Dále je experimentováno s využitím výstupu kamery vozidla. Jsou představeny různé návrhy architektur systému, mimo jiné i se zaměřením na co nejnižší hardwarové požadavky. Na závěr jsou prozkoumány vlastnosti naučeného agenta z pohledu generalizace v neznámém prostředí.cs
dc.description.abstractThis thesis is focused on the topic of reinforcement learning applied to a task of autonomous vehicle driving. First, the necessary fundamental theory is presented, including the state-of-the-art actor-critic methods. From them the Proximal policy optimization algorithm is chosen for the application to the mentioned task. For the same purpose, the racing simulator TORCS is used. Our goal is to learn a reinforcement learning agent in a simulated environment with the focus on a future real-world application to an RC scaled model car. To achieve this, we simulate the conditions of remote learning and control in the cloud. For that, simulation of network packet loss, noisy sensory and actuator data is done. We also experiment with the least number of vehicle's sensors required for the agent to successfully learn the task. Experiments regarding the vehicle's camera output are also carried out. Different system architectures are proposed, among others also with the aim to minimize hardware requirements. Finally, we explore the generalization properties of a learned agent in an unknown environment.en
dc.description.markBcs
dc.identifier.citationVOSOL, D. Aplikace posilovaného učení v řízení autonomního vozidla [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2022.cs
dc.identifier.other145474cs
dc.identifier.urihttp://hdl.handle.net/11012/207873
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectposilované učenícs
dc.subjectgradientní strategiecs
dc.subjectaktor-kritikcs
dc.subjectautonomní řízení vozidlacs
dc.subjectTORCScs
dc.subjectneuronové sítěcs
dc.subjectoptimalizace blízké strategiecs
dc.subjectPPOcs
dc.subjectreinforcement learningen
dc.subjectpolicy gradientsen
dc.subjectactor-criticen
dc.subjectautonomous drivingen
dc.subjectTORCSen
dc.subjectneural networksen
dc.subjectproximal policy optimizationen
dc.subjectPPOen
dc.titleAplikace posilovaného učení v řízení autonomního vozidlacs
dc.title.alternativeApplication of Reinforcement Learning in Autonomous Drivingen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2022-06-21cs
dcterms.modified2022-06-23-09:13:59cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid145474en
sync.item.dbtypeZPen
sync.item.insts2022.06.24 08:55:48en
sync.item.modts2022.06.24 08:14:15en
thesis.disciplineStrojové učenícs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav inteligentních systémůcs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
5.52 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-25127_v.pdf
Size:
85.72 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-25127_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-25127_o.pdf
Size:
91.04 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-25127_o.pdf
Loading...
Thumbnail Image
Name:
review_145474.html
Size:
1.47 KB
Format:
Hypertext Markup Language
Description:
review_145474.html
Collections