Framework pro efektivní nasazení modelů hlubokých neuronových sítí na koncových zařízeních

but.committeedoc. Ing. Lukáš Burget, Ph.D. (předseda) prof. Dr. Ing. Jan Černocký (člen) doc. Ing. Vladimír Janoušek, Ph.D. (člen) Ing. Michal Hradiš, Ph.D. (člen) Ing. Jaroslav Rozman, Ph.D. (člen) Ing. František Grézl, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.cs
but.jazykangličtina (English)
but.programInformační technologie a umělá inteligencecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSekanina, Lukášen
dc.contributor.authorPavella, Martinen
dc.contributor.refereeMrázek, Vojtěchen
dc.date.created2025cs
dc.description.abstractPyTorch je aktuálne najpoužívanejši nástroj pre prácu s modelmi hlbokých neurónových sietí. Vývoj ovládačov a SW podpory pre využívanie HW akcelerátorov na koncových zariadeniach pre PyTorch modely nie je dostatočný. Aktuálne najčastejšim riešením je konvezia PyTorch modelov do formátu LiteRT, pre ktorý existuje dostatočná podpora ovládačov. Limitujúcim faktorom tohto prístupu je fakt, že nie všetky modely sú konvertovateľné do LiteRT. Tieto problematické modely nemôžu využívať HW akcelerátory a často mužia bežať iba na CPU. Táto diplomová práca navrhuje riešenie založené na rozdeľovaní PyTorch modelov na časti. Niektoré časti budú konvertované do LiteRT a ostatné časti, ktoré obsahujú nekonvertovateľné operácie, zostanú v PyTorch formáte. Vďaka tomu môžu tieto modely aspoň čiastočne využiť HW akcelerátory. Táto práca taktiež definuje nový formát súboru pre uloženie týchto rozdelených hybridných modelov, a taktiež navrhuje exekučný program, ktorý dokáže spustiť efektívnu inferenciu hybridných modelov na koncových zariadeniach.en
dc.description.abstractPyTorch has become the preferred framework for developing deep neural network (DNN) models. However, the development of drivers and other SW support for utilizing HW accelerators on edge devices for PyTorch models, has not yet caught up. The state of the art solution is to convert PyTorch models to the LiteRT format, for which there is sufficient driver support. The limitation of this approach is that not every model is convertible to LiteRT. These problematic models therefore cannot utilize HW accelerators, and often have to run on the CPU. This thesis proposes a solution based on partitioning of PyTorch models into submodels. Some submodels will be converted into the LiteRT format, and the unconvertible ones will remain in PyTorch. This allows the model to at least partially utilize the HW accelerators. The thesis also defines a new file format for storing the segmented hybrid models in a single file, as well as a runtime engine capable of running efficient inference of hybrid models on edge devices.cs
dc.description.markAcs
dc.identifier.citationPAVELLA, M. Framework pro efektivní nasazení modelů hlubokých neuronových sítí na koncových zařízeních [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.cs
dc.identifier.other162955cs
dc.identifier.urihttp://hdl.handle.net/11012/255110
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjecthlboké neurónové sieteen
dc.subjecthardverové akcelerátoryen
dc.subjectkoncové zariadeniaen
dc.subjectrozdeľovanie modeloven
dc.subjecthybridný modelen
dc.subjectPyTorchen
dc.subjectONNXen
dc.subjectLiteRTen
dc.subjectTFLiteen
dc.subjectdeep neural networkscs
dc.subjecthardware acceleratorscs
dc.subjectedge devicescs
dc.subjectmodel partitioningcs
dc.subjecthybrid modelcs
dc.subjectPyTorchcs
dc.subjectONNXcs
dc.subjectLiteRTcs
dc.subjectTFLitecs
dc.titleFramework pro efektivní nasazení modelů hlubokých neuronových sítí na koncových zařízeníchen
dc.title.alternativeFramework for Efficient Deployment of Deep Neural Network Models on Edge Devicescs
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2025-06-26cs
dcterms.modified2025-06-26-16:13:04cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid162955en
sync.item.dbtypeZPen
sync.item.insts2025.08.27 02:04:35en
sync.item.modts2025.08.26 19:33:59en
thesis.disciplineStrojové učenícs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačových systémůcs
thesis.levelInženýrskýcs
thesis.nameIng.cs

Files

Original bundle

Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
4.56 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_162955.html
Size:
9.71 KB
Format:
Hypertext Markup Language
Description:
file review_162955.html

Collections