Framework pro efektivní nasazení modelů hlubokých neuronových sítí na koncových zařízeních
| but.committee | doc. Ing. Lukáš Burget, Ph.D. (předseda) prof. Dr. Ing. Jan Černocký (člen) doc. Ing. Vladimír Janoušek, Ph.D. (člen) Ing. Michal Hradiš, Ph.D. (člen) Ing. Jaroslav Rozman, Ph.D. (člen) Ing. František Grézl, Ph.D. (člen) | cs |
| but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. | cs |
| but.jazyk | angličtina (English) | |
| but.program | Informační technologie a umělá inteligence | cs |
| but.result | práce byla úspěšně obhájena | cs |
| dc.contributor.advisor | Sekanina, Lukáš | en |
| dc.contributor.author | Pavella, Martin | en |
| dc.contributor.referee | Mrázek, Vojtěch | en |
| dc.date.created | 2025 | cs |
| dc.description.abstract | PyTorch je aktuálne najpoužívanejši nástroj pre prácu s modelmi hlbokých neurónových sietí. Vývoj ovládačov a SW podpory pre využívanie HW akcelerátorov na koncových zariadeniach pre PyTorch modely nie je dostatočný. Aktuálne najčastejšim riešením je konvezia PyTorch modelov do formátu LiteRT, pre ktorý existuje dostatočná podpora ovládačov. Limitujúcim faktorom tohto prístupu je fakt, že nie všetky modely sú konvertovateľné do LiteRT. Tieto problematické modely nemôžu využívať HW akcelerátory a často mužia bežať iba na CPU. Táto diplomová práca navrhuje riešenie založené na rozdeľovaní PyTorch modelov na časti. Niektoré časti budú konvertované do LiteRT a ostatné časti, ktoré obsahujú nekonvertovateľné operácie, zostanú v PyTorch formáte. Vďaka tomu môžu tieto modely aspoň čiastočne využiť HW akcelerátory. Táto práca taktiež definuje nový formát súboru pre uloženie týchto rozdelených hybridných modelov, a taktiež navrhuje exekučný program, ktorý dokáže spustiť efektívnu inferenciu hybridných modelov na koncových zariadeniach. | en |
| dc.description.abstract | PyTorch has become the preferred framework for developing deep neural network (DNN) models. However, the development of drivers and other SW support for utilizing HW accelerators on edge devices for PyTorch models, has not yet caught up. The state of the art solution is to convert PyTorch models to the LiteRT format, for which there is sufficient driver support. The limitation of this approach is that not every model is convertible to LiteRT. These problematic models therefore cannot utilize HW accelerators, and often have to run on the CPU. This thesis proposes a solution based on partitioning of PyTorch models into submodels. Some submodels will be converted into the LiteRT format, and the unconvertible ones will remain in PyTorch. This allows the model to at least partially utilize the HW accelerators. The thesis also defines a new file format for storing the segmented hybrid models in a single file, as well as a runtime engine capable of running efficient inference of hybrid models on edge devices. | cs |
| dc.description.mark | A | cs |
| dc.identifier.citation | PAVELLA, M. Framework pro efektivní nasazení modelů hlubokých neuronových sítí na koncových zařízeních [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025. | cs |
| dc.identifier.other | 162955 | cs |
| dc.identifier.uri | http://hdl.handle.net/11012/255110 | |
| dc.language.iso | en | cs |
| dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
| dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
| dc.subject | hlboké neurónové siete | en |
| dc.subject | hardverové akcelerátory | en |
| dc.subject | koncové zariadenia | en |
| dc.subject | rozdeľovanie modelov | en |
| dc.subject | hybridný model | en |
| dc.subject | PyTorch | en |
| dc.subject | ONNX | en |
| dc.subject | LiteRT | en |
| dc.subject | TFLite | en |
| dc.subject | deep neural networks | cs |
| dc.subject | hardware accelerators | cs |
| dc.subject | edge devices | cs |
| dc.subject | model partitioning | cs |
| dc.subject | hybrid model | cs |
| dc.subject | PyTorch | cs |
| dc.subject | ONNX | cs |
| dc.subject | LiteRT | cs |
| dc.subject | TFLite | cs |
| dc.title | Framework pro efektivní nasazení modelů hlubokých neuronových sítí na koncových zařízeních | en |
| dc.title.alternative | Framework for Efficient Deployment of Deep Neural Network Models on Edge Devices | cs |
| dc.type | Text | cs |
| dc.type.driver | masterThesis | en |
| dc.type.evskp | diplomová práce | cs |
| dcterms.dateAccepted | 2025-06-26 | cs |
| dcterms.modified | 2025-06-26-16:13:04 | cs |
| eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
| sync.item.dbid | 162955 | en |
| sync.item.dbtype | ZP | en |
| sync.item.insts | 2025.08.27 02:04:35 | en |
| sync.item.modts | 2025.08.26 19:33:59 | en |
| thesis.discipline | Strojové učení | cs |
| thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačových systémů | cs |
| thesis.level | Inženýrský | cs |
| thesis.name | Ing. | cs |
