Modelování akcelerátorů neuronových sítí
but.committee | prof. Ing. Lukáš Sekanina, Ph.D. (předseda) doc. Ing. Vladimír Drábek, CSc. (člen) doc. Ing. Vladimír Janoušek, Ph.D. (člen) doc. Ing. Jiří Jaroš, Ph.D. (člen) Ing. Ondřej Kanich, Ph.D. (člen) Ing. Josef Strnadel, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie a umělá inteligence | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Mrázek, Vojtěch | cs |
dc.contributor.author | Klhůfek, Jan | cs |
dc.contributor.referee | Sekanina, Lukáš | cs |
dc.date.created | 2023 | cs |
dc.description.abstract | Cílem této diplomové práce je zaměřit se na modelování akcelerátorů neuronových sítí s HW podporou kvantizace. Práce nejprve přibližuje koncept výpočtu konvolučních neuronových sítí (CNN) a představuje kategorie různých hardwarových architektur, které slouží k jejich zpracování. Následně jsou shrnuty optimalizační techniky modelů CNN, jejichž cílem je dosáhnout efektivního zpracování na specializovaných hardwarových architekturách. Další část práce obsahuje porovnání existujících analytických nástrojů, jež slouží k odhadu výkonnostních parametrů HW při inferenci, a které jsou rozšiřitelné o implementaci podpory kvantizace. Na základě experimentálního porovnání byl pro účely této práce vybrán nástroj Timeloop. Dále je představen popis fungování tohoto nástroje spolu s návrhem a implementací jeho rozšíření o podporu kvantizace. V závěru práce jsou experimentálně otestovány důsledky různých konfigurací kvantizace na vyhodnocené parametry inference u různých hardwarových architektur. | cs |
dc.description.abstract | The aim of this master thesis is modeling of neural network accelerators with HW support for quantization. The thesis first focuses on the concept of computation in convolutional neural networks (CNNs) and introduces different categories of hardware architectures that are used for their processing. Following this, optimization techniques for CNN models are summarized, with the goal of achieving efficient processing on specialized hardware architectures. The subsequent part of the thesis involves a comparison of existing analytical tools that are used to estimate hardware performance parameters during inference and which can be expanded to incorporate quantization support. Based on an experimental comparison, the Timeloop tool was selected for the purposes of this thesis. A thorough explanation of this tool's functionality is presented, along with a concept and implementation of its expansion to support quantization. In conclusion, the thesis experimentally tests the impact of various quantization configurations on evaluated inference parameters across different hardware architectures. | en |
dc.description.mark | A | cs |
dc.identifier.citation | KLHŮFEK, J. Modelování akcelerátorů neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023. | cs |
dc.identifier.other | 141019 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/210603 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | analytický model | cs |
dc.subject | HW akcelerátory | cs |
dc.subject | konvoluční neuronové sítě (CNN) | cs |
dc.subject | kvantizace | cs |
dc.subject | prořezávání | cs |
dc.subject | optimalizace | cs |
dc.subject | energetická účinnost | cs |
dc.subject | Timeloop | cs |
dc.subject | Accelergy | cs |
dc.subject | analytical model | en |
dc.subject | HW accelerators | en |
dc.subject | convolutional neural networks (CNN) | en |
dc.subject | quantization | en |
dc.subject | pruning | en |
dc.subject | optimization | en |
dc.subject | energy efficiency | en |
dc.subject | Timeloop | en |
dc.subject | Accelergy | en |
dc.title | Modelování akcelerátorů neuronových sítí | cs |
dc.title.alternative | Modelling of Neural Network Hardware Accelerators | en |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2023-06-21 | cs |
dcterms.modified | 2023-06-21-11:32:46 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 141019 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.26 15:36:20 | en |
sync.item.modts | 2025.01.15 18:00:54 | en |
thesis.discipline | Vestavěné systémy | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačových systémů | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |