Automatická kvantizace neuronových sítí

but.committeedoc. Ing. František Zbořil, Ph.D. (předseda) doc. RNDr. Dana Hliněná, Ph.D. (člen) Ing. Michal Hradiš, Ph.D. (člen) doc. Ing. Michal Bidlo, Ph.D. (člen) Ing. Vladimír Veselý, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorMrázek, Vojtěchcs
dc.contributor.authorŠafář, Miroslavcs
dc.contributor.refereeVašíček, Zdeněkcs
dc.date.accessioned2023-06-16T06:57:40Z
dc.date.available2023-06-16T06:57:40Z
dc.date.created2023cs
dc.description.abstractKvantizace hlubokých neuronových sítí je častou technikou optimalizace jejich paměťové a energetické náročnosti, aby mohly být nasazeny na zařízení s omezenými zdroji. Kvantizace se smíšenou přesností umožňuje ještě lepší paměťové a energetické úspory. Volba kvantizačních úrovní jednotlivých vrstev však vyžaduje odborné znalosti a hlubokou analýzu sítě, což je časově velmi náročná činnost. V této bakalářské práci se věnuji návrhu systému pro automatické určování kvantizační úrovně jednotlivých vrstev vstupní neuronové sítě. Využívám k tomu evoluční algoritmus NSGA-II a quantization-aware učení k doladění parametrů kvantizované sítě. S navrženým systémem jsem provedl experimenty s neuronovou sítí MobileNet a podmnožinou datové sady ImageNet. Navržený systém nalezl řešení, které téměř desetkrát zmenšuje velikost modelu při zachování jeho Top-1 klasifikační přesnosti, což v tomto případě překonalo uniformní kvantizaci téměř o 100 %. Tyto úspory lze využít ke snížení výrobních nákladů pamětí do hardwarových akcelerátorů nebo k nasazení hlubokých neuronových sítí na ještě menší zařízení.cs
dc.description.abstractQuantization of deep neural networks is a common way to optimize the networks for deployment on energy and memory-constrained devices while maintaining an acceptable accuracy loss. Mixed-precision quantization for weights and activations allows even better memory and energy savings. But selecting the precision for each layer needs expert knowledge and a deep network analysis. In this work, we address this problem and we present a system for automated mixed-precision quantization of neural networks. We utilize the multi-objective evolutionary algorithm NSGA-II and quantization-aware training for fine-tuning the quantization configurations. We conducted experiments with a subset of the ImageNet dataset and MobileNet network. We achieved accuracies comparable to floating-point models while making the memory footprint of the model about ten times smaller. The proposed approach outperforms a widely-used uniform quantization by almost 100 %. These size savings result in the costs of memories in the hardware accelerator savings. Therefore the proposed approach allows deploying deep neural networks to even smaller devices.en
dc.description.markAcs
dc.identifier.citationŠAFÁŘ, M. Automatická kvantizace neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.cs
dc.identifier.other148494cs
dc.identifier.urihttp://hdl.handle.net/11012/210486
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectkvantizacecs
dc.subjectneuronové sítěcs
dc.subjectevoluční algoritmycs
dc.subjectautomatický návrh neuronových sítícs
dc.subjectautomatická kvantizacecs
dc.subjectper-channel kvantizacecs
dc.subjectkvantizace se smíšenou přesnostícs
dc.subjectkvantizace batch normalizacecs
dc.subjecttensorflowcs
dc.subjectquantizationen
dc.subjectneural networksen
dc.subjectevolutionary algorithmen
dc.subjectautomated designen
dc.subjectautomated quantizationen
dc.subjectper-channel quantizationen
dc.subjectmixed-precision quantizationen
dc.subjectbatch normalization quantizationen
dc.subjecttensorflowen
dc.titleAutomatická kvantizace neuronových sítícs
dc.title.alternativeAutomatic Quantization of Neural Networksen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2023-06-15cs
dcterms.modified2023-06-15-16:19:25cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid148494en
sync.item.dbtypeZPen
sync.item.insts2023.06.16 08:57:40en
sync.item.modts2023.06.16 08:12:34en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačových systémůcs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
5.05 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_148494.html
Size:
9.49 KB
Format:
Hypertext Markup Language
Description:
review_148494.html
Collections