Creating a Python-based Automated System for Recognizing Emotions from Facial Expressions.
Loading...
Date
Authors
Zima, Samuel
ORCID
Advisor
Referee
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Táto práca skúma rozpoznávanie výrazu tváre (angl. facial expression recognition - FER) pomocou hlbokého učenia so zameraním na použitie v zariadeniach s obmedzenou pamäťou a výpočtovými zdrojmi. Začína výskumom emócií a výrazov tváre z psychologického, biologického a sociologického hľadiska. Jadro výskumu tvorí návrh a implementácia automatizovaného systému pre FER s použitím súboru dát FER-2013. Tento systém využíva prispôsobenú architektúru SqueezeNet rozšírenú o jednoduchý obchvat, vrstvy náhodného odpadu neurónov a vrstvy dávkovej normalizácie. Tento systém dosahuje na súbore dát FER-2013 presnosť 66,37 %. Pre porovnávaciu analýzu sa tento model porovnal s upravenou architektúrou VGG16, ktorá dosiahla presnosť 65,09 %. Táto práca poskytuje cenné poznatky o vývoji menších, efektívnejších modelov strojového učenia pre FER, ktoré sú použiteľné pre široké spektrum zariadení vrátane nízkovýkonných procesorov a vstavaných zariadení.
This thesis examines facial expression recognition (FER) using deep learning by focusing on its application in devices with limited memory and computational resources. It begins by researching emotions and facial expressions from psychological, biological, and sociological perspectives. The core of this thesis involves the design and implementation of an automated FER system using the FER-2013 dataset. This system uses a customized SqueezeNet architecture enhanced with a simple bypass, dropout layers and batch normalization layers. This system achieves an accuracy of 66.37 % on the FER-2013 dataset. For comparative analysis, this model was compared with a customized VGG16 architecture which achieved an accuracy of 65.09 %. This thesis provides valuable insights into the development of smaller, more efficient machine learning models for FER which are usable in a wide range of devices, including low-performance CPUs and embedded devices.
This thesis examines facial expression recognition (FER) using deep learning by focusing on its application in devices with limited memory and computational resources. It begins by researching emotions and facial expressions from psychological, biological, and sociological perspectives. The core of this thesis involves the design and implementation of an automated FER system using the FER-2013 dataset. This system uses a customized SqueezeNet architecture enhanced with a simple bypass, dropout layers and batch normalization layers. This system achieves an accuracy of 66.37 % on the FER-2013 dataset. For comparative analysis, this model was compared with a customized VGG16 architecture which achieved an accuracy of 65.09 %. This thesis provides valuable insights into the development of smaller, more efficient machine learning models for FER which are usable in a wide range of devices, including low-performance CPUs and embedded devices.
Description
Keywords
rozpoznávanie výrazov tváre, emócie, výrazy tváre, anatómia tváre, konvolučné neurónové siete, strojové učenie, hlboké učenie, SqueezeNet, VGG16, vstavané zariadenia, FER-2013, facial expression recognition, emotions, facial expressions, anatomy of the face, convolutional neural networks, machine learning, deep learning, SqueezeNet, VGG16, embedded devices, FER-2013
Citation
ZIMA, S. Creating a Python-based Automated System for Recognizing Emotions from Facial Expressions. [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Informační technologie
Comittee
prof. Dr. Ing. Jan Černocký (předseda)
Ing. Ivana Burgetová, Ph.D. (člen)
Ing. Michal Hradiš, Ph.D. (člen)
Ing. Josef Strnadel, Ph.D. (člen)
doc. RNDr. Dana Hliněná, Ph.D. (člen)
Date of acceptance
2024-06-10
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky přítomných, např. ohledně dosažených výsledků (přesnosti), možností pro porovnávání výsledků dosažených na zvoleném datasetu, způsobu provádění experimentů či použitého typu neuronových sítí a jejich trénování. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B - velmi dobře.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení