Ochrana osobních údajů v ML analýze
Loading...
Date
Authors
Haberland, Marek
Advisor
Referee
Mark
C
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
ORCID
Abstract
Táto práca predstavuje systém rozpoznávania tváre so zabudovanou ochranou súkromia údajov. Zamerali sme sa na využitie klasifikátora a preskúmali sme kľúčové koncepty strojového učenia, ako sú neurónové siete a aktivačné funkcie. Na ochranu používateľských údajov sme implementovali Differential Privacy, pričom sme použili Laplaceov mechanizmus na zachovanie presnosti modelu pri súčasnej ochrane individuálnych záznamov. Taktiež sme využili metódu eigenfaces na extrakciu hlavných čŕtov tváre, čím sa zvýšila efektivita rozpoznávania. Systém bol implementovaný v jazyku Python s použitím datasetu Labeled Faces in the Wild (LFW), pričom sme vykonali predspracovanie ako zmena veľkosti obrázkov, konverzia do odtieňov sivej a normalizácia. Dataset sme rozšírili o nové osoby. Model dosiahol presnosť 75–80\% na samostatnom testovacom sete a úspešne rozpoznal aj novú osobu. Na demonštráciu praktického využitia sme vyvinuli jednoduchý klient-server systém. Používateľ si odfotí tvár pomocou mobilnej aplikácie, po čom je obrázok spracovaný a prevedený na vektor. Tento vektor je následne odoslaný na server na účely autentifikácie. Server využíva predtrénovaný model na overenie identity používateľa a na základe výsledku mu udelí, alebo zamietne další prístup do systému.
This thesis presents a face recognition system with integrated data privacy. We focused on using the MLPClassifier, exploring key machine learning concepts like neural networks and activation functions. To protect user data, we applied Differential Privacy, using the Laplace mechanism to maintain accuracy while safeguarding individual records. We also used eigenfaces to extract key facial features and improve recognition efficiency. The system was implemented in Python, using the Labeled Faces in the Wild (LFW) dataset with preprocessing steps such as resizing, grayscale conversion, and normalization. We were able to add new new individual to dataset expanding dataset. The model achieved 75–80\% accuracy on a separate test set and successfully recognized new individual. For real-world application, we developed a simple client-server system. Users capture photos via a mobile app, after which the image is processed and converted into a feature vector. This vector is then sent to the server for authentication. The server uses a pretrained model to verify the user, either granting or denying further access to the system.
This thesis presents a face recognition system with integrated data privacy. We focused on using the MLPClassifier, exploring key machine learning concepts like neural networks and activation functions. To protect user data, we applied Differential Privacy, using the Laplace mechanism to maintain accuracy while safeguarding individual records. We also used eigenfaces to extract key facial features and improve recognition efficiency. The system was implemented in Python, using the Labeled Faces in the Wild (LFW) dataset with preprocessing steps such as resizing, grayscale conversion, and normalization. We were able to add new new individual to dataset expanding dataset. The model achieved 75–80\% accuracy on a separate test set and successfully recognized new individual. For real-world application, we developed a simple client-server system. Users capture photos via a mobile app, after which the image is processed and converted into a feature vector. This vector is then sent to the server for authentication. The server uses a pretrained model to verify the user, either granting or denying further access to the system.
Description
Citation
HABERLAND, M. Ochrana osobních údajů v ML analýze [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
bez specializace
Comittee
doc. Ing. Lukáš Malina, Ph.D. (předseda)
JUDr. Pavel Loutocký, BA (Hons), Ph.D. (místopředseda)
Ing. Petr Dzurenda, Ph.D. (člen)
Ing. Radek Možný, Ph.D. (člen)
Ing. Vítězslav Křivánek, Ph.D. (člen)
Ing. David Smékal (člen)
Ing. Marek Sikora (člen)
Date of acceptance
2025-06-17
Defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky.
Student obhájil bakalářskou práci s výhradami a odpověděl na otázky členů komise a oponenta.
Otázky oponenta:
Proč jste při řešení využil techniku Differential privacy (DP) a porovnával jste i jiné anonymizační techniky, jako je např. k-pixelation?
- student dostatečně vysvětlil otázku.
Z jakého důvodu trvalo trénování po přidání dalších fotografií kratší dobu, tj. místo cca 29 s pouze 19 s?
- student dostatečně vysvětlil otázku.
Jaké parametry ovlivňují poměr mezi soukromím a přesností a jakým způsobem jste tyto parametry zvolil?
- student dostatečně vysvětlil otázku.
Result of defence
práce byla úspěšně obhájena
