Rekonstrukce nekvalitních snímků obličejů
but.committee | doc. Mgr. Adam Rogalewicz, Ph.D. (předseda) doc. Ing. Lukáš Burget, Ph.D. (místopředseda) doc. Ing. Michal Bidlo, Ph.D. (člen) Ing. Michal Hradiš, Ph.D. (člen) Ing. Martin Hrubý, Ph.D. (člen) Ing. Jaroslav Rozman, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: Na str. 30 píšete: "Počas implementácie modelov CARN2, DBPN3, DRCN4 a RCAN5 som sa inšpiroval už existujúcimi implementáciami." Co v této větě znamená slovo "inspiroval"? Čím si vysvětlujete, že použití diskriminátoru v duchu GAN výsledky pouze zhoršilo? Podle literatury i z logiky věci by mělo výsledky zlepšit. Podle grafů z obr. 6.8 neuronová síť produkuje z hlediska rozpoznávání identity spíše horší než "tupá" bikubická interpolace. Čím si to vysvětlit? Co přesně klasifikujete v rámci práce? Trénoval jste síť vždy na zvýšení rozlišení obrázku? Zkoušel jste práci na něco jiného, než obličeje? | cs |
but.jazyk | slovenština (Slovak) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Hradiš, Michal | sk |
dc.contributor.author | Bako, Matúš | sk |
dc.contributor.referee | Herout, Adam | sk |
dc.date.created | 2020 | cs |
dc.description.abstract | V tejto diplomovej práci sa venujem superrezolúcii obrázkov tvárí pomocou konvolučných neurónových sietí so zameraním na zachovanie identity. Ako riešenie problému navrhujem metódu pozostávajúcu z architektúry DPNet a spôsobu trénovania, ktorá vychádza z moderných metód superrezolúcie pomocou neurónových sietí. Model architektúry DPNet je trénovaný na dátovej sade Flickr-Faces-HQ, kde pri štvornásobnom zväčšení dosahuje hodnotu SSIM 0.856, pričom najlepšia z vybraných moderných architektúr, nazývaná Residual channel attention network, dosahuje po natrénovaní hodnotu 0.858. Pri trénovaní modelov pomocou adversariálnej chyby sa v obrázkoch objavovali rôzne artefakty, pričom som experimentoval s viacerými metódami pre ich odstránenie, čo zatiaľ neviedlo k zlepšeniu. Pre porovnanie hodnotenia kvality s ľudským vnímaním som vyhodnotil dotazník, kde sú obrázky zoradené podľa kvality. Výsledky ukazujú, že navrhnutá architektúra sa kvalitou približuje najnovším metódam. | sk |
dc.description.abstract | In this thesis, I tackle the problem of facial image super-resolution using convolutional neural networks with focus on preserving identity. I propose a method consisting of DPNet architecture and training algorithm based on state-of-the-art super-resolution solutions. The model of DPNet architecture is trained on Flickr-Faces-HQ dataset, where I achieve SSIM value 0.856 while expanding the image to four times the size. Residual channel attention network, which is one of the best and latest architectures, achieves SSIM value 0.858. While training models using adversarial loss, I encountered problems with artifacts. I experiment with various methods trying to remove appearing artefacts, which weren't successful so far. To compare quality assessment with human perception, I acquired image sequences sorted by percieved quality. Results show, that quality of proposed neural network trained using absolute loss approaches state-of-the-art methods. | en |
dc.description.mark | B | cs |
dc.identifier.citation | BAKO, M. Rekonstrukce nekvalitních snímků obličejů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2020. | cs |
dc.identifier.other | 129320 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/192500 | |
dc.language.iso | sk | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | superrezolúcia | sk |
dc.subject | počítačové videnie | sk |
dc.subject | neurónové siete | sk |
dc.subject | rekonštrukcia obrázkov | sk |
dc.subject | super-resolution | en |
dc.subject | computer vision | en |
dc.subject | neural networks | en |
dc.subject | image reconstruction | en |
dc.title | Rekonstrukce nekvalitních snímků obličejů | sk |
dc.title.alternative | Facial image restoration | en |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2020-07-14 | cs |
dcterms.modified | 2020-07-17-14:40:14 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 129320 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.26 15:31:43 | en |
sync.item.modts | 2025.01.17 12:02:38 | en |
thesis.discipline | Inteligentní systémy | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 13.16 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-23003_v.pdf
- Size:
- 85.61 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-23003_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-23003_o.pdf
- Size:
- 91.02 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-23003_o.pdf
Loading...
- Name:
- review_129320.html
- Size:
- 1.43 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_129320.html