OTÁHAL, M. Sledování pohybu očí pomocí kamery [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2015.

Posudky

Posudek vedoucího

Janoušek, Oto

Diplomová práce srozumitelně představuje přístupy k bezkontaktnímu sledování pohybu očí pomocí webkamery. Krátká teoretická část shrnuje a vzájemně srovnává současné přístupy, hlavní důraz je kladen na využití běžné webkamery. Praktická část práce je rozsáhlá a dokumentuje studentovu mimořádnou aktivitu během vypracovávání práce. Student vyzkoušel čtyři metody pro detekci zornice, a na základě jejich srovnání a zohlednění zadáním preferované metody umožňující zpracování v reálném čase správně vybral metodu využívající infračervený přísvit oka. Následně student implementoval a srovnal přístupy k automatické detekci obličeje, očí a zornice ve snímcích z webkamery umístěné na monitoru. Kvůli nízkému rozlišení kamery, které neumožňovalo dosahovat vysoké přesnosti sledování trajektorie pohybu, student umístil kameru blíže k oku pomocí přípravku na helmě a v práci následně popsal kalibraci a transformaci snímané scény vedoucí k sjednocení kalibračních a snímaných bodů. Vynikající dosažená přesnost bezkontaktního sledování pohybu očí je dokumentována jak na kalibračních šablonách, tak na skupině dobrovolníků. Zadání bylo splněno v celém rozsahu, student nad rámec zadání během konzultací přicházel s vlastními rozšiřujícími nápady a po celou dobu pracoval aktivně a samostatně.

Navrhovaná známka
B
Body
87

Posudek oponenta

Walek, Petr

Předložená práce studenta Miroslava Otáhala se věnuje detekci polohy očí nasnímaných webovou kamerou za účelem zjištění pozice na monitoru, na kterou se sledovaná osoba dívá, a to s důrazem na zpracování v reálném čase. Student navrhl a zrealizoval řešení založené na detekci zornice snímané webovou kamerou s infračerveným přísvitem a převodu její pozice na pozici na body pohledu na monitoru polynomiální geometrickou transformací. Samotný text práce trpí celou řadou nedostatků. Především není zřejmé, které ze studentem popsaných algoritmů jsou v práci využity: na začátku kapitoly 4 se mluví o dvou přístupech k řešení, ale detailní popis metody (kap. 7) a prezentace výsledků (kap. 8) je prezentován pouze na přístupu s kamerou v blízkosti oka. Není tedy vůbec zřejmé, zda a s jakými výsledky byl přístup s kamerou umístěnou pod monitorem implementován. Poměrně nejasné je i zařazení třetí kapitoly, popisující některé přístupy k detekci pozice očí. Pravděpodobně se nejedná o soupis publikovaných metod (chybí zde citace literatury) a jsou-li to metody navržené studentem, nejsou už v práci dále zmíněny a není jasné, zda jsou vůbec využívány. Práce se tak stává velmi nepřehlednou, což by mohlo napravit i velmi jednoduché blokové schéma programu, které v práci ovšem není. Text působí nesourodě a je těžké se v něm orientovat. Dle mého názoru by logické stavbě textu pomohla i změna zařazení některých kapitol (např. kap. 5). Odborná stránka práce je na nízké úrovni. Popisy použitých metod zpracování obrazů jsou velmi povrchní a místy nepřesné a často chybí i informace, jakou metodu student použil (viz obr. 12, kde jsou metody v jednotlivých fázích zpracování nahrazeny slovem "úprava" a ani v doprovodném textu se nelze dozvědět, o jaké úpravy se konkrétně jedná). Dále v práci úplně chybí teoretické popisy některých (pro práci zásadních) metod zpracování obrazu, které jsou v práci využity (např. princip odhadu geometrické transformace z kontrolních bodů, morfologické operace atd.). Z nesprávně zapsané rovnice 7.1 nabývám dojmu, že student ne zcela dobře pochopil princip geometrických transformací obrazových dat. V práci se student nevyvaroval některým chybám z oblasti základů matematiky (rovnici kružnice 3.1 nazývá rovnicí kruhu, matice v rovnici 7.1 má v prvním řádku jiný počet prvků než ve druhém a její prvky jsou odděleny čárkami) a terminologie zpracování obrazů (např. záměna pojmů rozměry a rozlišení obrazu, šedotónové obrazy jsou nazývány "černobílými" atd.). Konstatuji, že z popisu v souvisejícím textu nejsem schopen se dovtípit, jakým způsobem jsou "dointerpolovány" modré body v obrazu 23 a zda se vůbec jedná o interpolaci. Stejně tak je velmi obtížné z doprovodného textu pochopit, jak se z bodů pohledu sestavuje zájmová mapa. Také k metodice hodnocení přesnosti navrženého algoritmu mám výhrady. Některá tvrzení jsou uváděna bez důkazů i bez odkazu na literaturu (např. tvrzení, že přesnost navržené metody je srovnatelná s přesností elektrookulografie v kap. 5). Po formální stránce vytýkám formát úvodu, který je spíše shrnutím obsahu následujících kapitol a umístění souboru obrázků 27 až 48 do textu (dle mého názoru by měl patřit spíše do příloh). Za slabinu práce považuji také práci s literaturou, v práci postrádám literární rešerši publikovaných metod pro detekci očí, která je součástí zadání, tak i větší množství odkazů na literaturu, které by dokládaly, že se student detailně seznámil s principy metod, které v práci používá. Práci jako celek hodnotím stupněm D - 63b.

Navrhovaná známka
D
Body
63

Otázky

eVSKP id 84478