OTÁHAL, M. Sledování pohybu očí pomocí kamery [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2015.
Diplomová práce srozumitelně představuje přístupy k bezkontaktnímu sledování pohybu očí pomocí webkamery. Krátká teoretická část shrnuje a vzájemně srovnává současné přístupy, hlavní důraz je kladen na využití běžné webkamery. Praktická část práce je rozsáhlá a dokumentuje studentovu mimořádnou aktivitu během vypracovávání práce. Student vyzkoušel čtyři metody pro detekci zornice, a na základě jejich srovnání a zohlednění zadáním preferované metody umožňující zpracování v reálném čase správně vybral metodu využívající infračervený přísvit oka. Následně student implementoval a srovnal přístupy k automatické detekci obličeje, očí a zornice ve snímcích z webkamery umístěné na monitoru. Kvůli nízkému rozlišení kamery, které neumožňovalo dosahovat vysoké přesnosti sledování trajektorie pohybu, student umístil kameru blíže k oku pomocí přípravku na helmě a v práci následně popsal kalibraci a transformaci snímané scény vedoucí k sjednocení kalibračních a snímaných bodů. Vynikající dosažená přesnost bezkontaktního sledování pohybu očí je dokumentována jak na kalibračních šablonách, tak na skupině dobrovolníků. Zadání bylo splněno v celém rozsahu, student nad rámec zadání během konzultací přicházel s vlastními rozšiřujícími nápady a po celou dobu pracoval aktivně a samostatně.
Předložená práce studenta Miroslava Otáhala se věnuje detekci polohy očí nasnímaných webovou kamerou za účelem zjištění pozice na monitoru, na kterou se sledovaná osoba dívá, a to s důrazem na zpracování v reálném čase. Student navrhl a zrealizoval řešení založené na detekci zornice snímané webovou kamerou s infračerveným přísvitem a převodu její pozice na pozici na body pohledu na monitoru polynomiální geometrickou transformací. Samotný text práce trpí celou řadou nedostatků. Především není zřejmé, které ze studentem popsaných algoritmů jsou v práci využity: na začátku kapitoly 4 se mluví o dvou přístupech k řešení, ale detailní popis metody (kap. 7) a prezentace výsledků (kap. 8) je prezentován pouze na přístupu s kamerou v blízkosti oka. Není tedy vůbec zřejmé, zda a s jakými výsledky byl přístup s kamerou umístěnou pod monitorem implementován. Poměrně nejasné je i zařazení třetí kapitoly, popisující některé přístupy k detekci pozice očí. Pravděpodobně se nejedná o soupis publikovaných metod (chybí zde citace literatury) a jsou-li to metody navržené studentem, nejsou už v práci dále zmíněny a není jasné, zda jsou vůbec využívány. Práce se tak stává velmi nepřehlednou, což by mohlo napravit i velmi jednoduché blokové schéma programu, které v práci ovšem není. Text působí nesourodě a je těžké se v něm orientovat. Dle mého názoru by logické stavbě textu pomohla i změna zařazení některých kapitol (např. kap. 5). Odborná stránka práce je na nízké úrovni. Popisy použitých metod zpracování obrazů jsou velmi povrchní a místy nepřesné a často chybí i informace, jakou metodu student použil (viz obr. 12, kde jsou metody v jednotlivých fázích zpracování nahrazeny slovem "úprava" a ani v doprovodném textu se nelze dozvědět, o jaké úpravy se konkrétně jedná). Dále v práci úplně chybí teoretické popisy některých (pro práci zásadních) metod zpracování obrazu, které jsou v práci využity (např. princip odhadu geometrické transformace z kontrolních bodů, morfologické operace atd.). Z nesprávně zapsané rovnice 7.1 nabývám dojmu, že student ne zcela dobře pochopil princip geometrických transformací obrazových dat. V práci se student nevyvaroval některým chybám z oblasti základů matematiky (rovnici kružnice 3.1 nazývá rovnicí kruhu, matice v rovnici 7.1 má v prvním řádku jiný počet prvků než ve druhém a její prvky jsou odděleny čárkami) a terminologie zpracování obrazů (např. záměna pojmů rozměry a rozlišení obrazu, šedotónové obrazy jsou nazývány "černobílými" atd.). Konstatuji, že z popisu v souvisejícím textu nejsem schopen se dovtípit, jakým způsobem jsou "dointerpolovány" modré body v obrazu 23 a zda se vůbec jedná o interpolaci. Stejně tak je velmi obtížné z doprovodného textu pochopit, jak se z bodů pohledu sestavuje zájmová mapa. Také k metodice hodnocení přesnosti navrženého algoritmu mám výhrady. Některá tvrzení jsou uváděna bez důkazů i bez odkazu na literaturu (např. tvrzení, že přesnost navržené metody je srovnatelná s přesností elektrookulografie v kap. 5). Po formální stránce vytýkám formát úvodu, který je spíše shrnutím obsahu následujících kapitol a umístění souboru obrázků 27 až 48 do textu (dle mého názoru by měl patřit spíše do příloh). Za slabinu práce považuji také práci s literaturou, v práci postrádám literární rešerši publikovaných metod pro detekci očí, která je součástí zadání, tak i větší množství odkazů na literaturu, které by dokládaly, že se student detailně seznámil s principy metod, které v práci používá. Práci jako celek hodnotím stupněm D - 63b.
eVSKP id 84478