BJELOVÁ, M. Registrace obrazových sekvencí z experimentálního videooftalmoskopu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2021.

Posudky

Posudek vedoucího

Kolář, Radim

Studentka Martina Bjelová pracovala na zadaném tématu z velké části samostatně, dle potřeby konzultovala výsledky a další kroky. Častější konzultace by pravděpodobně přispěly k efektivnějšímu řešení diplomové práce. Některé problémy řešené na konzultacích nebyly zcela pochopeny a vedly ke zpoždění či odlišnému a ne zcela korektnímu způsobu řešení. Velká část práce pak byla věnována zrychlování algoritmů. Byť se nepodařilo zcela implementovat verzi algoritmu, který by bylo použitelný v reálném čase, tak implementace je přehledná a může sloužit jako základ pro další testování a úpravu algoritmu. K textu práce nemám zásadních připomínek. Studentka prokázala schopnost prostudovat a implementovat zvolené postupy a komplexně řešit zadaný úkol. Práci tak hodnotím stupněm C.

Navrhovaná známka
C
Body
78

Posudek oponenta

Vičar, Tomáš

Studentka se v práci zabývá registrací obrazových sekvencí z videooftalmoskopu pomocí fázové korelace. V práci využívá metodu fázové korelace pro nalezení posunu, rotace a škálování. Testuje využití různých referenčních snímků pro registraci sekvence a zkoumá výpočetní náročnost této metody. Po formální stránce je práce na dobré úrovni a studentka využívá potřebný počet kvalitních referencí. Titulky obrázků a tabulek jsou však mnohdy nedostatečné. Teoretický popis registrací obrazu není nejvhodněji členěn a obsahuje drobné nepřesnosti. Hůře je na tom, ale popis samotné fázové korelace. Studentka se pouští do popisu rozšířené fázové korelace bez toho, aby popsala, co je nerozšířená fázová korelace. Při popisu rozšířené fázové korelace uvádí odvození vzorců principu, avšak jejich popis je pro pochopení metody nedostatečný. Nikde se nezmiňuje o praktickém aspektu věci, jak nám tyto vztahy pomůžou odhadnout posun/rotaci/změnu měřítka. Není ani jasné, zda byly pro odhad rotace a škálování využity vzorce 3.9 a 3.11 nebo vzorec 3.17. Obrázky 4.1 a 4.2 nedávají příliš smysl - blok „fázová korelace“ musí pravděpodobně v obou blokových diagramech znamenat něco jiného; co znamená blok „interpolace získaných parametrů“ není nikde vysvětlené a nedává mi to v kontextu obrázku smysl. Dále nerozumím smyslu vzorce 4.1, ale nemyslím si, že vstupem by mělo být „křížové spektrum“. Ve vzorci 3.5 je chyba. Nerozumím také vzorci 4.3 – má zde pravděpodobně být výpočet euklidovské vzdálenosti mezi pozicemi dvou bodů, ale je zde popsána euklidovská vzdálenost jako podobnostní kritérium dvou obrazů (čili euklidovská vzdálenost hodnot pixelů ne jejich pozic). Není pak jasný ani vzorec 4.4, kde není řečeno z jakých hodnot je směrodatná odchylka počítaná a je tak zcela nejasný její význam ve výsledcích práce. Musím také vytknout nepřehlednost výsledkových tabulek, obsahující hodnoty pro jednotlivé snímky a body. Množství čísel znemožňuje srovnání jednotlivých modifikací metody. Výrazně pak chybí sumarizační tabulka (nebo graf), kde by byli jednotlivé modifikace srovnány a výsledky je tak nutné složitě srovnávat z několika tabulkek. Značnou komplikaci pak přináší chybějící jednotky v tabulkách pro výpočetních časů, zvláště když např. tabulka 6.1 obsahuje současně čísla v sekundách i milisekundách. Výsledky v tabulce 5.4 jsou dle mého názoru zcela zbytečné, neboť z principu fázové korelace by měl výpočet trvat stejně dlouho nezávisle na obsahu snímku. K tabulce 6.2 studentka uvádí – „je možné spozorovať, že trvanie registrácie závisí na kvalite registrovaného záznamu“ – netuším jak bych toto měl z tabulky vyčíst. Podobné nejasné věty se ve výsledcích vyskytují poměrně často. Veškeré grafy a tabulky v přílohách pak považuji za zbytečné, neboť nejsou dostatečně popsány, což zcela znemožňuje jejich interpretaci. Za velmi špatně provedenou pak považuji snahu zrychlení výpočtu, kde studentka testuje vliv podvzorkování obrazu, což se logicky projevuje na kvalitě registrace a navíc vede ke zpomalení. To je ale zřejmé vzhledem k tomu, že většinu výpočetního času zabírá geometrická transformace obrazu. Za zásadní chybu pak považuji to, že se studentka nesnaží zrychlit právě nejpomalejší část algoritmu - geometrickou transformaci obrazu a na místo toho zrychlení provádí snížením rozlišení výsledné sekvence, což považuji za velmi nevhodné a v praxi nepoužitelné. Studentka v práci uvádí, že geometrická transformace pomocí rotace a škálování trvá 5 ms, ale posun obrazu 185 ms, což je výrazně nejpomalejší krok algoritmu. Nerozumím tomu, proč se touto věcí studentka v práci nezabývá, když logicky jde o stejnou interpolaci obrazu a obě transformace by měli trvat zhruba stejně dlouho. Z kódu jsem pak zjistil, že je to způsobeno použitím jiné knihovny pro tuto operaci, k čemuž navíc nevidím důvod. Zásadního zrychlení (~ 4x) by tak šlo dosáhnout jednoduchým použitím stejné knihovny (OpenCV), také pro posun obrazu. Že toto studentka neodhalila považuji za projev zásadní neznalosti. Navíc bych zde očekával, že se pokusí nahradit tento krok jinou rychlejší formou interpolace (např. nejbližším sousedem), což by opět mohlo vést k mnohonásobnému zrychlení. Množství praktických výsledků pak považuji na diplomovou práci za poměrně omezené vzhledem k jednoduchosti metody. Kladně však hodnotím vlastní a zajímavý přístup k hodnocení kvality registrace. I přes uvedené nedostatky studentka metodu úspěšně aplikovala a dostatečně vyhodnotila. Zadání práce bylo také splněno a proto hodnotím stupněm D - 62 bodů.

Navrhovaná známka
D
Body
62

Otázky

eVSKP id 134439