KYLIÁN, J. Tvarová analýza obrazových dat [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2017.

Posudky

Posudek vedoucího

Chmelík, Jiří

Po formální stránce je práce na dobré úrovni a obsahuje jen občasné drobné překlepy či neodborné výrazy, a dosažené výsledky a jejich diskuze jsou nestandardně obsaženy v kapitole vlastního řešení. Student v práci vhodně citoval a využíval domácích, tak i zahraničních zdrojů. Student nevyužíval konzultací během semestru, kromě posledních týdnů před odevzdáním, stejně jako během řešení semestrální práce. Během měsíců potřebných pro opravu bakálářské práce byla aktivita studenta výrazně vyšší. Body zadání považuji za splněné, avšak za nedostatek považuji nepřítomnost výsledků či diskuze pro testování 3D algoritmů na reálných medicínských datech z bodu zadání 5, i přes to, že se student danou problematikou v praxi zabýval. Práci doporučuji k obhajobě a hodnotím stupněm B (80 bodů).

Navrhovaná známka
B
Body
80

Posudek oponenta

Harabiš, Vratislav

Student se měl ve své práci zabývat problematikou tvarové analýzy obrazových dat. Předložená přepracovaná práce má rozsah 46 stran a je členěná do čtyř kapitol včetně úvodu. Bohužel členění kapitol není příliš vhodné a stále působí dosti zmateně. Jedním příkladem může být kapitola 1.1.1. kde se v druhé odstavci nachází zvýrazněné názvy „eroze“ a „dilatace“ aby následně dále v textu byly vysvětleny pod tučným nadpisem „Eroze a dilatace“ a následují další odstavce nazvané „Eroze“ a následně „Dilatace“. K nepřehlednosti přispívá fakt, že práce je členěná na pouze tři hlavní kapitoly (Teoretický úvod, Řešení studentské práce a Závěr). Mnohem vhodnější bylo členit práci na více kapitol a vyhnout se tak členění na podkapitoly třetí úrovně. V teoretické části práce student popisuje metody předzpracování obrazů pro tvarovou analýzu a následuje popis tvarových deskriptorů a klasifikace obrazových dat. V této části práce je uvedeno mnoho mylných a zavádějících informací, které ukazují na nedostatečnou znalost problematiky. Již první dvě věty kapitoly 1.1.2 zní poněkud zvláštně. Dále zde student píše, že odstraněním šumu z obrazu jsou odstraněny některé informace a tím dojde ke zmenšení obrazu z hlediska paměti. To je přinejmenším dost zavádějící tvrzení. Při zpracování obrazů je obraz v systému reprezentován matici o určitém datovém typu v paměti a odstraněním šumu se velikost nijak nezmění. To je možné snad jen u některých komprimačních algoritmů při ukládání dat, ale to je v tomto případě zcela irelevantní. Impulsní šum vzniká následkem defektního snímače, ale to především u běžných fotoaparátů, nikoliv u medicínských CT. V této kapitole se rovněž píše (odstavec Mediánový filtr, kFill filtr), že tyto filtry využívají masku 3x3, což samozřejmě není pravda vždy, protože velikost masky lze volit. A následuje tvrzení, že touto maskou jsou filtrovány především regiony o velikosti 1pixel, což je u masky velikosti 3x3 chybné tvrzení. Navíc region o velikosti 1pix není region, ale právě ten jeden pixel. Pro klasifikaci obrazových dat student zvolil Hammingovou síť, která ale pro tento typ úlohy není příliš vhodná, kdy se obratle mohou nacházet v obrazech ve vzájemně posunutých polohách atd. V kapitole 1.3 student píše, že vstupem Hammingovy sítě jsou hodnoty již binarizovaného obrazu, a následně jsou počítány hodnoty Hammingovy vzdálenosti z těchto binarizovaných pixelů, což je přinejmenším zvláštní postup. V praktické části práce se student zaměřil na generování syntetických dat a získání jejich deskriptorů. Z pokročilých využívá Fourierův deskriptor a Zernikovy momenty (u ZM využil existující algoritmus). Bohužel převážnou část tvoří především generování základních geometrických tvarů a uvádění hodnot jejich deskriptorů. Tato část je naprosto zbytečná a stačilo jej uvést v jedné souhrnné tabulce. Syntetická data dále nejsou nijak využitá. Pouze v kapitole 2.2.2 se nachází vágní tvrzení, že klasifikace těch útvaru byla provedena s úspěšností kolem 90-100 %. Tohle je naprosto nedostatečné. U syntetických dat bych očekával využití možnosti generování dat ke stanovení citlivosti navržených klasifikačních postupů na změnu velikosti tvaru, na natočení tvaru, na schopnost, do jakého poměru stran je schopen rozlišovat obdélník a čtverec nebo mnohoúhelník a kruh atd. Student využil navržené deskriptory pro klasifikaci reálných dat (obratlů). Student doplnil rozbor dosažených výsledků o stanovení senzitivity a specificity. Bohužel uvedení výsledků pomocí grafů (Obr 41 až 43) je nevhodné. V grafech je na Y-ose Příslušnost ke shluku v procentech, a přitom grafy dosahují maximálně hodnoty 1. Na ose X je uveden mix jednotlivých pacientů a jejich různých obratlů. Následuje kapitola generování 3D objektů, ale chybí jakákoliv návaznost na práci nebo význam tohoto generování. U odevzdaných zdrojových souborů postrádám návod ke spuštění a popis jednotlivých funkcí, u mnohých funkcí chybí komentáře ve zdrojovém kódu a některé zdrojové kódy vypadají jako kopie některých výukových skriptů (např.: soubor hamming.m, kde jsou proměnné s názvy y_briza, y_borovice a v komentářích se hovoří o rozpoznávaní pylových zrnek.). Po formální stránce došlo k odstranění těch nejhorších nedostatků, nicméně některé zůstaly a některé se objevily nové. Obrázky s jednotlivými popisky nepatří vedle sebe (Obr. 4 až Obr. 27), v tomto případě je potřeba obrázky označit například písmeny a použít jeden popisek. V Tab. 10 není jasné, co který sloupec znamená. Popisek Tab. 16 hovoří o kouli a v záhlaví tabulky je uveden kvádr. Práce je doplněná o citaci celkem 19 zdrojů, což je dostatečné. Nicméně některé zdroje nejsou příliš vhodné. Jedná se zejména o určité pomocné prezentace k výuce bez uvedení autora (zdroj [15], [19]) nebo další materiály a skripta ([6], [8], [16], které nejsou primárními zdroji. Navíc citace [8] a [16] nejsou v textu práce vůbec odkazovány. Nicméně po odborné stránce je práce stále velice slabá, obsahuje značné množství zmatečných tvrzení a vzhledem k uvedeným nedostatkům stále považuji zadání za splněné pouze částečně. Chybí testování na simulovaných datech (část bodu 3 zadání), rovněž chybí rozšíření software o práci se 3D obrazy (část bodu 4 zadání), kdy jsou 3D obrazy pouze generovány.

Navrhovaná známka
E
Body
52

Otázky

eVSKP id 105937