PAVLÍK, J. Analýza cytologických snímků [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2012.

Posudky

Posudek vedoucího

Kolář, Radim

Diplomant Jan Pavlík pracoval aktivně, samostatně a se zájmem po celou dobu řešení projektu. Na konzultace, které využíval dle potřeby, chodil připraven a měl věcné dotazy. Aktivně navrhoval řešení, především ve fázi předzpracování a segmentace objektů. Samotný text práce považuji za kvalitní a zodpovědně zpracovaný. V průběhu řešení vznikla, jako součást řešení, sada kvalitních snímků, která bude využitelná pro další projekty a také ve výuce. Práci a přístup studenta tedy celkově hodnotím stupněm A/90.

Navrhovaná známka
A
Body
90

Posudek oponenta

Blaha, Milan

Předložená diplomová práce se zabývá problematikou morfologické klasifikace leukocytů do tříd na základě zpracování mikroskopických snímků periferní krve. Řeší komplexně celý klasifikační proces, od nasnímání vlastních obrazových snímků, přes jejich předzpracování a segmentaci jednotlivých leukocytů až k jejich klasifikaci do pěti kategorií. Návrhu vlastního klasifikačního algoritmu předchází rešerše literatury a stručné hodnocení používaných postupů. Práce je na dobré odborné úrovni, přehledně používá základní i pokročilé techniky zpracování obrazů, jako úpravy histogramu, prahování a detekce hran v obrazech, morfologické operace. Tyto postupy logicky zapojuje do kaskády vlastního navrhovaného klasifikačního algoritmu. Z práce je zřejmé, že autor použitým metodám rozumí a zcela samozřejmě je používá. Druhá část navrženého algoritmu, navazující na zpracování obrazů leukocytů, se zaměřuje na výběr příznaků jádra a cytoplazmy leukocytů použitelných pro jejich klasifikaci – hodnotí barevnost, obvody a plochy struktur leukocytů, parametry histogramu. Posouzení použitelnosti těchto příznaků s ohledem na separovatelnost klasifikovaných skupin je opět velmi přehledně statisticky zpracováno. Výsledkem je volba intenzit barevných RGB kanálů jádra a cytoplazmy leukocytů jako základního klasifikačního parametru a geometrických parametrů leukocytů jako parametrů doplňkových. Vlastní klasifikační algoritmus se opírá o použití dopředné neuronové sítě, které jsou tyto příznaky předkládány. Problematika návrhu struktury a parametrů neuronové sítě není obecně formalizována a vždy závisí na konkrétním řešeném problému a dostupných datech. I v této práci byl tedy autor nucen při návrhu sítě široce experimentovat s různými nastaveními a konfiguracemi neuronového klasifikátoru, kde tato snaha vyústila ve vlastní, ne zcela obvyklý, ale funkční a přínosný návrh kaskádového použití dvou neuronových sítí za sebou, kdy první z nich klasifikuje leukocyty do tří sloučených tříd na základě barevnosti a další dvě vedlejší neuronové sítě pak provádí definitivní rozdělení podskupin leukocytů do výsledných pěti kategorií. Princip klasifikace pomocí neuronové sítě je v práci dobře popsán, realizace klasifikátoru a nastavení algoritmu učení a klasifikace je provedeno korektně. Drobnou poznámku lze mít k počtu klasifikovaných vzorků a jejich rozdělení do trénovací a testovací množiny, jak je diskutováno dále. Lze také předpokládat, že by větší počet dostupných vzorků mohl vést k dalšímu zlepšení klasifikace, ev. k možnosti sloučení kaskády neuronových sítí do jediného neuronového klasifikátoru. Vyhodnocení výsledků je provedeno hodnocením chybovosti neuronového klasifikátoru a jeho senzitivity a specificity pro jednotlivé kategorie leukocytů. Vyhodnocení chybovosti sítě je provedeno pro trénovací množinu s použitím 80% ze všech vzorků, kde klasifikátor chybně klasifikoval jen 10% vzorků, autor diskutuje možné vlivy na dosažené výsledky, zejména s ohledem na různou četnost zastoupení jednotlivých typů leukocytů ve zpracovávaných datech. Podrobnější vyhodnocení klasifikátoru formou senzitivity/specificity je dostupné pouze pro natrénování klasifikátoru nad všemi dostupnými daty, pro předchozí případ, kdy je 20% vzorků vyhrazeno pro testování, není bohužel v práci uvedeno. Celý navržený klasifikátor byl autorem naprogramován ve vývojovém prostředí MATLAB. K práci mám jen dvě poznámky: Programový kód se bohužel nepodařilo přes úpravy v kódu plně spustit ve verzi MATLAB 7.0.4, což přičítám nekompatibilitě verzí SW a ne tedy autorovi. V programovém kódu by tedy bylo vhodné uvést, pro jakou verzi prostředí je program určen. Nicméně programový kód je velmi přehledný a umožnil tak provést korekce kódu a posouzení podpořené i dílčími obrazovými výstupy programu. Pro demonstraci funkcionality navrženého algoritmu tedy plně dostačuje. Další poznámka se týká volby celkové velikosti množiny zpracovávaných dat a zejména rozdělení příznaků do trénovací a testovací množiny pro neuronový klasifikátor. Při poměru počtu vzorků trénovací/testovací 80/20 procent zůstává v testovací množině jen velmi malý počet vzorků jednotlivých kategorií a je tedy otázkou, nakolik jsou dosažené výsledky reprezentativní. Ze stejného důvodu pravděpodobně není provedeno podrobnější vyhodnocení senzitivity/specificity klasifikátoru pro toto rozdělení dostupných dat. Autor následně rozšiřuje trénovací množinu na všechny dostupné vzorky a na prakticky stejné množině pak probíhá i výsledné hodnocení úspěšnosti klasifikátoru. Je třeba říci, že tento postup nezaručuje obecnost navrženého klasifikátoru pro klasifikaci dalších, síti dosud neznámých vzorků. Celý postup byl ale determinován dostupností dat a je třeba velmi pozitivně hodnotit postup, jakým k tomuto problému autor přistupoval a jak jej vyřešil. Z práce je evidentní, že autor nastudoval a porozuměl celé problematice a své vědomosti použil při vlastním úspěšném návrhu a realizaci klasifikátoru založeného na segmentačních obrazových technikách, extrakci příznaků a použití neuronového klasifikátoru. Je třeba velmi pozitivně ocenit vlastní cestu a praktičnost řešení komplexního problému, logické spojení vědomostí a přístupů a jejich realizaci v programovém prostředí MATLAB. Závěrem lze konstatovat, že práce je odborně i formálně na velmi dobré úrovni, výběr prostudované literatury je dostatečný a práce zcela naplnila vytyčené zadání.

Navrhovaná známka
B
Body
85

Otázky

eVSKP id 51854