BENEŠ, J. Unární klasifikátor obrazových dat [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2021.

Posudky

Posudek vedoucího

Horák, Karel

Pan Jiří Beneš zpracoval zadané téma unární klasifikátor obrazových dat. Z hlediska vedení byl přístup diplomanta v podstatě samostatný. Konzultace využil pouze jednou a finální verzi dokumentu vložil do IS také bez předchozí korekce. Přesto na základě na začátku poskytnuté sady informací a ilustračních odkazů zpracoval dobrý přehled unárních klasifikačních metod obsahující kategorie hraničních, rekonstrukčních a jiných metod. Dále diplomant pořídil dle zadání testovací sadu snímků rezistorů pro praktickou část práce o objemu 1200 snímků rozdělených na dvě poloviny. Nakonec v prostředí PyTorch provedl implementaci aplikace pro testování různých architektur vhodných pro unární klasifikaci založených na konvolučních neuronových sítích. Výsledky testů, kterých diplomant provedl pro různá nastavení architektur nemálo, jsou však v kapitole 5.4 popsány nepříliš přehledným a srozumitelným způsobem. Diplomant zde zejména nepoužívá veličiny ve strojovém učení pro testování tohoto typu mechanismů obvyklé jako např. charakteristiky citlivosti, sensitivity nebo F1 vypočitatelné z matice záměn apod. Z formálního pohledu se mi stylisticky a typograficky práce nejeví jako příliš zdařilá, samotný praktický výstup ve formě vlastního anotovaného datasetu a implementace aplikace lze pak hodnotit jako přínosnější. Práci i přes uvedené výtky doporučuji jako vedoucí k obhajobě před komisí.

Navrhovaná známka
D
Body
65

Posudek oponenta

Petyovský, Petr

Zadání diplomové práce bakaláře Jiřího Beneše mělo odpovídající náročnost vhodnou pro vysokoškolskou diplomovou práci. Cílem práce bylo provést nejprve základní rešerši v oblasti unární klasifikace obrazových dat (jedná se o specifickou variantu učení klasifikátoru bez učitele). Úkolem bylo sestavit seznam architektur klasifikátorů vhodných pro tuto variantu učení, spolu se základním popisem fungování jednotlivých architektur a příklady jejich použití. Mezi další úkoly patřila definice vhodné praktické demonstrační úlohy používající tuto variantu učení. Dále pořízení dostatečného množství zkušebních obrazových dat a zkušební implementace klasifikátoru pro prvotní otestování. Dalším krokem byla závěrečná re-implementace klasifikátoru v jazyce Python do formy jednoúčelové aplikace, pomocí které bude možné modifikovat důležité parametry v rámci demonstrace funkčnosti klasifikátoru. Posledními body zadání bylo ověření funkce klasifikátoru na zkušební množině snímků a zhodnocení dosažených výsledků. Těchto cílů práce bylo pravděpodobně studentem dosaženo, ale výsledky nejsou dostatečně uvedeny v textu jeho práce. Přílohy práce neobsahují žádné videosekvence, které by mě jako oponenta přesvědčili, že je studentem realizovaná aplikace funkční. Přiložené CD obsahuje pouze zdrojové texty v jazyce Python a zkušební sadu snímků. Jako oponent postrádám spustitelný soubor realizované aplikace, nebo alespoň do jednotlivých adresářů uložené klasifikované snímky, pro jednotlivé varianty klasifikátorů. Korektnost výsledků dosažených studentem ani funkčnost aplikace, bez těchto údajů nemohu jako oponent nijak ověřit. Nemožnost ověřit studentem dosažené výsledky vidím jako hlavní nedostatky této diplomové práce. Student nastudoval znalosti a definoval demonstrační úlohu. Jako demonstrační úlohu zvolil optickou klasifikaci validity elektrické součástky (rezistoru) na zkušebních snímcích a to na základě optického rozpoznání barevného označení hodnoty odporu a rozpoznání přítomnosti přívodů součástky. Diplomant realizoval aplikaci v jazyce Python dle požadavků zadání. Co ovšem v textu práce postrádám je zpracování posledního bodu zadání, kdy měl student obecně vyhodnotit výsledky experimentů a nastavení tzv. hyper parametrů. Diskuse nad zvolenou sadou možných hyper parametrů pro proces učení v textu práce zcela chybí a definice toho, co student definuje jako možné hyper parametry se dozvídáme, defakto mimochodem v podkapitole 5.1.1 až na straně 67. Student v textu práce hovoří přímo o re-implementaci, aniž žádnou předchozí zkušební implementaci žádného algoritmu nerealizoval. V textu kapitoly 4 zcela postrádám dokumentaci technických podmínek, za jakých byla pořízena zkušební sada snímků. Definice uvádějící, cituji: "Pro ovládání kamery potom byl použit Matlabovský script viz přílohy“, není rozhodně dostatečná, chybí zcela údaje o osvětlení scény a definici pozadí scény. Další doplnění zkušební sady snímků při zachování shodných podmínek, je tak prakticky nemožné. V kapitole 5 student uvádí skutečnost, cituji: "Vlastní re-implementační část se skládá z několika po sobě jdoucích logických programových bloků.“. Není mi jasné, jaké bloky máte na mysli a proč zde není uveden jejich soupis, případně nejsou prezentovány jejich vzájemné vztahy vhodnou grafickou formou. Student se pravděpodobně při řešení těchto závěrečných bodů zadání dostal do časové tísně a závěrečná podkapitola 5.4 (str. 70-79) již obsahuje pouze numerický výčet dosažených hodnot úspěšnosti klasifikace formou tabulek a grafů a to vše bez jakékoliv diskuze o významu těchto částečných výsledků, nebo jen vysvětlení jejich významu na provedení a úpravy dalších experimentů. Jediný odstavec na toto téma v závěrečné kapitole, dle mého názoru, naprosto neodpovídá požadavkům kladeným na zpracování výsledků diplomové práce. Text práce prvních dvou kapitol (tj. až do strany 45), obsahuje pouze postupný překlad textu literatury [1] [2] [3]. Ze stejných zdrojů jsou přejaty i obrázky a matematické vztahy. Úroveň této části textu neodpovídá požadavkům na text diplomové práce, neboť symboly a číselné parametry uváděné v uvedených matematických vztazích nejsou v textu práce vůbec vysvětleny, přestože v původní literatuře vždy precizně vysvětleny jsou. Diplomant do svého textu přeložil jen obecné úvodní odstavce kapitol a další části vysvětlující matematické vztahy již nepřekládal a pouze pomocí funkce "PrintScreen“ vložil z původního textu všechny vztahy jako obrázky, bez hlubšího vysvětlování. Pečlivým a opakovaným uváděním zdrojů odkud student všechny tyto informace, pro více jak 20 stran čerpal, mě sice opravňuje říci, že se nejedná o plagiát, ale bylo dle mého názoru úkolem vedoucího práce studenta v tomto naprosto zbytečném počínání zastavit. Text v těchto teoretických kapitolách měl prezentovat pouze znalosti, které student následně bude využívat při řešení dalších úkolů práce. Student se ale v těchto úvodních kapitolách pokouší prezentovat vše, co je obsaženo v literatuře [1] [2] [3]. Text těchto kapitol je díky absenci hlubší prezentace významu symbolů ve vzorcích naprosto zbytečný a díky studentovu nedokonalému překladu i matoucí. Navíc pro mnoho pojmů díky kompilaci témat z několika zdrojů diplomant používá různá označení, pro jiné pojmy vysvětlení naopak zcela chybí. Typickým příkladem je strana 25, kde je uveden diagram rozdělení klasifikačních metod bez jakéhokoliv vysvětlení významu uvedených zkratek. Počet stran věnovaných prezentaci nastudovaných znalosti a počet stran věnovaných prezentaci studentem dosažených výsledků je zvolen v nevhodném poměru: 48 stran nastudovaných znalosti ku 16 stranám textu s vlastními výsledky studenta. Celková formální úprava práce a její jazyková úroveň, je hluboce pod limitem, který je možné akceptovat. Práce obsahuje mnoho gramatických chyb a překlepů, z čehož usuzuji, že text práce neprošel ani minimální jazykovou kontrolou. Prakticky každá strana textu práce obsahuje překlepy či jiné nedostatky. Překlep ve jméně vedoucího práce v poděkování na straně 7 je toho typickým příkladem. Student si pravděpodobně neuvědomil, že výsledkem má být text představující technickou zprávu prezentující myšlenky v logickém sledu a s precizní jazykovou kontrolou. Mnoho vět je psáno stylem, kdy podmět několikrát v rámci jediné věty změní rod. Oddělení jednotlivých souvětí čárkou na mnoha místech chybí úplně, což dále snižuje orientaci čtenáře v textu. Ukázkovým příkladem této skutečnosti jsou kapitoly: Úvod a Závěr. Závěrem je tedy možné zhodnotit, že student zrealizoval požadovanou aplikaci, ale zcela podcenil prezentaci dosažených výsledků a zpracování textu práce. Z úrovně zpracování textu práce tak odhaduji, že se student pravděpodobně nevěnoval řešení práce v rozsahu, který dané zadání požadovalo. Charakter textu práce a úroveň dokumentace bohužel prozatím nesvědčí o inženýrských schopnostech diplomanta, a práci tedy nedoporučuji k obhajobě s hodnocením: F / 46 bodů. S ohledem na nutnost omezeného přístupu do laboratoří v obou semestrech, prosím komisi, aby pokud to bude možné, umožnila studentovi práci dopracovat a opětovně odevzdat v nejbližším možném termínu, neboť je pravděpodobně ve studentových silách text práce během několika týdnů revidovat do obhajitelné verze. Studentem realizovaná aplikace je pravděpodobně funkční, jen text práce neobsahuje zhodnocení studentem dosažených výsledků a je tedy třeba opravit a doplnit jen text jeho diplomové práce. Prosím studenta, aby případnou možnost dopracování textu práce chápal jako příležitost uvést text jeho práce do publikovatelné úrovně, která mu v budoucnu nebude dělat ostudu v jeho další profesní kariéře. Hodnocení: Nevyhovující – F/46 bodů.

Navrhovaná známka
F
Body
46

Otázky

eVSKP id 134347