MANGA, M. Výběr příznaků metodou Dynamická vzájemná informace [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2014.

Posudky

Posudek vedoucího

Honzík, Petr

Cílem diplomové práce bylo nastudovat a implementovat metodu „Dynamic Mutual Information“ publikovanou v impaktovaném časopise „Pattern Recognition“ v roce 2009 a pokusit se navrhnout její modifikaci, obé pak vyhodnotit. Student Bc. Manga se řešení zadání věnoval již od počátku systematicky a pečlivě. Zdánlivě prostý úkol, nastudovat, pochopit a naprogramovat v publikaci popsanou metodu se zkomplikoval, neboť údaje o metodě samé nebyly úplné a jednoznačné. Autor na dotazy nereagoval, implementace metody nebyla nikde nalezena, a tak nezbylo než zkusit realizovat více variant a až porovnáním výsledků publikovaných a dosažených vlastní implementací se student dobral nejspíše skutečné podoby algoritmu. V dalších krocích pak student navrhl rozšíření metody, které vykazuje výrazného zlepšení, což samo o sobě jest materiálem vhodným k opublikování. Student pravidelně konzultoval, konzultace probíhaly formou dotazů a vlastních návrhů na pokračování. Student prokázal velmi dobré schopnosti zorientovat se v řešené problematice a určovat další směr vlastní práce. Jednoznačně prokázal inženýrské schopnosti. Hodnotím známkou A, výborně, 95 bodů.

Navrhovaná známka
A
Body
95

Posudek oponenta

Klusáček, Jan

Úkolem studenta bylo seznámit se s metodami výběru příznaků používaných ve strojovém učení. Podrobněji se měl seznámit s metodou Dynamické vzájemné informace (DMI). Tuto metodu měl implementovat a implementaci ověřit zopakováním publikovaných experimentů. Poté měl navrhnout, implementovat a otestovat vlastní metodu vycházející z metody DMI. Implementaci metody do prostředí Weka, nebo RapidMiner by měl popsat v podobě návodu. Zadaní hodnotím jako náročné po odborné i časové stránce. V první kapitole popisuje základní princip výběru příznaků, a některé používané metody. Dále jsou zde popsány klasifikátory, které jsou později použity při testování metod výběru příznaku. Následující kapitola obsahuje popis metody DMI, tak jak byla publikována. Jsou zde také zmíněny nejednoznačnosti v popisu metody. V další kapitole je popsána vlastní implementace DMI a nastavení experimentu. Výsledky provedených experimentu jsou srovnány s publikovanými výsledky. Tím je potvrzeno že vlastní implementace, i přes nejasný popis v příslušném článku, odpovídá původní metodě. Ve čtvrté kapitole jsou popsány dvě nové metody vzniklé rozšířením DMI. V následující kapitole jsou vyhodnoceny výsledky těchto nově navržených metod z hlediska přesnosti a stability, přičemž jedna z nových metod (DmRMR) v přesnosti překonává původní metodu. Vyhodnocení je doplněno o přehledné grafy popisující přesnost, stabilitu a podobnost metod. V poslední kapitole je podrobně popsána implementace metod do prostředí Weka a Rapidminer. Celá práce je logicky členěná a je na dobré technické úrovni. Při práci se musel student vypořádat s nejednoznačnostmi a nedostatky v popisu původní metody. Při implementaci zvolil nejpravděpodobnější řešení těchto nejasností a následně pomocí experimentu potvrdil že implementovaná metoda odpovídá původní publikované metodě. Součástí práce je návrh dvou nových metod odvozených z DMI. Jedna z těchto metod podává lepší výsledky než metoda původní.V práci oceňuji návod na implementaci těchto metod jako pluginy pro prostředí Weka a Rapidminer. Přes výše uvedené kvality práce obsahuje několik drobných vad. V popisu algoritmu 3-1 na čtvrtém řádku je uvedena množina D, z popisu algoritmu v textu však vyplývá že je použita množina D_S. Z popisu algoritmu je však zřejmé, že student algoritmus chápe a jedná se pravděpodobně jen o překlep. V kapitole hodnotící nové metody by bylo vhodné shrnout výsledky kromě grafů také do tabulky podobně jako v kapitole 4, přesto je však vyhodnocení zcela dostačující. Zadaní práce bylo bezezbytku splněno a práce svědčí o inženýrských schopnostech diplomanta. Navrhuji hodnotit práci známkou "A/výborně"

Navrhovaná známka
A
Body
91

Otázky

eVSKP id 73269