NOVOTNÝ, V. Rozpoznání displeje embedded zařízení [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2018.

Posudky

Posudek vedoucího

Honec, Peter

Zadání diplomové práce Bc. Václava Novotného patřilo mezi středně obtížnější témata. Vzhledem k plánovanému nasazení výsledků práce přímo na testeru tiskáren ve firmě Y-Soft bylo již od počátku zřejmé směřování k praktické realizaci. Student práci pojal velmi zodpovědně, pravděpodobně s ohledem na svůj dlouholetý pracovní poměr ve zmiňované firmě, který si asi hodlá udržet. Student pracoval při řešení tématu iniciativně a samostatně, konzultace, na které přicházel vždy připraven, probíhaly v konstruktivní rovině. Během řešení diplomant vytvořil testovací a trénovací sadu více jak 10.000 snímků emulujících reálná data a většinu možných neduhů vznikajících při snímání displeje kamerou. Diplomant otestoval několik klasifikátorů s neuspokojivým výsledkem, avšak nakonec vytvořil jejich kombinací silný klasifikátor s nepřekonatelnou spolehlivostí na dané testovací sadě. Toto poté podpořil implementací OCR pro problémovou a jinak neodlišitelnou sadu snímků. Práci lze považovat jako dílo diplomanta, po stránce praktické nemám co vytknout, výsledky práce a samotné nasazení a otestování v reálném provozu hovoří za vše. Práci doporučuji k obhajobě. Navrhuji hodnocení diplomové práce stupněm A (95).

Navrhovaná známka
A
Body
95

Posudek oponenta

Janáková, Ilona

Zadání diplomové práce spočívalo v návrhu a realizaci systému pro klasifikaci snímků části displeje embedded zařízen do konečného počtu očekávaných tříd, což slouží ve spojení s robotickým systémem, provádějícím kliky na daných akčních elementech, k důkladnému a rychlému otestování zařízení před uvedením nových verzí a aktualizací. Realizace představovala vedle seznámení se s danou problematikou, studium, výběr, implementaci a nastavení, případně naučení vhodných metod z oblasti počítačového vidění a strojového učení a také časově náročnou tvorbu galerií a řadu testů. V neposlední řadě byla potřeba zvládnout a skloubit několik vývojových nástrojů, balíčků a knihoven a navázat na stávající systém. Proto hodnotím toto zadání jako velmi časově i odborně náročné, přesto lze konstatovat, že byly všechny body zadání splněny. Práce má se všemi náležitostmi celkem 76 stran. Po úvodu a rozboru úlohy se student nejdříve ve druhé kapitole teoreticky věnuje vybraným čtyřem metodám strojového učení, kdy již v závěru kapitoly jsou metody posouzeny z hlediska vhodnosti k dané řešené úloze. Pro klasifikaci byl zvolen přístup na základě detekce a popisu významných bodů ve snímcích displeje, proto jsou ve třetí kapitole teoreticky rozebrány tři použité typy deskriptorů a postup generování slovníku vizuálních slov. Ve čtvrté kapitole jsou ještě zmíněné dodatečné algoritmy testované v rámci učení. Praktická část začíná pátou kapitolou a popisem dvou vyzkoušených přístupů ke tvorbě potřebných galerií pro trénování a testování klasifikátorů. První galerie představuje reálné snímky pořízené přímo na testovacím systému a zahrnující i vyskytující se defekty obrazu (odlesky, změny barev, šum, prach atd.). Přístup pořizování reálných snímků za různých podmínek není z hlediska časové náročnosti v praxi použitelný, proto diplomant navrhl postup tvorby syntetických dat na základě dostupných referenčních snímků a podle uvažovaných pravděpodobností náhodně volených poškození obrazů. Samotný návrh řešení klasifikátoru je popsán především v šesté kapitole. Kladně hodnotím, že se student neomezoval pouze na výběr jednoho typu klasifikátoru s jedním přístupem k plnění příznakového vektoru, ale využil kombinace vlastností několika přístupů a sestavit tak silný klasifikátor pro dosažení co největší spolehlivosti. Dva klasifikátory se tak učí na základě neuronových sítí a dva pracují s metodou SVM. Jako vstupy jsou použity po řadě SIFT, SURF deskriptory a slovníky vizuálních slov vytvořené na základě SURF a FREAK deskriptorů. V sedmé kapitole je popsáno řešení učení nového klasifikátoru. Navržen je i způsob agregace výsledků jednotlivých slabých klasifikátorů. U velmi podobných si tříd (podobné obrazovky) je možné použít ještě klasifikaci na základě rozlišení textu (OCR) nebo porovnání přímo částí obrazů. Navržené řešení není jistě jediné možné a pravděpodobně ani nejlepší nebo mohlo být řešení jednodušší, ale díky tomu, že student provedl řadu testů (popsaných především v deváté kapitole), včetně testu s bezmála 12 tis. snímky v reálném provozu se stoprocentní úspěšností klasifikace, lze určitě konstatovat, že je tento přístup funkční a velmi spolehlivý. V rámci diplomové práce řešil student také implementaci vlastního návrhu a integraci do již existujícího řešení (kap. 8). Aplikaci lze rozdělit do čtyř částí – část řešící samotné učení modelů a tvorbu konečného klasifikátoru, databázový model, uživatelskou část pro řízení a vizualizaci a klientskou část integrovanou do existujícího řešení vizuální zpětné vazby robotického systému, která využívá naučené klasifikátory uložené v databázi ke klasifikaci příchozích snímků. Aplikace je vedle požadavků na rychlou a spolehlivou klasifikaci a rychlé učení na nové třídy a zařízení navrhována také s ohledem na snadnou obsluhu. Díky složitosti jednotlivých metod a nutnosti volby některých parametrů se toto sice neobejde bez určitých požadavků na zkušenosti obsluhy, ale student se snažil, např. automatickou tvorbou galerií, předdefinovanými topologiemi sítí či paralelním učením více nastavení sítí a jejich soutěžením, tuto část co nejvíce zjednodušit. Předložený dokument má dobrou grafickou úroveň. Je řazen v logickém sledu a jednotlivým problémům je věnován odpovídající prostor. Vytknout lze jen několik nepodstatných drobností a několik překlepů či gramatických chyb. Práce jistě svědčí o inženýrských schopnostech diplomanta, proto ji navrhuji k obhajobě s návrhem na klasifikaci A.

Navrhovaná známka
A
Body
92

Otázky

eVSKP id 111060