LYAGAYEV, V. Detekce objektů na základě jejich přibližného tvaru [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.
Bakalářská práce pana Lyagayeva se zabývá problematikou segmentace obrazu a detekce objektů na základě jejich přibližného tvaru. Student pracoval velmi samostatně. Nevyžadoval příliš konzultací, přesto stále průběžně postupoval a informoval mě o stavu řešení. Odevzdaný dokument má na bakalářskou práci nadstandardní rozsah (70 normostran, celkem 86). Nadstandardně hodnotím i kvalitu zpracování dokumentu. Text přes svůj rozsah obsahuje minimum překlepů, je kvalitně formálně i graficky upraven. Práce je logicky a přehledně strukturovaná v krocích: teorie, implementace, testování a zhodnocení. Popisy i složitějších metod jsou výstižné a srozumitelné. Správná je i práce s literaturou. Citováno je 14 relevantních zdrojů. Podle mě všech známých skutečností není dokument plagiátem. Podobnost (systém Theses detekoval 4,3 %) je dána především formálními náležitostmi a obecným teoretickým úvodem. Teorie (první kapitola – 19 stran) je rozdělena na vybrané segmentační a detekční metody. Výběr vhodných metod považuji za správný. Metod je nepřeberné množství a výsledky se liší nejen obrázek od obrázku, ale také nastavenými parametry, ale připravený bank čtyř segmentačních a tří detekčních postupů poskytuje prostor pro testování a zhodnocení využitelnosti pro konkrétní úlohu. Celý návrh je realizován v Matlabu využitím vhodných knihoven a implementovaných funkcí. Zároveň student zkombinoval, vhodně přizpůsobil, rozšířil volně dostupné funkce a skripty. Přiložený kód je dobře strukturovaný a společně s detailním popisem v dokumentu bude možné jednotlivé metody využít i pro jiné úlohy. Pro experimenty sesbíral 520 snímků kraslic, kdy jednotlivé metody prezentoval v dokumentu na pečlivě, z hlediska náročnosti scény, vybraných zástupcích. Výsledky, především segmentace, nejsou dokonalé, což je vcelku pochopitelné vzhledem k rozmanitosti snímků (barvy, vzory, techniky, velikosti a množství samotných kraslic na snímcích, překrytí atd.). Student se ani nesnažil úlohu testovaným metodám zjednodušit ruční předpřípravou, např. ruční normalizací na podobnou velikost nebo výřezy obsahujícími vždy jen jednu kraslici, a testoval tak plnou sílu algoritmů. Na druhou stanu tak některé postupy vyžadují velký uživatelský vklad v podobě individuálního ladění parametrů pro každý snímek. Testování, zhodnocení a porovnání metod je důkladné. Zahrnuje nejen jednotlivé metody co do subjektivní kvality segmentace či detekce, ale také zhodnocení výpočetní náročnosti, odolnosti vůči překryvu a šumu či geometrickým deformacím. Experimenty jsou prováděny jen na několika nebo i jen jednom snímku, přesto poskytly možnost učinění určitých závěrů a srovnání. Testována byla i přenositelnost algoritmů na jiný typ úlohy. Motivace vypsání zadaní byla v usnadnění přípravy datasetů pro trénování modelů CNN, které vyžadují velké množství snímků a plná ruční segmentace je pracná a časově náročná. Tento cíl byl předloženou bakalářskou prací pana Lyageyeva splněn. Implementované metody prokázaly funkčnost a potenciál pro další vývoj a nasazení v praxi. Student prokázal schopnost nejen nastudovat danou problematiku, řešit i komplexní úlohy, ale i vytvořit kvalitní dokumentaci, proto doporučuji bakalářskou práci k obhajobám s hodnocením A (96 b).
Práce je značně obsáhlá a dá se říci, že formou zpracování i svými 69 stránkami patří k rozsáhlejším. Zadání je možné považovat za splněné. Rešerši existujících přístupů se týká kapitola 1 a částečně se k ní vztahují i ostatní kapitoly, které teorii využívají. O splnění druhého bodu je možné se přesvědčit na přiloženém SSD, kde je cca 500 snímků, díky kterým je možné testovat a hodnotit vytvořené algoritmy. Další části práce se zabývají vytvořením požadovaných algoritmů a jejich testování. Každý z algoritmů je v práci popsán s tím, že je ukázán na typově vybraných snímcích a na nich je ukázáno, jak s algoritmem pracovat, jak najít vhodné parametry pro správnou detekci a následně jsou vyhodnoceny výsledky algoritmů vůči sobě na základě výsledných snímků. Dále jsou také provedeny testy podle zvolených metrik jako je rychlost, ne/úspěšnost algoritmu … V závěru je v kapitole 3.6.5, na základě bodu 6 zadání, ukázáno využití navržených a realizovaných postupů pro jiné typy úloh. Tato část je kratší, ale dává dostatečný přehled o možnostech využití v jiných aplikacích. Pouze bodu 5 zadání není určena specifická část práce, je však rozprostřen do hodnocení jednotlivých algoritmů. Prezentační i formální úroveň práce jsou na dobré úrovni. O dobré práci s literaturou svědčí úvodní kapitola a nalezené metody. Literatura je uvedena a v práci odkazována. Při řešení student prokázal dobrou orientaci v dané problematice. Z velkého množství dostupných metod, vhodných pro dané řešení, zvolil skupiny zástupců. Pro jednotlivé metody provedl podrobný rozbor vlastností a zhodnotil jejich výsledky. V práci se vyskytují pouze drobné nepřesnosti, např.: str. 23 mohl být uveden prompt, kterým byl získán daný výsledek na obr 1.9. Kapitola 2.2.1 by mohla být vhodněji členěna s vyznačením cest, i když návaznosti jsou zřetelné z přiloženého blokového diagramu. Některé textové popisy algoritmů bylo vhodnější prezentovat graficky. Str. 39 je uvedena cena totalCost a mapování assignment u kterých chybí bližší popis (vzorečky, definice, Munkres algoritmus). Str. 40 je psáno, že s konturou se provede "translace do počátku" - nikde není blíže vysvětleno např. kde je počátek ... Na přiloženém SSD je možné najít zdrojové kódy, většinou funkce, které by mohly mít alespoň popis parametrů. U adresářů (zvláště IoU), by bylo vhodné popsat strukturu a manipulaci s nimi. Spouštěné soubory ale mají v názvu „main“ což zlepšuje orientaci a demonstruje práci s funkcemi. Ve skriptu mainShape je uveden název neexistujícího souboru. Celkově práce svědčí o bakalářských schopnostech studenta.
eVSKP id 167988