MIXA, J. Rozpoznávání textu z fotografií [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2013.

Posudky

Posudek vedoucího

Hasmanda, Martin

Student během semestru bohužel nevyužíval možnosti konzultace, z tohoto důvodu působí práce po formální i odborné stránce dosti nepřesvědčivě. V práci se vyskytuje dosti překlepů, nepřesných formulací a nevhodná skladba vět, jenž nejspíše vznikla při překladu cizích textů. Mnohdy je v textu použito rozdílné formátování textu a nadpisů, které snižuje celkovou orientaci v diplomové práci. Není vhodné citovat prameny, jako jsou různá fóra na webu, viz např. pramen [8], na který navíc není v textu uveden odkaz. Po odborné stránce se student věnuje spíše základům z oblasti zpracování obrazu, oblast OCR mohla být zpracována více do hloubky. V teoretické části by například nemusely být uvedeny všechny metody pro výpočet kritéria podobnosti z kapitol 2.3.1.2, 2.3.1.3, protože je ve výsledné aplikaci použita pouze jedna z uvedených metod. Dále také metody založené na momentech z kapitoly 2.3.1.4, které v praktické části použité nebyly. Při zpracování student popisuje použití funkce matchTemplate z knihovny OpenCV, ale není uvedeno, které kritérium podobnosti bylo použito. Student uvádí, že je metoda invariantní vůči jasovým transformacím, avšak ne všechny metody toto splňují. Větší pozornost měl student věnovat výsledné implementaci algoritmů. Aplikace např. není dosti automatizována pro korekci natočení obrazu na libovolné fotografii a není flexibilní pro práci s uživatelem. Výsledky úspěšnosti zpracování jsou uvedeny v tabulkách. V některých případech však chybí hodnota úspěšnosti, viz Tabulka 4. Úspěšnost pro Obraz 1 v tabulce 1 je vypočtena chybně. Kladně hodnotím popis knihovny Teseract a popis principu zpracování podle této knihovny. Navzdory výše uvedeným výhradám považuji zadání za splněné. Práci hodnotím známkou D - 63 bodů.

Navrhovaná známka
D
Body
63

Posudek oponenta

Říha, Kamil

Práce je po formální stránce poměrně nekvalitní, v textu je možné najít i velké hrubky, jako např. "Oba programy využívali knihovny" v anotaci. Dále mohu vytknout tyto chyby: - Úvod je členěný na odstavce velmi nešťastným způsobem, ve kterém na jeden odstavec připadají maximálně dvě věty. - Některé formulace jsou velmi zavádějící a svědčí o tom, že autor patrně málo přemýšlel nad významem vět, které vytvářel či překládal. Některé věty nedávají smysl a jsou patrně chybně přeloženy (např. vysvětlení významu jednotlivých výrazů pod rovnicí (12)), je možné setkat se dokonce s názvem odstavce v angličtině (str. 21). - Ne všude je dodržen správný a konzistentní formát matematických značek. - Ve vzorci (2) je v rozporu s jinými částmi textu použit operátor * pro násobení. - Obr. 2 je uveden bez dalšího vysvětlení, co je v něm demonstrováno. - Ve vztahu (10) chybí v čitateli suma. - Obr. 4 je kompletně převzat z dokumentace knihovny OpenCV, včetně anglických textů. Přestože je zdroj řádně ocitován, je možné tento postup chápat jako velmi nevhodný. Samotné řešení zadaného úkolu je vedle obrázků a tabulek v textu dokumentováno ve formě zdrojových kódů, které jsou přiloženy na CD, kde však nejsou přímo spustitelné soubory. K obhajobě doporučuji krátké předvedení funkčních programů. Zdrojové kódy obsahují česky psané komentáře, a přestože je řešení předloženo dosti nepřehledně ve 3 programech, je možné konstatovat splnění zadání. První dva programy jsou psány pro různé verze knihovny OpenCV, což je také možné chápat negativně – student měl pro diplomovou práci ucelit svoje starší kódy alespoň do jednoho, novějšího API pro jazyk C++. Předložené výsledky i jejich vyhodnocení svědčí o tom, že student dosáhl v dané oblasti spíše základní přehled bez hlubšího proniknutí do problematiky. Celkově působí práce formálně i technicky vzhledem k obvyklým požadavkům na diplomové práce spíše podprůměrně, proto navrhuji její hodnocení 60 body, tedy v kategorii D.

Navrhovaná známka
D
Body
60

Otázky

eVSKP id 66704