OZDOBINSKI, R. Aplikace metod učení slovníku pro Audio Inpainting [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2014.
Student splnil zadání v plném rozsahu. Sám aktivně přistupoval k řešení, přinášel vlastní návrhy pro vylepšení stávajících metod, které následně úspěšně otestoval. Sada malých děr v signálu pro rekonstrukci je už prakticky neslyšitelná, což může zkreslit výsledky práce. Vzhledem k extrémní výpočetní náročnosti algoritmů je však tato volba pochopitelná. Oceňuji taky elektronickou přílohu práce, která obsahuje kompletní testovací skripty s dokumentací. Po formální stráce je práce na výborné úrovni, pouze místy se vyskytují drobné překlepy.
Diplomová práce Bc. Romana Ozdobinského studuje využití dvou učících se algoritmů pro aplikaci ve zpracování audiosignálů. Na obdobné téma již autor psal i bakalářskou práci. Úvod není napsán úplně vhodně, zabíhá zbytečně do detailů a na druhou stranu chybí ucelená stručná informace, o čem práce je a jak je rozdělena. Kapitol je celkem osm, což je zbytečně mnoho, strukturovanosti by pomohlo, kdyby se kapitoly 3,4,5 sloučily, podobně pro kapitoly 7, 8. Některá podtémata by dávala větší smysl na jiných místech: např. algoritmus OMP bych si představoval spíše u popisu řídkých reprezentací než u konkrétní úlohy, kterou diplomant řeší. Dále k formální stránce: Po jazykové stránce je práce na přijatelné úrovni, text obsahuje občas neobratná vyjádření, několik překlepů a drobné typografické prohřešky. Občas se vyskytnou irelevantní až zavádějící věty, kupříkladu že DCT slovník „vyniká svou jednoduchostí a rychlostí sestavení“. Ve vztazích (1.4) a (1.5) jsou místo velkého sigma použity symboly pro sumu. Tyto vztahy jsou však stejně nadbytečné, protože se nikde neuplatňují. V rovnici (2.2) se objevuje symbol tučné n, ale není vysvětlen jeho význam. Autor málo cituje (např. není reference na Grassmanovské framy, K-means). K faktické stránce uvedu nejprve několik důležitějších postřehů: K výběru segmentů použitých pro učení je použit lokální koeficient špičatost spektra. Zde mám dvě pochybnosti. Prvně, proč je zrovna špičatost považována za dobrý klasifikátor pro vhodnost segmentu? Chybí argumenty. Autor mohl např. vyzkoušet natrénovat slovník na zbylé množině segmentů a tím aspoň empiricky ověřit jeho hypotézu. Druhak, na str. 34 se píše, že „nuly v místě díry nijak neovlivní hodnotu koeficientu“. To však evidentně neplatí, takže automaticky vzniká dojem, že celý algoritmus stojí na základě myšlenky, která není pravdivá. Zdůvodnění přechodu k údajně výhodnějšímu inkohernetnímu učení v krátkém odstavci 3.2.2 je podle mého názoru jednak příliš krátké a jednak teoreticky zpochybnitelné. Proč se autor alespoň neodvolá na nějakou literaturu, kde se za obdobných podmínek inkoherence vyplatila? Jsou vždy trénovány čtvercové slovníky, tedy báze. Z pohledu možné řídkosti signálů je tedy nevyužito nadbytečných reprezentací (frames). Omezením se pouze na čtvercové slovníky se automaticky omezuje možnost zakódování fáze audio signálu (trénované úseky obsahují složky s různými fázemi, což čtvercový, reálný slovník může těžko zachytit). Méně významná fakta: Množiny poškozených a správných vzorků jsou na str. 15 a 16 definovány zbytečně složitě, a ještě k tomu matematicky nesprávně. Autor míchá množiny s vektory, o disjunktnosti se nezmiňuje. Strana 16: Basis Pursuit není algoritmus, nýbrž typ úlohy, který lze řešit různými algoritmy. Proč se ve vztahu (2.5) a dále pracuje s konstantou \theta^\epsilon, když by stačilo použít jeden ze symbolů (nejde o mocninu). Není pravda, že (2.5) je přímo neřešitelný; je jen NP-těžký. Strana 17: Vstupem algoritmu OMP je údajně vektor nepoškozeného průběhu – to by ovšem znamenalo, že úlohu vůbec nemusíme řešit, když jej známe! Je škoda, že se práce zaměřila pouze na algoritmus OMP, když dnešní trend v této oblasti se přiklonil převážně k relaxačním konvexním algoritmům. Porovnání by bylo cenné. Na straně 20 se pracuje s pojmem koherence, ale tento pojem je zaveden až o několik stran později. Čtvrtá věta v části 4.1 je velmi nepřesná. Strana 27: Kritérium C(D) samo nemůže vyjadřovat kvalitu aproximace, jelikož není zahrnut signál – pro každý signál bude aproximace jiná. Strana 34: svérázné značení += . Definice špičatosti (6.1) je špatně (indexy, mocniny). Pokusím-li se o shrnutí, práce je po praktické stránce dobře provedena, ale staví na ne zcela jasných nebo dokonce špatných předpokladech, což význam výsledků a jejich vyhodnocení degraduje.Navrhuji hodnotit práci 60 body.
eVSKP id 73893