VAŠKO, R. Převod notového zápisu do digitální formy [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2017.
Diplomant pracoval na daném zadání pouze v letním semestru. Již na první pohovor při žádosti o zadání přišel velice kvalitně připraven a měl kvalitní představu o problematice jak hudební tak zpracování obrazu. Během semestru mě kontaktoval minimálně, práci prakticky nekonzultoval. Ohledně předložené práce lze konstatovat, že student postupoval systematicky, provedl velice kvalitní rozbor úlohy a variant řešení. Kvalitní je též příprava zkušebních dat, především pro učící algoritmy. Realizační část práce už tak kvalitní není, chybí přeevším provedení více testů na různých snímcích (nejlépe pro nějakou srovnávací databázi) a tím získat lepší data pro hodnocení algoritmů a různých variant řazení jednotlivých kroků vyhodnocování. Kvalitu práce také snižuje velké množství překlepů. Navrhuji klasifikaci C/79.
Téma předložené práce je “Převod notového zápisu do digitální formy”. Po jazykové stránce je práce na průměrné až podprůměrné úrovni, a to z několika důvodů. Autor občas používá hovorová slova, často užívá dále nedefinované pojmy (chybovost na str. 44) a v některých kapitolách velmi často používá nelogicky konstruované věty, což značně znesnadňuje pochopení podané informace. Za všechny uvádím větu ze strany 21: “Morfologické operace binárního obrazu: Z operací jsou realizovány relací obrazu se strukturálním elementem.“ Popisy algoritmů pro detekci linek notové osnovy v sekci 3.2.6 jsou často špatně pochopitelné a nepřehledné, avšak počtem jednotlivých uvedených metod potvrzují autorovo nastudování teorie systémů pro Optical Music Reconstruction (OMR), čili splnění (1.) bodu zadání. Autor však často při popisu algoritmů používá naivní konstatování o jednoduchém řešení problému, které už dále nerozvádí. Po formální stránce je práce v pořádku a je i vhodně logicky členěná, s jednou výjimkou, a to kapitolou neobvykle zařazenou do přílohy. Tato kapitola popisuje vlastní použité algoritmy v autorem navrženém programu, tedy body (2) a (4) zadání. Možná by tedy bylo vhodnější zařadit ji přímo do těla práce. Po realizační stránce autor uvedl úvahy nad volbou knihoven pro zpracování obrazu i pro klasifikaci. Pro zpracování obrazu zvolil knihovnu Gamera specializovanou na OMR problematiku. Autor uvádí, že poskytuje největší volbu různých OMR metod, což je vhodné vzhledem k tématu práce. Zvolená knihovna je však, jak autor sám uvádí, občas nestabilní. Zdrojový kód je dostatečně zdokumentován a dokládá autorovu schopnost navrhnout vhodnou koncepci programu. Tomu nasvědčuje i oddělení grafického uživatelského rozhraní od samotné části zpracování obrazu. K bodu zadání číslo (3): Součástí CD je také nepočetná galerie notových zápisů doplněná o rozsáhlou testovací množinu jednotlivých notových značek, ačkoliv o galerii partitur autor v textové části nepíše. (5.) bod zadání: Na CD nebyly nalezeny výstupní zpracovaná data ve formátu MusicXML vhodném pro další zpracování. Avšak ze zdrojového kódu lze vyčíst využití konvertující knihovny Music21. (6.) bod zadání: Díváme-li se pouze na textový dokument, samotné výstupy programu jsou zdokumentovány velmi stručně. Autor se pokouší o zhodnocení výsledků v podkapitole 4.4, ta by si však zasloužila samostatnou kapitolu. Přinejmenším by bylo vhodné značné rozšíření. Autor uvádí tři "testy", nebo lépe řečeno popisy tří výstupních obrazů programu rozepsaných pouze na jedna a půl strany A4. Autor v realizační části využívá mnoha již navržených knihoven, sám však kombinuje různé dostupné funkce a vytváří vlastní řetězce zpracování obrazu a klasifikace. Bylo by však vhodné v práci více zdůraznit, které uvedené funkce autor opravdu vyzkoušel. Po obsahové stránce by autor měl dát více důrazu na pochopitelnost a více vysvětlovat používané pojmy, jelikož takto jeho práce působí hektickým dojmem. K obstojnému důkazu o inženýrských schopnostech autora je potřeba, aby byly výstupy programu zhodnoceny statisticky, ne pouze slovním popisem. Forma a obsah práce splňuje obecné požadavky na VŠKP, avšak z důvodu málo přesvědčivého splnění bodu (6.) zadání, hodnotím práci D/60.
eVSKP id 98887