HOLÍK, V. Separace nástrojů a zpěvu z hudební nahrávky [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.

Posudky

Posudek vedoucího

Mošner, Ladislav

Jsem rád, že se nakonec podařilo práci a text dokončit, jelikož v jistých momentech visel nad BP otazník. Řešení práce bylo protkáno mnohými problémy zejména souvisejícími s externími knihovnami a výpočetními prostředky. Ačkoli se tyto problémy přirozeně objevují při řešení IT projektů, čas strávený na jejich řešení byl značný. Domnívám se tak, že by mohl být brán v potaz při závěrečném hodnocení. 

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Obtížnost zadání považuji za průměrnou. Práce se týká strojového učení, které může být komplexní. Zde se však staví na již existujícím modelu a ověřených volně dostupných zdrojových kódech (od výzkumníků z Meta AI). Co ztěžovalo práci je fakt, že trénování mělo nemalé výpočetní nároky. Bylo tak nutné řešit zmenšení modelu a výpočetní prostředky v Metacentru a poté na fakultním výpočetním systému. Čas na trénování také hrál roli a diktoval nutnost dbalého plánování práce. Dosažené výsledky bohužel nepotvrdily trendy uvedené v referenčním článku (leč s jiným modelem). Přesto se domnívám, že tento neuspokojivý závěr není zásadním problémem pro celkové hodnocení práce.
Práce s literaturou Při psaní textu technické zprávy student sám aktivně dohledával zdroje (zejména články) týkající se strojového učení, separace zdrojů a hudebních dat používaných v relevantní literatuře. Načerpané informace jsou zejména reflektovány v teoretické části dokumentu. Dále student aplikoval poznatky z referenčních článků popisujících využitý model a definujících objektivní funkce implementované a upravované v rámci praktické části.
Aktivita během řešení, konzultace, komunikace Začátek práce byl vlažný s málo frekventovanými konzultacemi a pomalým postupem. S letním semestrem se zvýšila aktivita studenta a konzultace probíhaly pravidelně každý týden. Tehdy práce zjevně pokročila. Věřím, že kdyby závěrečné úsilí bylo věnováno BP i na začátku, zejména kvalita řešení (a pochopitelně kvantita) by značně vzrostla.
Aktivita při dokončování Dokončování bylo ve znamení zvýšené aktivity, aby byla práce hotova včas. Experimenty v podobě, do jaké se je podařilo dostat, byly dokončeny v druhé polovině dubna. Text byl předán ke kontrole v takovém předstihu, že bylo možné předat zpětnou vazbu. Její zapracování bylo potvrzeno emailem, ale nebylo již konzultováno.
Publikační činnost, ocenění Zdrojové kódy, ze kterých student vycházel jsou ve formě „open-source”. Vlastní úpravy jsou taktéž zveřejněny na GitHub.com. Jedná se o „fork” původního repositáře zahrnující modifikace vzniklé během řešení. 
Navrhovaná známka
C
Body
70

Posudek oponenta

Veselý, Karel

V práci se našly jak kvalitní informace tak i nepřesnosti. Hodnotím tedy C.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Student se seznámil s úlohou separace zdrojů, s trénováním neuronových sítí pomocí projektu Pytorch, a dále pak s architekturou neuronové sítě Conv-TasNet. Byly provedeny experimenty s úpravou hyper-parametrů a několika implementacemi objektivních funkcí. Výpočty byly provedeny v klastru Metacentrum. Množství informací které student v průběhu absorboval je tedy spíše velké.
Rozsah splnění požadavků zadání Zadání bylo splněno.
Rozsah technické zprávy Technická zpráva je informačně bohatá. 
Prezentační úroveň technické zprávy 70 Logická struktura je zdařilá, kapitoly navazují a jsou pro čtenáře pochopitelné. Občas se v textu vyskytují technické nepřesnosti jako důsledek snahy o přiblížení problematiky netechnickému publiku. Často pak následuje upřesnění v navazujícím textu.
Formální úprava technické zprávy 80 Formální úprava je na velmi slušné úrovni. Některé odborné termíny by se daly do Slovenštiny přeložit lépe (cca 5 případů v celé práci, "dot product", "forget gate", ...). V technické zprávě chybí číslování rovnic.
Práce s literaturou 70 Student čerpal z odborných článků, které vhodně cituje. Dále pak student čerpal z Internetových stránek, které ale mohou obsahovat i chybné informace (viz popis os v obrázku 3.1).
Realizační výstup 70 Student rozšířil exstující kód s otevřenou licencí MIT. Nový kód je čitelný a srozumitelný.
Využitelnost výsledků Výsledkem práce je model, který lze použít pro separování nástrojů z audio nahrávky. Kvalita separace není dokonalá, na druhou stranu jde poznat, že se model z dat úlohu naučil.
Navrhovaná známka
C
Body
75

Otázky

eVSKP id 147883