HOLÍK, V. Separace nástrojů a zpěvu z hudební nahrávky [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.
Jsem rád, že se nakonec podařilo práci a text dokončit, jelikož v jistých momentech visel nad BP otazník. Řešení práce bylo protkáno mnohými problémy zejména souvisejícími s externími knihovnami a výpočetními prostředky. Ačkoli se tyto problémy přirozeně objevují při řešení IT projektů, čas strávený na jejich řešení byl značný. Domnívám se tak, že by mohl být brán v potaz při závěrečném hodnocení.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Informace k zadání | Obtížnost zadání považuji za průměrnou. Práce se týká strojového učení, které může být komplexní. Zde se však staví na již existujícím modelu a ověřených volně dostupných zdrojových kódech (od výzkumníků z Meta AI). Co ztěžovalo práci je fakt, že trénování mělo nemalé výpočetní nároky. Bylo tak nutné řešit zmenšení modelu a výpočetní prostředky v Metacentru a poté na fakultním výpočetním systému. Čas na trénování také hrál roli a diktoval nutnost dbalého plánování práce. Dosažené výsledky bohužel nepotvrdily trendy uvedené v referenčním článku (leč s jiným modelem). Přesto se domnívám, že tento neuspokojivý závěr není zásadním problémem pro celkové hodnocení práce. | ||
Práce s literaturou | Při psaní textu technické zprávy student sám aktivně dohledával zdroje (zejména články) týkající se strojového učení, separace zdrojů a hudebních dat používaných v relevantní literatuře. Načerpané informace jsou zejména reflektovány v teoretické části dokumentu. Dále student aplikoval poznatky z referenčních článků popisujících využitý model a definujících objektivní funkce implementované a upravované v rámci praktické části. | ||
Aktivita během řešení, konzultace, komunikace | Začátek práce byl vlažný s málo frekventovanými konzultacemi a pomalým postupem. S letním semestrem se zvýšila aktivita studenta a konzultace probíhaly pravidelně každý týden. Tehdy práce zjevně pokročila. Věřím, že kdyby závěrečné úsilí bylo věnováno BP i na začátku, zejména kvalita řešení (a pochopitelně kvantita) by značně vzrostla. | ||
Aktivita při dokončování | Dokončování bylo ve znamení zvýšené aktivity, aby byla práce hotova včas. Experimenty v podobě, do jaké se je podařilo dostat, byly dokončeny v druhé polovině dubna. Text byl předán ke kontrole v takovém předstihu, že bylo možné předat zpětnou vazbu. Její zapracování bylo potvrzeno emailem, ale nebylo již konzultováno. | ||
Publikační činnost, ocenění | Zdrojové kódy, ze kterých student vycházel jsou ve formě „open-source”. Vlastní úpravy jsou taktéž zveřejněny na GitHub.com. Jedná se o „fork” původního repositáře zahrnující modifikace vzniklé během řešení. |
V práci se našly jak kvalitní informace tak i nepřesnosti. Hodnotím tedy C.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Náročnost zadání | Student se seznámil s úlohou separace zdrojů, s trénováním neuronových sítí pomocí projektu Pytorch, a dále pak s architekturou neuronové sítě Conv-TasNet. Byly provedeny experimenty s úpravou hyper-parametrů a několika implementacemi objektivních funkcí. Výpočty byly provedeny v klastru Metacentrum. Množství informací které student v průběhu absorboval je tedy spíše velké. | ||
Rozsah splnění požadavků zadání | Zadání bylo splněno. | ||
Rozsah technické zprávy | Technická zpráva je informačně bohatá. | ||
Prezentační úroveň technické zprávy | 70 | Logická struktura je zdařilá, kapitoly navazují a jsou pro čtenáře pochopitelné. Občas se v textu vyskytují technické nepřesnosti jako důsledek snahy o přiblížení problematiky netechnickému publiku. Často pak následuje upřesnění v navazujícím textu. | |
Formální úprava technické zprávy | 80 | Formální úprava je na velmi slušné úrovni. Některé odborné termíny by se daly do Slovenštiny přeložit lépe (cca 5 případů v celé práci, "dot product", "forget gate", ...). V technické zprávě chybí číslování rovnic. | |
Práce s literaturou | 70 | Student čerpal z odborných článků, které vhodně cituje. Dále pak student čerpal z Internetových stránek, které ale mohou obsahovat i chybné informace (viz popis os v obrázku 3.1). | |
Realizační výstup | 70 | Student rozšířil exstující kód s otevřenou licencí MIT. Nový kód je čitelný a srozumitelný. | |
Využitelnost výsledků | Výsledkem práce je model, který lze použít pro separování nástrojů z audio nahrávky. Kvalita separace není dokonalá, na druhou stranu jde poznat, že se model z dat úlohu naučil. |
eVSKP id 147883