RYŠÁNEK, J. Vizualizace neuronové sítě použité jako jazykový model [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.

Posudky

Posudek vedoucího

Beneš, Karel

Řešení tohoto poměrně otevřeného zadání zůstalo spíše v minimalistické podobě, bez opravdu důkladného ponoření se do problému. Jako vedoucí ale musím ocenit pokroky, které student v průběhu řešení dosáhl, zejména ve studijní části projektu.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Toto zadání je dosti otevřené a nechává na řešiteli, co přesně bude v neurálních jazykových modelech vizualizovat. Student při řešení vykazoval zvídavost nutnou pro zvládnutí takového zadání, ale jen místy a zřídka ji podpořil důsledným proniknutím na dřeň problému. Zadání práce je běžné obtížnosti. Vyžaduje, aby si řešitel osvojil znalosti neuronových sítí a vizualizace vysokorozměrných dat nad rámec bakalářského programu na FITu, ale nevyžaduje nutně, aby tak učinil do velké hloubky -- a řešitel v tomto případě do velké hloubky nešel.  
Práce s literaturou Student k vyhledávání zdrojů přistupoval poměrně aktivně, ale povrchně, s odbornou literaturou se seznamoval spíše z popudu vedoucího. Kladně ovšem hodnotím, že kvalita studovaných zdrojů a úroveň jejich pochopení s průběhem řešení zlepšovala.
Aktivita během řešení, konzultace, komunikace Student v průběhu řešení komunikoval, řádně chodil na dohodnuté schůzky a postupně pracoval na vytyčených cílech. Jen menší podíl z těchto cílů si ale vytyčil student sám.
Aktivita při dokončování Textová zpráva o bakalářské práci vznikala postupně a byla po částech konzultována. Vzhledem k finálnímu šturmu k odevzdání nebyla její definitivní podoba podrobena kritickému oku vedoucího. Spěch při dokončování experimentů bohužel zabránil zahrnout do výsledku i -- rozpracované -- nasazení navržených metod na předtrénovaný model z rodiny GPT.
Publikační činnost, ocenění Pokud je mi známo, výsledky práce nebyly nikde publikovány.
Navrhovaná známka
D
Body
69

Posudek oponenta

Černocký, Jan

Zadání je ve velmi zajímavém oboru, formálně splněné, ale s nepříliš obsáhlými výsledky. Technická zpráva je podprůměrná s chybějícími podstatnými informacemi.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Na bakalářské úrovni složitost zvyšuje nutnost nastudování problematiky neuronových sítí a jazykových modelů na nich založených, na druhé straně práce využívá již hotové modely a doplňuje pouze vizualizační vrstvu, která je relativně jednoduchá.
Rozsah splnění požadavků zadání Student se seznámil se základy NNLM a vypracoval několik technik pro vizualizaci jejich vnitřního chování, zadání je tedy formálně splněno, byť analýza podle mého názoru zůstává na povrchu a neobsahuje odpovědi na základní otázky „proč ?“ a „jak výsledky využít pro tvorbu lepších / menších / více robustních LM“.
Rozsah technické zprávy Technická zpráva zřejmě dosahuje formálního minima, ale některé části by bylo nutné rozšířit proto, aby byla dobře technicky čitelná, především doplnit přesný popis architektury použitého LM, popis dat, atd.
Prezentační úroveň technické zprávy 65 Práce obsahuje slušný popis architektur pro NNLM (i když i zde by si zasloužila podrobnější matematický popis, alespoň základy principů trénování, atd), zaostává při popisu vlastní práce a interpretace výsledků. Kapitola 4 o implementaci je poměrně odbytá, měla obsahovat alespoň základní informace o tom, která část kódu dělá co. 
Formální úprava technické zprávy 75 Práce je psána relativně slušnou angličtinou, student dostane okomentovaný výtisk práce s detaily. U převzatých obrázků je nutné hlídat jejich technickou kvalitu, u vlastních (4.1, 5.3) naopak volit formát tak, aby byly čitelné.
Práce s literaturou 60 Seznam literatury obsahuje základní práce o NNLM, necituje žádnou práci, která by se vizualizaci chování NNLM věnovala, takových je přitom (v souvislosti s vlnou „explainable AI“) spousta. Práce neobsahuje standardní kapitolu „state of the art“, která by obsahovala přehled dostupných řešení. 
Realizační výstup 60 Sada skriptů pro vizualizaci chování NNLM, výsledky analýz prezentované v práci.
Využitelnost výsledků V případě důkladnějšího provedení by byly výsledky velmi relevantní pro výzkum v oblasti strojového učení na FIT (řeč, NLP, OCR), do tohoto stavu by ale bylo potřeba podstatného rozšíření SW i analýzy výsledků 
Navrhovaná známka
D
Body
61

Otázky

eVSKP id 148495