POLOK, A. Analýza entit v psychoterapeutických sezeních [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.
Student pracoval celý rok s pravidelnými konzultacemi, na které byl vždy připraven. Připravil, navrhl, implementoval a odzkoušel svůj návrh systému na detekci řečové aktivity, diarizaci, rozpoznávání řeči a klasifikaci terapeutických intervencí. Práci samotnou, její výsledky a přístup studenta hodnotím velice pozitivně. Chtěl bych touto cestou navrhnout tuto práci na cenu děkana/rektora nebo jiným způsobem ocenit práci, kterou student vykonal.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Informace k zadání | Zadání je experimentálního charakteru a vyžadovalo od studenta zvládnout několik samostatných úloh. Student se musel seznámit s problematikou detekce řečové aktivity, diarizace, rozpoznávání řeči a klasifikačními úlohami. Pro všechny jmenované úlohy musel student navrhnout ucelený systém nebo klasifikátor a řádně ho otestovat. Zadání bylo řešeno ve spojitosti s projektem DeePsy (Deep learning v psychoterapii: Strojová analýza nahrávek terapeutických sezení) a součástí studentovy práce byla i komunikace s členy řešitelského týmu z VUT a s MU. Pro některé úlohy vytvořil student vlastní trénovací a testovací dataset. Zadání bylo splněno bez výhrad a student pracoval nad rámec požadované práce. | ||
Práce s literaturou | Student pracoval s literaturou velice dobře a přečetl všechny doporučené články na dané téma a aktivně si hledal další. Navíc konsultoval s dalšími členy skupiny Speech@FIT , které ve výsledku přineslo další zlepšení systémů a rozšíření znalostí studenta, které aktivně šíří dál. | ||
Aktivita během řešení, konzultace, komunikace | Student se pravidelně účastnil konzultací. Na konzultace byl vždy připraven. Pokud se konzultace nekonala, posílal emailovou zprávu o stavu řešení. Student velice aktivně řešil problémy, se kterými se vypořádal velice rychle. | ||
Aktivita při dokončování | Student pracoval velice aktivně během prvního i druhého semestru. Student odhadl čas na psaní práce velice přesně. Většina práce byla napsána s předstihem. Struktura a obsah práce byl konzultován a veškeré připomínky zapracovávány průběžně. | ||
Publikační činnost, ocenění | Článku s názvem “DeePsy: Představení online nástroje pro zpětnou vazbu v psychoterapii” (autoři: Tomáš Řiháček, Jan Nehyba, Michal Čevelíčěk, Alexander Polok, Pavel Matějka, Petr Doležal).Článek byl 9. listopadu 2022 odeslán do redakce časopisu Psychoterapie a nyní je v recenzním řízení. Odborný článek na EXCEL FIT 2023: Leveraging Pretrained Models for Automatic Speech Recognition in Psychotherapy Sessions. Práce dostala 2 ocenění - od odborného panelu a partnera z průmyslu. Práce na projektu DeePsy (Deep learning v psychoterapii: Strojová analýza nahrávek terapeutických sezení), trénování modelů, konzultace s kolegy z VUT a MU, účast na projektových schůzkách a implementace systému DeePsy. |
Student zadání diplomové práce podstatně rozšířil, aniž by zvětšený rozsah ztrácel na kvalitě. Nebál bych se říci, že bez velkých úprav lze z této práce udělat dvě nové a obě dobře hodnocené. Jedna zaměrená na automatický přepis řeči a druhá na psychoterapeutiku. Proto bych rád navrhl i nějaké ocenění.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Náročnost zadání | |||
Rozsah splnění požadavků zadání | Jednalo se o pruměrně obtížné, nebot spousta bloků byla již hotova: VAD - detekce řečové aktivity ASR - automaticky přepis řeči autor se tedy mohl zaměřit pouze na příznaky pro psychoterapeutické sezení, což bylo splněno. Nad rámec zadání autor analyzoval a vytvořil nový systém pro: VAD ASR na bázi End-to-End architektury se zlepšením. Klasifikace sentimentu. Klasifikace typu terapeutických intervencí. Diarizace pro dva mluvčí. Detekce překrývající se řeči. Tímto výrazně přispěl k rozvoji projektu DeePsy. | ||
Rozsah technické zprávy | Práce je velice obsáhlá vzhledem k širokému záběru, které autor zkoumá a popisuje. Pohybujeme se tedy na horním rozsahu obvyklého rozmezí. | ||
Prezentační úroveň technické zprávy | 80 | Práce je dobře strukturovaná, po úvodu a teoretické části se student zaměřuje na popis zkoumaných bloků následovaný popisem dat a experimentální částí. Všechny rovnice, kapitoly a obrázky jsou řádně číslovány a odkazovány. Nalezl sem malé množství technických nepřesností: str. 26: CTC mapovací funkce by si zasloužila lepší vysvětlení Obrázek 3.3 b) Prediktor RNN-T objektivní funkce má vstup z předchozího času místo součastného: y_m -> y_{m-1} str. 51: Který model byl použit pro do-učení pod vlastním dohledem? Předpokládám, že XLSR, nicméně v textu by to mělo být zdůrazněno. | |
Formální úprava technické zprávy | 80 | Práce je velice dobře napsána s malým množstvím překlepů např..: str.7: Dzmitry -> Dymitry str.21: jsou spočten -> je spočten str.21: v verzích -> ve verzích str.33: s volně -> z volně str.53: v textu je číslo 27.56 ale v tabulce 27.55 str.53: smixované -> zmixované | |
Práce s literaturou | 99 | Autor velice dobře pracoval s literaturou. Všechny důležité části jsou správně citovány a převzaté části odkazovány. Pozn. seznam použité literatury přesahuje 150. | |
Realizační výstup | 99 | Výsledkem je komplexní systém pro analýzu psychoterapeutických sezení. Všechny jeho části byly pečlivě analyzovány a testovány. | |
Využitelnost výsledků | Výsledky budou dále využívány a rozvijeny v projektu DeePsy zaměřený na psychoterapeutické sezení. |
eVSKP id 144979