POLOK, A. Analýza entit v psychoterapeutických sezeních [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.

Posudky

Posudek vedoucího

Matějka, Pavel

Student pracoval celý rok s pravidelnými konzultacemi, na které byl vždy připraven. Připravil, navrhl, implementoval a odzkoušel svůj návrh systému na detekci řečové aktivity, diarizaci, rozpoznávání řeči a klasifikaci terapeutických intervencí. Práci samotnou, její výsledky a přístup studenta hodnotím velice pozitivně. Chtěl bych touto cestou navrhnout tuto práci na cenu děkana/rektora nebo jiným způsobem ocenit práci, kterou student vykonal.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Zadání je experimentálního charakteru a vyžadovalo od studenta zvládnout několik samostatných úloh. Student se musel seznámit s problematikou detekce řečové aktivity, diarizace, rozpoznávání řeči a klasifikačními úlohami. Pro všechny jmenované úlohy musel student navrhnout ucelený systém nebo klasifikátor a řádně ho otestovat. Zadání bylo řešeno ve spojitosti s projektem DeePsy (Deep learning v psychoterapii: Strojová analýza nahrávek terapeutických sezení) a součástí studentovy práce byla i komunikace s členy řešitelského týmu z VUT a s MU. Pro některé úlohy vytvořil student vlastní trénovací a testovací dataset. Zadání bylo splněno bez výhrad a student pracoval nad rámec požadované práce.
Práce s literaturou Student pracoval s literaturou velice dobře a přečetl všechny doporučené články na dané téma a aktivně si hledal další. Navíc konsultoval s dalšími členy skupiny Speech@FIT , které ve výsledku přineslo další zlepšení systémů a rozšíření znalostí studenta, které aktivně šíří dál.
Aktivita během řešení, konzultace, komunikace Student se pravidelně účastnil konzultací. Na konzultace byl vždy připraven. Pokud se konzultace nekonala, posílal emailovou zprávu o stavu řešení. Student velice aktivně řešil problémy, se kterými se vypořádal velice rychle.
Aktivita při dokončování Student pracoval velice aktivně během prvního i druhého semestru. Student odhadl čas na psaní práce velice přesně. Většina práce byla napsána s předstihem. Struktura a obsah práce byl konzultován a veškeré připomínky zapracovávány průběžně.
Publikační činnost, ocenění Článku s názvem “DeePsy: Představení online nástroje pro zpětnou vazbu v psychoterapii” (autoři: Tomáš Řiháček, Jan Nehyba, Michal Čevelíčěk, Alexander Polok, Pavel Matějka, Petr Doležal).Článek byl 9. listopadu 2022 odeslán do redakce časopisu Psychoterapie a nyní je v recenzním řízení. Odborný článek na EXCEL FIT 2023: Leveraging Pretrained Models for Automatic Speech Recognition in Psychotherapy Sessions. Práce dostala 2 ocenění - od odborného panelu a partnera z průmyslu. Práce na projektu DeePsy (Deep learning v psychoterapii: Strojová analýza nahrávek terapeutických sezení), trénování modelů, konzultace s kolegy z VUT a MU, účast na projektových schůzkách a implementace systému DeePsy.
Navrhovaná známka
A
Body
100

Posudek oponenta

Karafiát, Martin

   Student zadání diplomové práce podstatně rozšířil, aniž by zvětšený rozsah ztrácel na kvalitě. Nebál bych se říci, že bez velkých úprav lze z této práce udělat dvě nové a obě dobře hodnocené. Jedna zaměrená na automatický přepis řeči a druhá na psychoterapeutiku. Proto bych rád navrhl i nějaké ocenění.  

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání
Rozsah splnění požadavků zadání Jednalo se o pruměrně obtížné, nebot spousta bloků byla již hotova: VAD - detekce řečové aktivity ASR - automaticky přepis řeči autor se tedy mohl zaměřit pouze na příznaky pro psychoterapeutické sezení, což bylo splněno. Nad rámec zadání autor analyzoval a vytvořil nový systém pro: VAD ASR na bázi End-to-End architektury se zlepšením. Klasifikace sentimentu. Klasifikace typu terapeutických intervencí. Diarizace pro dva mluvčí. Detekce překrývající se řeči. Tímto výrazně přispěl k rozvoji projektu DeePsy.
Rozsah technické zprávy Práce je velice obsáhlá vzhledem k širokému záběru, které autor zkoumá a popisuje. Pohybujeme se tedy na horním rozsahu obvyklého rozmezí.
Prezentační úroveň technické zprávy 80 Práce je dobře strukturovaná, po úvodu a teoretické části se student zaměřuje na popis zkoumaných bloků následovaný popisem dat a experimentální částí. Všechny rovnice, kapitoly a obrázky jsou řádně číslovány a odkazovány. Nalezl sem malé množství technických nepřesností: str. 26: CTC mapovací funkce by si zasloužila lepší vysvětlení Obrázek 3.3 b) Prediktor RNN-T objektivní funkce má vstup z předchozího času místo součastného: y_m -> y_{m-1} str. 51: Který model byl použit pro do-učení pod vlastním dohledem? Předpokládám, že XLSR, nicméně v textu by to mělo být zdůrazněno.
Formální úprava technické zprávy 80 Práce je velice dobře napsána s malým množstvím překlepů např..: str.7: Dzmitry -> Dymitry str.21: jsou spočten -> je spočten str.21: v verzích -> ve verzích str.33: s volně  -> z volně str.53: v textu je číslo 27.56 ale v tabulce 27.55 str.53: smixované  -> zmixované
Práce s literaturou 99 Autor velice dobře pracoval s literaturou. Všechny důležité části jsou správně citovány a převzaté části odkazovány. Pozn. seznam použité literatury přesahuje 150.
Realizační výstup 99 Výsledkem je komplexní systém pro analýzu psychoterapeutických sezení. Všechny jeho části byly pečlivě analyzovány a testovány.
Využitelnost výsledků Výsledky budou dále využívány a rozvijeny v projektu DeePsy zaměřený na psychoterapeutické sezení.
Navrhovaná známka
A
Body
95

Otázky

eVSKP id 144979