BUREŠOVÁ, Z. Algoritmy a metody statistického hodnocení Q řazení [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.

Posudky

Posudek vedoucího

Herout, Adam

Řešitelka pracovala s neobvyklou a málo dokumentovanou metodikou. Musela se zorientovat a přicházet s vlastními inovativními řešeními. Dosažené výsledky jsou základní odpovědí na zadání práce – bylo možné dosáhnout více a odvést více práce. Zadání nicméně naplněno bylo a řešitelka pracovala po oba semestry a naučila se několik pro ni nových a netriviálních nástrojů a přístupů.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Zadání vychází z projektu TAČR Q info. Řešitelka měla za úkol prostudovat problematiku Q metodologie, zejména vyhodnocování získaných dat, tuto problematiku zmapovat a prototypovat a následně vytvořit nástroje, které by umožnily interpretovat výsledky získané Q řazením. Zadání bylo splněno – dasažené výsledky nejsou úplně omračující, ale přece naznačují možnosti vyhodnocování výsledků Q řazení.
Práce s literaturou Řešitelka musela dobře nastudovat problematiku Q řazení a vyhledat k tomu potřebnou literaturu. Dále se musela seznámit s vícero nástroji pro zpracování a zobrazování dat. Množství vyhledané literatury je spíše základní – což je dáno i tím, že mnoho literatury v této oblasti není.
Aktivita během řešení, konzultace, komunikace Řešitelka pracovala po oba semestry a docházela na domluvené konzultace. Celková intenzita práce a průběžně dosahované pokroky byly průměrné.
Aktivita při dokončování Práce byla dokončena včas. Některá rozhodnutí ohledně struktury a provedení textu technické zprávy studentka dělala samostatně.
Publikační činnost, ocenění N/A
Navrhovaná známka
C
Body
75

Posudek oponenta

Beran, Vítězslav

Autorka řešila netriviální úlohu statistického vyhodnocení experimentálních dat z Q-řazení. Výstupem je sada funkcí pro vyhodnocení vybraných aspektů experimentu a jejich vizualizace. Technická zpráva obsahuje řadu relevantních informací, ale v celku nepřináší jasné pochopení podstaty problému, zvolených metod a jejich vlastností, ani intepretaci výsledků zpracovaných a vizualizovaných dat. Míra pochopení problematily se projevuje i při prezentaci explorace vizualizovaných výsledků ananlýzy dat.  Kvalitě výsledku by pomohlo hlubší studium klíčových znalostí týkajících se jádra problému, zejména je-li řešená problematika netriviální.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Vyhodnocovaní získaných dat z Q-řazení vyžaduje dobré pochopení vybraných statistických metod i hlubší podstatu principu Q-řazení.
Rozsah splnění požadavků zadání
Rozsah technické zprávy
Prezentační úroveň technické zprávy 60 Technická zpráva má nevyváženou struktura textu, kdy některé podkapitoly jsou jen na pár řádků (např. kap. 2.3 má 4 řádky, 2.1 má 6 řádků, oproti např. kap. 2.2 se 7 stranami). U textu takto malého rozsahu nepovažuji za vhodné dělení na podkap. třetí úrovně. Vysvětlení celého přístupu není příliš srozumitelné. Objevuje se řada nedostatečně vysvětlených termínů (bod, faktor, proměnná, skupina, zátěž faktoru) a společně s dalšími nepřesnostmi lze celou prezentovanou problematiku velmi obtížně pochopit (obr. 2.5 např. neobsahuje rotovaná data, ale pouze rotované osy, které ale nejsou kolmé). Studijní část obsahuje obecný popis metody PCA, ale další použité metody nejsou představeny vůbec. V implementační části popis některých výpočetních funkcí (např. correlation_heatmap) nevyužívá statistické terminologie a čtenář obtížně zjišťuje, co je vlastně podstatou některých funkcí. Chybí jasný návrh řešení, který by detailně popsal, co je vlastně potřeba řešit a co konkrétně má být výstupem práce. Není zřejmé, jak probíhá návrh sady karet, jak se mají vybrat faktory a jak souvisí s kartičkami, jaké výpočty je nutné s výsledky řazení provést, abychom něco zjistili. Není vlastně ani moc jasné, co přesně chceme z výsledků zjistit. Implementace rovnou popisuje, co které navržené funkce dělají. Čtenář ale neví, čeho potřebuje dosáhnout a jak by tedy tyto funkce měl použít, co u nich sledovat jako klíčové vlastnosti atd. U experimentů není zřejmé, co je to běh řazení . Dále není zřejmé, proč nebyl použit pro sběr dat nějaký SW nástroj, aby se automatizoval přepis výsledků řazení.
Formální úprava technické zprávy 75 Text je sám o sobě srozumitelný, jasný a je víceméně bez chyb. Technická zpráva vhodně využívá formátování textu. V textu se pro znak čísla nula  "0" obejvil znak velké "O" (str. 23). Některé obrázky jsou nevhodně v rastrovém formátu a mají nízké rozlišení, různé rozměry apod. (např. obr. 5.5, 5.9, 5.11 a další).
Práce s literaturou 65 Vybrané studijní zdroje jsou relevantní. Využití znalostí je diskutabilní, protože mnoho klíčových informací a otázek v textu zůstalo nejasných. Některé kapitoly v teoretické (kap. 2., kap. 2.2.2) odkazují na mnoho zdrojů najednou. Není tak zřejmé, z jakého zdroje autorka čerpá konkrétní znalosti. Některé převzaté obrázky neodkazují na zdroj (např. obr. 2.2).
Realizační výstup 65 Výsledkem práce je sada funkcí, které umožňují zpracování dat z výsledků Q-řazení a jejich vizualizaci. Jedná se o řadu vesměs principiálně jednoduchých funkcí, které někdy do procesu přidávají pouze výběr a manipulaci s daty. Výběr typů vizualizace je rozmanitý a přínosný.  Navržená knihovna funkcí rozděluje funkce na vykreslovací a výpočetní, ale i některé výpočetní funkce nakonec něco vykreslují, což celkově znesnadňuje pochopení práce s vytvořenou knihovnou. Statistické metody byly realizovány pouze některé a z nich některé pouze z části. Implementace staví na relevantních knihovnách pro jazyk Python, jako jsou SciPy a Sklearn, a vykreslování staví na knihovně Plotly. Zdrojové kódy jsou pečlivě komentované a obsahují informaci o autorství.
Využitelnost výsledků Z prezentace výsledků práce lze těžko hodnotit využití vytvořené sady funkcí. Není totiž příliš zřejmé, kdo by měl být uživatelem výsledku, zda-li vývojář nějaké SW aplikace nebo psycholog.
Navrhovaná známka
C
Body
70

Otázky

eVSKP id 155254