KŘÍŽ, O. Získávání znalostí z dat pojišťovny [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.

Posudky

Posudek vedoucího

Bartík, Vladimír

I když přístup studenta hodnotím jako nadstandardní, její výsledek byl ovlivněn výše uvedenými komplikacemi. Přesto student zadání splnil a výsledky jsou zajímavé. Navrhuji hodnocení stupněm C (dobře).

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Cílem bakalářské práce bylo seznámit se s problematikou získávání znalostí z databází a s daty poskytnutými pojišťovnou. Poté bylo potřeba navrhnout úlohy vhodné pro tato data a provést experimenty. Zadání bylo splněno, rozsah provedených experimentů a samotné implementace však byl ovlivněn tím, že data byla studentovi poskytnuta se zpožděním, až v průběhu letního semestru. V daném čase student udělal maximum možného a provedené experimenty jsou kvalitní.
Práce s literaturou Studijní etapa proběhla bez problémů, student využil prameny, které jsem mu doporučil, některé další si vyhledal samostatně.
Aktivita během řešení, konzultace, komunikace Student byl aktivní během celého roku, aktivita se ještě zvýšila poté, co měl k dispozici data z pojišťovny. Na konzultace byl student vždy dobře připraven.
Aktivita při dokončování I přes výše uvedené student dokončil práci včas, konečná podoba práce byla se mnou konzultována.
Publikační činnost, ocenění
Navrhovaná známka
C
Body
75

Posudek oponenta

Burgetová, Ivana

Vzhledem k malému rozsahu realizační části předložené bakalářské práce a slabé využitelnosti realizačního výstupu navrhuji hodnocení stupněm E.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Jedná se o poměrně obecné zadání, kde náročnost práce bude silně záviset na datech, se kterými bude student pracovat, a na zvolených dolovacích úlohách. Vzhledem k datům, se kterými student pracoval, a zvoleným úlohám, hodnotím zadání jako méně obtížné, protože data nevyžadovala zvláště složitou přípravu, a ani zvolené dolovací úlohy nejsou příliš komplikované.
Rozsah splnění požadavků zadání
Rozsah technické zprávy Rozsah technické zprávy je sice v obvyklém rozmezí, ale v práci postrádám některé důležité informace ohledně provedených experimentů (viz další bod).
Prezentační úroveň technické zprávy 62 Logická struktura technické zprávy je dobrá a jednotlivé kapitoly na sebe dobře navazují. Horší je to s pochopitelností zprávy pro čtenáře. Použitá data nejsou v práci dobře popsána (z důvodu utajení), a proto popis realizační části práce je značně mlhavý a nekonkrétní. Dále v práci postrádám podrobnější informace o natrénovaných klasifikátorech - např. u MLP nejsou uvedeny počty neuronů ani vrstev, použité aktivační funkce apod., u rozhodovacího stromu není zmíněno použité rozhodovací kritérium atd.
Formální úprava technické zprávy 73 Po jazykové stránce se jedná o průměrnou práci s obvyklým množstvím stylistických nedostatků a překlepů. Z typografického hlediska se jedná o kvalitní práci.
Práce s literaturou 78 Seznam použité literatury není příliš rozsáhlý, ale dobře pokrývá zpracovávané téma. Převzaté prvky jsou řádně odlišeny od vlastních výsledků a úvah.
Realizační výstup 52 Realizační výstup je vzhledem ke svému rozsahu nejslabším bodem této bakalářské práce. Výstupem jsou pouze dva jupyter notebooky, jeden pro dolování asociačních pravidel, druhý pro klasifikaci pojistných událostí. Tyto notebooky jsou schopné přijmout csv soubor očekávaného formátu a provést danou dolovací úlohu. Bohužel potřebné csv soubory nebyly z důvodu utajení dat odevzdány a nikde ani není popsaný očekávaný formát těchto souborů. Funkčnost skriptů tak lze ověřit pouze při dodání potřebných vstupů studentem. Co se týká kvality těchto skriptů, mám výhrady především ke klasifikačním úlohám. Data pro tyto úlohy nebyla podle mého názoru dostatečně kvalitně předzpracována (nevhodné kódování kategorických atributů, neprovedená normalizace). Dále postrádám podrobnější testování vhodných parametrů alespoň u jednoho zvoleného klasifikačního modelu.
Využitelnost výsledků Využitelnost vytvořených notebooků je velmi omezená vzhledem k nedostatečné dokumentaci toho, jaký formát vstupu notebooky vyžadují. Přesnost vytvořených klasifikátorů je poměrně nízká (cca 60 % u první úlohy a 40 % u druhé úlohy), a proto jejich využitelnost je diskutabilní. Dolování asociačních pravidel přineslo určité výsledky, ale i zde nemám pocit, že by nalezená pravidla přinášela nějakou novou, neočekávanou informaci.
Navrhovaná známka
E
Body
55

Otázky

eVSKP id 154630