HARÁR, P. Zlepšení předpovědi sociálních značek využitím Data Mining [online]. Brno: Vysoké učení technické v Brně. Fakulta podnikatelská. 2015.
Jaká je dle Vašeho názoru relevantnost údajů z Wikipedie? Jaké jiné externí datové zdroje by se daly použít pro Vámi navrhované řešení? Jaké jsou klíčové faktory ovlivňující data mining u nestrukturovaných dat?
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Splnění stanovených cílů | C | ||
Zvolený postup řešení, adekvátnost použitých metod | D | ||
Schopnost interpretovat dosažené výsledky a vyvozovat z nich závěry | D | ||
Praktická využitelnost výsledků | C | ||
Uspořádání práce, formální náležitosti, použitá terminologie a odborná jazyková úroveň | C | ||
Práce s informačními zdroji, včetně citací | E | V teoretické části je použito málo zdrojů zaměřujících se na oblast nestrukturovaných dat. U uvedených vzorců není citace uvedena vůbec (str. 23-24). |
Diplomová práca má 77 strán, je rozdelená 5 kapitol a je písaná v slovenskom jazyku. Cieľom práce bolo navrhnúť algoritmus zlepšenia predikcie sociálnych značiek. K tomuto účelu študent použil metódu TF-IDF. Metódu implementoval v programovacom jazyku Python. Práca je písaná pútavo a systematicky popisuje problematiku spolu s následnou implementáciou. Oceňujem prehľadne uvedené výstupy s dôrazom na praktickosť, ako aj uvedenie nedostatkov algoritmu a jeho možné zlepšenia. Formálna úroveň práce je už o niečo horšia. V texte diplomovej práce sa nachádzajú značné gramatické a syntaktické chyby. Je taktiež škoda, že študent v práci nevenoval viac času popisu vlastných algoritmov na čistenie textu, ktoré nevyužívajú metódy regulárnych výrazov: cleanNestedParentheses() a cleanNestedElements(). Ciele diplomovej práce boli splnené a študent dosiahol veľmi sľubných výsledkov.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Splnění stanovených cílů | A | ||
Zvolený postup řešení, adekvátnost použitých metod | B | ||
Schopnost interpretovat dosažené výsledky a vyvozovat z nich závěry | B | ||
Praktická využitelnost výsledků | B | ||
Struktura práce, použitá terminologie a odborná jazyková úroveň | C | ||
Práce s informačními zdroji | C |
eVSKP id 76739