ŠANDA, P. Určení základního tvaru slova [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2011.
Student vypracoval diplomovou práci na téma "Určení základního tvaru slova", v rámci které prostudoval problematiku týkající se předzpracování textu, stemmingu, lemmatizace a používané algoritmy v těchto oblastech. Student při řešení práce vycházel ze známých algoritmů pro zpracování anglického textu a přizpůsobil je tak, aby pracovali i s češtinou. Algoritmy byly během vypracování práce inovovány a doplněny o další funkce, které si s českým jazykem lépe poradí. V rámci diplomové práce student vytvořil validační množinu, která prozatím vědcům zabývající se lemmatizací češtiny na celém světě chyběla. Tato množina obsahuje pro začátek 100 dokumentů. Student provedl implementaci návrhu v programovacím jazyce JAVA a výsledný algoritmus porovnal s asi nejúspěšnějším lemmatizátorem pro český jazyk (LemmaGen). Ve výsledku se ukázalo, že studentem navržený algoritmus pracuje s vyšší přesností. Student přistupoval k práci velmi aktivně, po celý rok chodil pravidelně na konzultace, přinášel vlastní nápady, řešení a po celý rok byly vidět přírůstky nejen v teoretické, ale i praktické části práce. Student prokázal také své komunikativní schopnosti, neboť během zpracování práce navázal kontakty se zahraničními výzkumnými týmy zabývajícími se stejnou problematikou. Výsledkem studentovi práce je aplikace pro lemmatizaci češtiny, která může být navíc využita i jako knihovna pro další aplikace zpracovávající textová data. Diplomant během řešení prokázal velmi dobré komunikační a nezbytné inženýrské dovednosti, které vedli k úspěšnému splnění zadaného úkolu. Zkušební komisi navrhuji hodnocení práce stupněm "výborně/A" (98 bodů).
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Splnění zadání | A | 50/50 | |
Aktivita během řešení a zpracování práce (práce s literaturou, využívání konzultací, atd.) | A | 20/20 | |
Využití literatury | A | 9/10 | |
Formální zpracování práce | A | 19/20 |
Práce se zabývá predzpracováním textu na základní tvar slov pro potreby další analýzy. Student plne splnil zadání diplomové práce a dosáhl vysoké odborné úrovne práce. Na práci lze ocenit, že student kvalitne nastudoval soucasný stav problematiky stavu vedy a techniky. S pomocí kombinace 2 stávajících metod navrhl hybridní metodu a významne zpresnil výsledky. Práci bych vytknul obcasný neoptimální objektový návrh a neoptimální dokumentaci celého kódu.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Splnění požadavků zadání | A | 20/20 | |
Odborná úroveň práce | A | 48/50 | |
Interpretace výsledků a jejich diskuse | B | 17/20 | |
Formální zpracování práce | C | 7/10 |
eVSKP id 40048