Posudky závěrečné kvalifikační práce

MAČÁT, J. Identifikace pohlaví z textu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2012.

Posudky

Posudek vedoucího

Červenec, Radek

Cílem studentovi práce bylo navrhnout a implementovat algoritmus pro rozpoznávání pohlaví v elektronické textové komunikaci. Toto student splnil, přičemž výsledkem je program vytvořený v programovacím jazyku Java a s odpovídající funkcionalitou. Zadání bylo studentem dokonce překročeno, kdy kromě vlastní „slovníkové“ metody, ověřil několik metod založených na strojovém učení v prostředí RapidMiner. Výsledky poté porovnal s vlastním SW řešením, což hodnotím velmi kladně. V tomto ohledu bych měl ke studentovi jedinou výtku (i přesto že byl na toto upozorňován vedoucím). A tou je nedostatečná analýza výsledků metod založených na strojovém učení, resp. důvodů jejich selhání. Vzhledem k tomu, že toto ale nebylo hlavním cílem, tak úroveň práce není z mého pohledu výrazně snížena. Po formální a grafické stránce je práce na dobré úrovni, lze vytknout pouze drobnosti (např. použití „hvězdy“ místo standartního znaménka násobení v rovnicích). Student prokázal v průběhu roku schopnost samostatně pracovat a snažil se podněty vedoucího vždy do své práce začlenit.

Navrhovaná známka: A

Body: 92

Posudek oponenta

Burda, Karel

Předmětem práce je identifikace pohlaví z českého textu. První polovina práce se zabývá teoretickou stránkou problému. Autor zde především popisuje problematiku dolování dat a textu. Tento popis je povrchní a poměrně nepřesný (např. dolování dat na s. 13 autor definuje jako hledání korekcí namísto hledání korelací). Druhá polovina je věnována praktickému řešení zadaného problému. V této části postrádám přesný popis řešení. Z uvedených vývojových diagramů a z příkladů lze soudit, že autor k identifikaci pohlaví podle textu využil fakt, že příčestí činné má obvykle pro podmět mužského rodu odlišný tvar než-li v případě ženského rodu (např. přišel/přišla). Algoritmus pak podle majoritního výskytu mužských i ženských tvarů příčestí činného odhaduje pohlaví autora textu. Použitá metoda však v práci není řádně vysvětlena, zdůvodněna ani diskutována. Podle zmiňovaného algoritmu autor nakonec naprogramoval v jazyce Java aplikaci pro určování pohlaví z textu. Formální úprava je na průměrné úrovni a velkou slabinou je neodborné vyjadřování autora (např. na s. 25 popisuje vývojový diagram algoritmu jako životní cyklus algoritmu). Celkově hodnotím práci stupněm Uspokojivě.

Navrhovaná známka: D

Body: 68

Otázky

V příkladu č. 2 (s. 52) se v dolovaném textu vyskytují dvě příčestí - "vyhlídla" a "jel". Proč je výstupem programu tvrzení, že se jedná na 100% o pisatelku?

eVSKP id 56785