MAČÁT, J. Identifikace pohlaví z textu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2012.
Cílem studentovi práce bylo navrhnout a implementovat algoritmus pro rozpoznávání pohlaví v elektronické textové komunikaci. Toto student splnil, přičemž výsledkem je program vytvořený v programovacím jazyku Java a s odpovídající funkcionalitou. Zadání bylo studentem dokonce překročeno, kdy kromě vlastní „slovníkové“ metody, ověřil několik metod založených na strojovém učení v prostředí RapidMiner. Výsledky poté porovnal s vlastním SW řešením, což hodnotím velmi kladně. V tomto ohledu bych měl ke studentovi jedinou výtku (i přesto že byl na toto upozorňován vedoucím). A tou je nedostatečná analýza výsledků metod založených na strojovém učení, resp. důvodů jejich selhání. Vzhledem k tomu, že toto ale nebylo hlavním cílem, tak úroveň práce není z mého pohledu výrazně snížena. Po formální a grafické stránce je práce na dobré úrovni, lze vytknout pouze drobnosti (např. použití „hvězdy“ místo standartního znaménka násobení v rovnicích). Student prokázal v průběhu roku schopnost samostatně pracovat a snažil se podněty vedoucího vždy do své práce začlenit.
Předmětem práce je identifikace pohlaví z českého textu. První polovina práce se zabývá teoretickou stránkou problému. Autor zde především popisuje problematiku dolování dat a textu. Tento popis je povrchní a poměrně nepřesný (např. dolování dat na s. 13 autor definuje jako hledání korekcí namísto hledání korelací). Druhá polovina je věnována praktickému řešení zadaného problému. V této části postrádám přesný popis řešení. Z uvedených vývojových diagramů a z příkladů lze soudit, že autor k identifikaci pohlaví podle textu využil fakt, že příčestí činné má obvykle pro podmět mužského rodu odlišný tvar než-li v případě ženského rodu (např. přišel/přišla). Algoritmus pak podle majoritního výskytu mužských i ženských tvarů příčestí činného odhaduje pohlaví autora textu. Použitá metoda však v práci není řádně vysvětlena, zdůvodněna ani diskutována. Podle zmiňovaného algoritmu autor nakonec naprogramoval v jazyce Java aplikaci pro určování pohlaví z textu. Formální úprava je na průměrné úrovni a velkou slabinou je neodborné vyjadřování autora (např. na s. 25 popisuje vývojový diagram algoritmu jako životní cyklus algoritmu). Celkově hodnotím práci stupněm Uspokojivě.
eVSKP id 56785