KOŘÍNEK, L. Detektor plagiátů textových dokumentů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2021.
Zadání diplomové práce Bc. Lukáše Kořínka bylo zadáním, na jehož tvorbě se student již od počátku aktivně podílel. Zadání této práce bylo vytvořeno ve spolupráci s Centrem výpočetních a informačních služeb VUT (CVIS). V rámci řešení práce tak student komunikoval i s externím konzultantem ing. Rudolfem Musilem ze CVIS, který vypracoval posudek konzultanta práce. Zde konzultant vyzdvihuje zájem studenta o danou problematiku i jeho schopnosti pracovat samostatně. Konzultant také vyzdvihuje komunikativnost diplomanta a navrhuje své hodnocení na stupni A. Průběžné výsledky řešení své diplomové práce diplomant prezentoval také na studentské soutěži EEICT 2021, kde získal 2. místo v kategorii: M4 – Kybernetika a automatizace. Úkolem studenta bylo navrhnout a implementovat systém pro detekci plagiátů studentských prací na základě teorie zpracované v bakalářské práci studenta Ing. Martina Kobatha do reálné serverové aplikace využitelné v informačním systému VUT Apollo vyvíjený CVIS. Podmínkou konzultanta byla podpora paralelizace výpočtů pomocí akceleračních prostředků GPGPU, která je nutností s ohledem na množství studentských prací odevzdávaných do IS Apollo vždy v rámci celého VUT během několik dnu. Všech cílů práce bylo dosaženo, viz hodnocení konzultanta. Systém student od počátku designoval a implementoval tak, aby mohl být v budoucnu integrován do IS Apollo jako další metoda pro detekci plagiovaných studentských prací. Student zvolil vhodnou prezentační formu v textu práce. Diplomová práce má dostatečný rozsah a odpovídající jazykovou úroveň. Kladně taktéž hodnotím jeho pracovní nasazení a schopnost prezentace výsledků v diplomové práci. Student věnoval řešení práce dostatek času, jednotlivé úkoly si již v počátcích řešení práce vhodně rozvrhl. Student má již nyní pracovní návyky a praktické zkušenosti, které převyšují úroveň dnešních absolventů univerzit. Pracoval průběžně a samostatně, ale vždy dbal na nutnost prezentace průběžných výsledků při pravidelných konzultacích. Mohu zodpovědně konstatovat, že byla radost s ním spolupracovat. Dosažené výsledky i formální zpracování práce jednoznačně svědčí o inženýrských schopnostech studenta. Předložené práci navrhuji hodnocení: Výborně – A. (99)
Předložená diplomová práce zpracovává téma automatické textové detekce plagiátů v akademických dokumentech na VUT. V principu diplomant pro odhalení plagiátu využívá hledání shod v novém testovaném textu a ve známých dřívějších datech uložených v tzv. korpusu. Pro efektivní porovnání textů je využito paralelního zpracování dat na grafických kartách. Formálně je práce na dobré úrovni, text je zpracován na cca 80 stranách od úvodu po závěr v sice poměrně velkém počtu, ale v podstatě logicky členěných kapitolách. Věcně se diplomant v úvodu práce věnujte citačním normám a definicím, zejména pojmům jako doslovná citace, parafráze, kompilace apod. a dále vyjmenovává současný systém detekce plagiátů používaný v IS Apollo na VUT, systém Thesis vyvinutý na FI MU a zahraniční systém Turnitin. Teoreticky nosná je pak kapitola 3, ve které diplomant popisuje známé možnosti analýzy textu zahrnující např. převod znakové sady, syntaktický rozklad textu, tokenizace, tvorba n-gramů a dále i kritéria podobnosti a shody textů jako např. kosinová podobnost přejatá z vektorového počtu a jiné. V krátké kapitole 4 a zejména v čistě praktické kapitole 5 se pak diplomant věnuje samotné implementaci navrženého detekčního algoritmu. Velká část kapitoly 5 není příliš čtivá a připomíná spíše programátorský manuál. Netvrdím ale, že je to vzhledem k povaze práce vysloveně špatně. Z textu práce ale není zcela zřejmý vlastní podíl autora, nicméně zdá se, že jde o implementaci, popř. re-implementaci dříve navrženého systému v rámci bakalářské práce jiného autora na VUT (viz kap. 5.2). K této domněnce vede vágní sdělení autora na str. 44, že jím navržený detektor plagiátů navazuje na princip použitý v rámci předcházející práce. Bylo by vhodné, aby diplomant v rámci obhajoby své diplomové práce vymezil svůj podíl bez ohledu na to, zda šlo např. jen o paralelizovanou implementaci dříve navrženého systému. I takový přínos může být nezanedbatelný a to i s přihlédnutím k praktickému závěru autora, že kupř. dokument o 83 stranách byl analyzován během 28 sekund oproti celkem 4597 dokumentům závěrečných prací v databázi VUT. V následných kapitolách 6 až 10, které mohly být z formálního hlediska v zásadě spojeny do jedné, se autor věnuje testování navrženého systému na počítači s konkrétní konfigurací umožňující rozklad výpočtů do vláken na GPU i CPU, dále stanovení požadavků na běh implementované aplikace, použití aplikačního klienta, a nakonec připomínkám zadavatele, jímž bylo CVIS na VUT a se kterým autor práce podle uvedených informací spolupracoval. Samotný algoritmus jako výsledek diplomové práce se tedy jeví být aplikačně použitelný. S jakými výsledky mimo testovací množinu diplomové práce se prokáže až časem podle míry využívání systému odhalování plagiátů v IS Apollo vedoucími a oponenty závěrečných prací. Předloženou práci tedy doporučuji k obhajobě před komisí.
eVSKP id 134847