KOŘÍNEK, L. Detektor plagiátů textových dokumentů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2021.

Posudky

Posudek vedoucího

Petyovský, Petr

Zadání diplomové práce Bc. Lukáše Kořínka bylo zadáním, na jehož tvorbě se student již od počátku aktivně podílel. Zadání této práce bylo vytvořeno ve spolupráci s Centrem výpočetních a informačních služeb VUT (CVIS). V rámci řešení práce tak student komunikoval i s externím konzultantem ing. Rudolfem Musilem ze CVIS, který vypracoval posudek konzultanta práce. Zde konzultant vyzdvihuje zájem studenta o danou problematiku i jeho schopnosti pracovat samostatně. Konzultant také vyzdvihuje komunikativnost diplomanta a navrhuje své hodnocení na stupni A. Průběžné výsledky řešení své diplomové práce diplomant prezentoval také na studentské soutěži EEICT 2021, kde získal 2. místo v kategorii: M4 – Kybernetika a automatizace. Úkolem studenta bylo navrhnout a implementovat systém pro detekci plagiátů studentských prací na základě teorie zpracované v bakalářské práci studenta Ing. Martina Kobatha do reálné serverové aplikace využitelné v informačním systému VUT Apollo vyvíjený CVIS. Podmínkou konzultanta byla podpora paralelizace výpočtů pomocí akceleračních prostředků GPGPU, která je nutností s ohledem na množství studentských prací odevzdávaných do IS Apollo vždy v rámci celého VUT během několik dnu. Všech cílů práce bylo dosaženo, viz hodnocení konzultanta. Systém student od počátku designoval a implementoval tak, aby mohl být v budoucnu integrován do IS Apollo jako další metoda pro detekci plagiovaných studentských prací. Student zvolil vhodnou prezentační formu v textu práce. Diplomová práce má dostatečný rozsah a odpovídající jazykovou úroveň. Kladně taktéž hodnotím jeho pracovní nasazení a schopnost prezentace výsledků v diplomové práci. Student věnoval řešení práce dostatek času, jednotlivé úkoly si již v počátcích řešení práce vhodně rozvrhl. Student má již nyní pracovní návyky a praktické zkušenosti, které převyšují úroveň dnešních absolventů univerzit. Pracoval průběžně a samostatně, ale vždy dbal na nutnost prezentace průběžných výsledků při pravidelných konzultacích. Mohu zodpovědně konstatovat, že byla radost s ním spolupracovat. Dosažené výsledky i formální zpracování práce jednoznačně svědčí o inženýrských schopnostech studenta. Předložené práci navrhuji hodnocení: Výborně – A. (99)

Navrhovaná známka
A
Body
99

Posudek oponenta

Horák, Karel

Předložená diplomová práce zpracovává téma automatické textové detekce plagiátů v akademických dokumentech na VUT. V principu diplomant pro odhalení plagiátu využívá hledání shod v novém testovaném textu a ve známých dřívějších datech uložených v tzv. korpusu. Pro efektivní porovnání textů je využito paralelního zpracování dat na grafických kartách. Formálně je práce na dobré úrovni, text je zpracován na cca 80 stranách od úvodu po závěr v sice poměrně velkém počtu, ale v podstatě logicky členěných kapitolách. Věcně se diplomant v úvodu práce věnujte citačním normám a definicím, zejména pojmům jako doslovná citace, parafráze, kompilace apod. a dále vyjmenovává současný systém detekce plagiátů používaný v IS Apollo na VUT, systém Thesis vyvinutý na FI MU a zahraniční systém Turnitin. Teoreticky nosná je pak kapitola 3, ve které diplomant popisuje známé možnosti analýzy textu zahrnující např. převod znakové sady, syntaktický rozklad textu, tokenizace, tvorba n-gramů a dále i kritéria podobnosti a shody textů jako např. kosinová podobnost přejatá z vektorového počtu a jiné. V krátké kapitole 4 a zejména v čistě praktické kapitole 5 se pak diplomant věnuje samotné implementaci navrženého detekčního algoritmu. Velká část kapitoly 5 není příliš čtivá a připomíná spíše programátorský manuál. Netvrdím ale, že je to vzhledem k povaze práce vysloveně špatně. Z textu práce ale není zcela zřejmý vlastní podíl autora, nicméně zdá se, že jde o implementaci, popř. re-implementaci dříve navrženého systému v rámci bakalářské práce jiného autora na VUT (viz kap. 5.2). K této domněnce vede vágní sdělení autora na str. 44, že jím navržený detektor plagiátů navazuje na princip použitý v rámci předcházející práce. Bylo by vhodné, aby diplomant v rámci obhajoby své diplomové práce vymezil svůj podíl bez ohledu na to, zda šlo např. jen o paralelizovanou implementaci dříve navrženého systému. I takový přínos může být nezanedbatelný a to i s přihlédnutím k praktickému závěru autora, že kupř. dokument o 83 stranách byl analyzován během 28 sekund oproti celkem 4597 dokumentům závěrečných prací v databázi VUT. V následných kapitolách 6 až 10, které mohly být z formálního hlediska v zásadě spojeny do jedné, se autor věnuje testování navrženého systému na počítači s konkrétní konfigurací umožňující rozklad výpočtů do vláken na GPU i CPU, dále stanovení požadavků na běh implementované aplikace, použití aplikačního klienta, a nakonec připomínkám zadavatele, jímž bylo CVIS na VUT a se kterým autor práce podle uvedených informací spolupracoval. Samotný algoritmus jako výsledek diplomové práce se tedy jeví být aplikačně použitelný. S jakými výsledky mimo testovací množinu diplomové práce se prokáže až časem podle míry využívání systému odhalování plagiátů v IS Apollo vedoucími a oponenty závěrečných prací. Předloženou práci tedy doporučuji k obhajobě před komisí.

Navrhovaná známka
B
Body
85

Otázky

eVSKP id 134847