KLUSÁČEK, J. Ochrana proti profilování pomocí náhodného vícejazyčného vyhledávání [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.
Práce je kvalitní a naplnění všech požadavek předčilo požadavky. Student pracoval velmi flexibilně a dokázal reagovat na omezení, která se během zpracování objevila. Celkově byla samostatní práce studenta velmi kvalitní a důsledná. Výstupy práce přinášejí nové poznatky které jsou zajímavé pro bezpečnostní komunitu.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Informace k zadání | Zadání této bakalářské práce bylo náročnější, vyžadovalo orientaci v nové problematice, samostatný návrh vyhodnocení a experimentů a experimentální ověření. Student využil volnost zadání a práci zpracoval perfektně. | ||
Práce s literaturou | Student využil doporučenou literaturu a aktivně vyhledával další relevantní odbornou literaturu, kterou vhodně využil. Rozsah použité literatury úplně nespada do standardu závěrečné práce, což je však dáno množstvím dostupné literatury v dané oblasti, ne zanedbáním ze strany studenta. | ||
Aktivita během řešení, konzultace, komunikace | Student byl během řešení velmi aktivní, pravidelně se účastnil konzultací, na které vždy přicházel připraven a prezentoval výrazný pokrok ve své práci. | ||
Aktivita při dokončování | Práce byla dokončena s předstihem a všechny připomínky byly zapracovány. | ||
Publikační činnost, ocenění | Je v plánu práci přepsat do výzkumné publikace a odeslat na relevantní bezpečnostní konferenci. |
Mé průměrné hodnocení je založeno na ne zcela kvalitním provedením textové zprávy. Také to, že se jedná spíše o experimentální práci, i když velmi dobře odvedenou, mě v průměrném hodnocení utvrzuje. Stupeň C ovšem uvádím na jeho horní hranici.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Náročnost zadání | Tématem práce bylo ověření, zdali se použitím náhodných dotazů nebo použitím více jazyků dá omezit schopnosti vyhledávacích systémů při profilaci uživatele. Jelikož se jedná spíše o experimentální projekt, který ovšem vyžaduje pochopení prosesu profilace a nalezení způsobu, jak experimenty provádět a vyhodnocovat, hodnotím obtížnost jako průměrnou. | ||
Rozsah splnění požadavků zadání | Zadání splněno bylo. Za cílový vyhledávací systém byl zvolen Seznam a experimentálně bylo zjištěno, že použitím náhodných dotazů nebo více jazyků, ve kterých jsou dotazy zadávány, lze do jisté míry omezit schopnost tohoto vyhledávače profilovat tazatele. | ||
Rozsah technické zprávy | |||
Prezentační úroveň technické zprávy | 60 | V textu práce je uvedeno až na několik výtek, které uvedu níže, vše podstatné a stejně tak je přijatelná i struktura textu. Na začátku student představuje profilování uživatelů a vyhledávací systémy. Zde by se hodilo uvést to, co uvádí v závěru v kapitole 7, a tedy proč páce nemohla být vykonána se systémem Google a proč byl zvolen systém Seznam. Některé formulace jsou uváděny vícekrát, například o nulové a alternativní hypotéze. Na úkor toho mohly být blíže diskutovány dílčí výsledky, opět jako příklad uvedu výsledky s odloženým použitím náhodných dotazů. Také mohlo být uvedeno, jak se profilace vyvíjí, kdyby náhodné dotazy po nějakém čase přestaly být používány. Další výhrady mám k některým dalším částem, které jsou stručné, i když by mohly být více rozvedeny. Například se jedná o statistické metody, které byly při testování použity. Jaccardův index je sice stručně uveden, ale co značí p-hodnota zde chybí, i když ta je použita později u experimentů (resp. že takto se značí Jaccardův index). Kapitola 6.1.3. také mohla být podrobnější. Zmínění koeficientu alfa je zde bez bližšího uvedení. Dále mi v práci chybí názorné příklady. Například jak vypadá zápis zjištěných zájmů tazatele, přičemž takový zápis je podstatný pro provádění testování. Jako poslední výtku uvedu svoji nespokojenost s tím, jak je popsán implementovaný systém. Popis jednotlivých souborů skriptů (strana 26) s fungování systému (strana 28) šlo udělat lépe, názorněji a formálněji. Prezentační stránku práce považuji za slabší a hodnotím mírně pod průměrem. | |
Formální úprava technické zprávy | 75 | Práce je psána v angličtině a nakolik mohu tento jazyk posoudit, zdá se mi bez gramatických chyb. Neformální výrazy jsou použity jen v několika málo případech (naked eye na straně 74). Po stylistické stránce mám výhrady k použití některých obrázků, které nejsou příliš čitelné (strana 18). Dále se mi nelíbí použití odrážek na stranách 26 a 27. Proto hodnotím tento bod průměrně. | |
Práce s literaturou | 90 | Třicet uvedených pramenů je relevantních vůči tématu práce a tyto jsou v práci řádně citovány. Nenalezl jsem ani žádné jiné prohřešky proti citační etice. | |
Realizační výstup | 90 | Realizačním výstupem je systém, se kterým byly prováděny výše uvedené testy. Student analyzoval možnosti provádění automatických dotazů, zvolil podle mého názoru správný přístup a ten vhodně implementoval. Tímto systémem dokázal provádět zamýšlené experimenty a získávat potřebná data. | |
Využitelnost výsledků | Výsledky experimentů ukazují, že použivání náhodných dotazů dokáže zmást vyhledávač Seznam při profilaci uživatele, konkrétně při odhadování jeho zájmů. Tato práce může být výchozí pro další zkoumání možností anonymizace uživatelů používajících i jiné vyhledávače. |
eVSKP id 153822