VALÍK, A. Zpracování a vyhledávání dokumentů s využitím vektorových databází a jazykového modelu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.

Posudky

Posudek vedoucího

Bartík, Vladimír

Vzhledem k bezproblémovém průběhu, kvalitě výsledku i úspěchu na konferenci Excel@FIT navrhuji hodnocení výborně (A).

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Cílem této bakalářské práce bylo vytvoření vyhledávacího nástroje v rámci nestrukturovaných textových dat s využitím jazykových modelů a vektorových databází. Uživatel dotazy zadává v přirozeném jazyce a odpovědi jsou tvořeny jazykovým modelem. Jde o komplexní a kvalitní řešení, které je využitelné v praxi pro libovolná textová data.
Práce s literaturou Vše potřebné pro řešení si student obstaral samostatně, práce s literaturou je dle mého názoru bezproblémová.
Aktivita během řešení, konzultace, komunikace Šlo o vlastní zadání studenta, na kterém pracoval student především samostatně, několik konzultací však proběhlo a byl jsem tak informován o pokrocích v řešení.
Aktivita při dokončování Práce byla dokončena s předstihem a vše bylo konzultováno před odevzdáním.
Publikační činnost, ocenění Student prezenoval řešení na konferenci Excel@FIT ve formě posteru a získal ocenění od průmyslových partnerů.
Navrhovaná známka
A
Body
96

Posudek oponenta

Burgetová, Ivana

V rámci řešení bakalářské práce se student věnoval aktuálnímu a žádanému tématu vyhledávání dokumentů s využitím AI. Předloženou bakalářskou práci považuji za nadstandardní z hlediska realizačního výstupu i textové zprávy. Proto navrhuji hodnocení stupněm A.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Náročnost zadání spatřuji v nutnosti zorientovat se v možnostech mnoha nástrojů pro práci s textem a v jejich kombinaci do jednoho funkčního celku.
Rozsah splnění požadavků zadání
Rozsah technické zprávy
Prezentační úroveň technické zprávy 93 Prezentační úroveň technické zprávy je velmi dobrá. Jednotlivé kapitoly na sebe dobře navazují a text je dobře pochopitelný pro čtenáře. Studentovi se podařilo velmi výstižně popsat vytvořený systém, který je poměrně komplexní.
Formální úprava technické zprávy 95 Předložená práce obsahuje pouze velmi málo drobných překlepů a považuji ji za nadstandardní z jazykového i typografického pohledu.
Práce s literaturou 88 Výběr studijních pramenů je dobrý. Student využil pro řešení práce relevantní zdroje a převzaté prvky jsou řádně odlišeny od vlastních výsledků a úvah. Drobnou výhradu mám k tomu, že seznam literatury obsahuje cca 10 zdrojů, které představují dokumentaci k použitým nástrojům.
Realizační výstup 99 Realizačním výstupem této práce je plně funkční systém pro zpracování a vyhledávání dokumentů s využitím vektorové databáze a jazykových modelů. Nástroj dovoluje pracovat s textovými dokumenty v různém formátu. Za nadstandardní považuji to, kolik různých nástrojů student spojil do jednoho funkčního celku (nástroje pro extrakci textu, jeho předzpracování, embedding textu, využití databáze umožňující vektorové i fulltextové vyhledávání, využití jazykových modelů pro transformaci dotazu, určení relevance nalezených částí dokumentů a vytvoření finální odpovědi systému). Systém také umožňuje pracovat s historií dotazů a filtrovat odpovědi na základě metadat (např. přístupových práv). Student také provedl řadu experimentů pro určení vhodných parametrů systému a systém řádně otestoval.
Využitelnost výsledků Jedná se o práci kompilačního charakteru - student využil dostupné technologie, které sestavil do jednoho funkčního systému. Výsledkem je funkční lokální systém. Nasazení v praxi by patrně vyžadovalo jisté úpravy.
Navrhovaná známka
A
Body
96

Otázky

eVSKP id 163475