VALÍK, A. Zpracování a vyhledávání dokumentů s využitím vektorových databází a jazykového modelu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.
Vzhledem k bezproblémovém průběhu, kvalitě výsledku i úspěchu na konferenci Excel@FIT navrhuji hodnocení výborně (A).
| Kritérium | Známka | Body | Slovní hodnocení |
|---|---|---|---|
| Informace k zadání | Cílem této bakalářské práce bylo vytvoření vyhledávacího nástroje v rámci nestrukturovaných textových dat s využitím jazykových modelů a vektorových databází. Uživatel dotazy zadává v přirozeném jazyce a odpovědi jsou tvořeny jazykovým modelem. Jde o komplexní a kvalitní řešení, které je využitelné v praxi pro libovolná textová data. | ||
| Práce s literaturou | Vše potřebné pro řešení si student obstaral samostatně, práce s literaturou je dle mého názoru bezproblémová. | ||
| Aktivita během řešení, konzultace, komunikace | Šlo o vlastní zadání studenta, na kterém pracoval student především samostatně, několik konzultací však proběhlo a byl jsem tak informován o pokrocích v řešení. | ||
| Aktivita při dokončování | Práce byla dokončena s předstihem a vše bylo konzultováno před odevzdáním. | ||
| Publikační činnost, ocenění | Student prezenoval řešení na konferenci Excel@FIT ve formě posteru a získal ocenění od průmyslových partnerů. |
V rámci řešení bakalářské práce se student věnoval aktuálnímu a žádanému tématu vyhledávání dokumentů s využitím AI. Předloženou bakalářskou práci považuji za nadstandardní z hlediska realizačního výstupu i textové zprávy. Proto navrhuji hodnocení stupněm A.
| Kritérium | Známka | Body | Slovní hodnocení |
|---|---|---|---|
| Náročnost zadání | Náročnost zadání spatřuji v nutnosti zorientovat se v možnostech mnoha nástrojů pro práci s textem a v jejich kombinaci do jednoho funkčního celku. | ||
| Rozsah splnění požadavků zadání | |||
| Rozsah technické zprávy | |||
| Prezentační úroveň technické zprávy | 93 | Prezentační úroveň technické zprávy je velmi dobrá. Jednotlivé kapitoly na sebe dobře navazují a text je dobře pochopitelný pro čtenáře. Studentovi se podařilo velmi výstižně popsat vytvořený systém, který je poměrně komplexní. | |
| Formální úprava technické zprávy | 95 | Předložená práce obsahuje pouze velmi málo drobných překlepů a považuji ji za nadstandardní z jazykového i typografického pohledu. | |
| Práce s literaturou | 88 | Výběr studijních pramenů je dobrý. Student využil pro řešení práce relevantní zdroje a převzaté prvky jsou řádně odlišeny od vlastních výsledků a úvah. Drobnou výhradu mám k tomu, že seznam literatury obsahuje cca 10 zdrojů, které představují dokumentaci k použitým nástrojům. | |
| Realizační výstup | 99 | Realizačním výstupem této práce je plně funkční systém pro zpracování a vyhledávání dokumentů s využitím vektorové databáze a jazykových modelů. Nástroj dovoluje pracovat s textovými dokumenty v různém formátu. Za nadstandardní považuji to, kolik různých nástrojů student spojil do jednoho funkčního celku (nástroje pro extrakci textu, jeho předzpracování, embedding textu, využití databáze umožňující vektorové i fulltextové vyhledávání, využití jazykových modelů pro transformaci dotazu, určení relevance nalezených částí dokumentů a vytvoření finální odpovědi systému). Systém také umožňuje pracovat s historií dotazů a filtrovat odpovědi na základě metadat (např. přístupových práv). Student také provedl řadu experimentů pro určení vhodných parametrů systému a systém řádně otestoval. | |
| Využitelnost výsledků | Jedná se o práci kompilačního charakteru - student využil dostupné technologie, které sestavil do jednoho funkčního systému. Výsledkem je funkční lokální systém. Nasazení v praxi by patrně vyžadovalo jisté úpravy. |
eVSKP id 163475