KOSTELNÍK, M. Dělení textu do logických celků [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.
Jedná se o excelentní diplomovou práci, kde se student vypořádal s aplikací strojového učení na praktický problém po celé vertikále: Od definice problému, přes organizaci sběru dat a tvorbu jednoduchých výchozích systémů až po iterativní vylepšování finálního řešení. Všechny kroky byly provedeny přinejmenším solidně, některé (jmenovitě sběr dat a finální řešení) výtečně. Výsledný produkt funguje a zcela konkrétně posunul řešení výzkumného projektu na fakultě. Práci doporučuji k reprezentaci na fakulty na soutěžích typu IT SPY.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Informace k zadání | Zadání práce vyžaduje aplikaci strojového učení na praktický problém, který je ve své základní podobě studován v literatuře. Na druhé straně je zadání součástí běžícího výzkumného projektu na FITu, kde je nutno segmenovat snímky podstatně náročnějších dat. Zadání považuji za výborně splněné, student se nespokojil s jednoduchým přístupem k členění stránek, ale navrhl poměrně komplexní, leč účelné, řešení. | ||
Práce s literaturou | Řešitel byl při studiu literatury samostatný a prakticky od počátku řešení se dopouštěl kritického přístupu ke statu quo. Dle mého soudu dosáhl velmi dobrého porozumění studované látky. | ||
Aktivita během řešení, konzultace, komunikace | Student byl při řešení samostaný, k práci přistupoval proaktivně a přicházel konzultovat konkrétní pokroky a potíže. Nadstandardní je, že v rámci své diplomové práce sám organizoval anotování datové sady dalšími spoluřešiteli výzkumného projektu, dokonce z jiné instituce (Moravské zemské knihovny). | ||
Aktivita při dokončování | Student dokončil práci v dobrém předstihu a dokončování textu si naplánoval těsně, ale uvědoměle; vzhledem k dobrému stavu prvních návrhů textu byla konečná podoba technické zprávy dostatečně komentována vedoucím a poznámky byly uspokojivě zapracovány nebo se zdůvodněním odmítnuty. | ||
Publikační činnost, ocenění | Práce byla prezentována na konferenci Excel@FIT 2024, kde zcela po zásluze získala ocenění odborné poroty i průmyslových partnerů. Výsledný software je publikován formou open-source. Zároveň je využíván v běžícím NAKI projektu semANT; zatím interně, ale s postupem projektu lze očekávat otevřenou množinu uživatelů z řad historiků a dalších, kteří používají knihovní data pro další výzkum. |
Celkově se jedná o velmi dobrou práci, které lze vytknout drobné nedostatky ve formální úpravě technické zprávy a lepší použití zdrojů v textu. Výstupy práce jsou použity v rámci výzkumného projektu semANT. Student se s prací zúčastnil studentské konference Excel@FIT, kde za ni získal ocenění. Navrhuji práci zařadit do soutěže IT SPY, případně na ocenění.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Náročnost zadání | Jedná se o obtížnější zadání, které pracuje se state-of-the-art přístupy strojového učení. Konkrétně kombinuje neuronové sítě pro detekci objektů a grafové neuronové sítě pro určení vztahů mezi těmito objekty. | ||
Rozsah splnění požadavků zadání | |||
Rozsah technické zprávy | Technická zpráva je v obvyklém rozsahu. | ||
Prezentační úroveň technické zprávy | 100 | Technická zpráva je dobře členěna, jednotlivé části na sebe dobře navazují a text je tak dobře čitelný i pochopitelný. | |
Formální úprava technické zprávy | 90 | Formální úroveň práce je na dobré úrovni. Výhradu mám k umístění obrázků, které jsou uprostřed stránky, a přetékajícím tabulkám v kapitole s experimenty. Práce je psána anglicky a je velmi dobře čitelná. | |
Práce s literaturou | 90 | Práce cituje celkem 40 zdrojů z nichž téměř všechny jsou vědecké články. Výtku mám ke kapitole 2, kde je popsáno současné poznání o neuronových sítích. Při popisu konolučních a grafových neuronových sítích jsou v obou případech citovány přehledové články, což není vyloženě špatně, ale vhodnější by bylo citovat konkrétní vědecké práce. | |
Realizační výstup | 100 | Odevzdané zdrojové kód jsou přehledné, vhodně strukturované a dá se v nich dobře zorientovat. | |
Využitelnost výsledků | Práce přináší nové poznatky a výsledky v oblasti analýzy dokumentů s poměrně dobrým využitím, především v rámci výzkumného projektu semANT, jehož je práce součástí. |
eVSKP id 155569