PEŘINOVÁ, B. Rozpoznání textu s využitím neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2018.

Posudky

Posudek vedoucího

Mézl, Martin

Studentka Barbora Peřinová vypracovala diplomovou práci na téma Rozpoznání textu s využitím neuronových sítí. V rámci teoretické práce je popsán celý proces rozpoznání textu od předzpracování obrazu, parcelace na jednotlivé znaky, využití neuronových sítí včetně sítí konvolučních a následný postprocessing. V praktické části studentka realizovala celý proces rozpoznání znaků včetně všech dílčích částí. Jednotlivé části práce jsou podrobně popsány včetně různých variant testování. Zvolená implementace konvoluční neuronové sítě je pro danou aplikaci vhodná a dosahuje velmi dobrých výsledků. Metody byly pilotně realizovány v prostředí Matlab, potom byly v souladu se zadáním práce implementovány do prostředí .NET Framework. Díky použití jazykového a kontextového je výsledná úspěšnost na různých zařízeních pro definovanou aplikaci dostačující. Autorčina implementace byla dále srovnána s dostupnou metodou Tesseract. Studentka pracovala samostatně a konzultovala dílčí části práce, protože diplomová práce byla řešena ve spolupráci s firmou Y Soft Corporation. Po formální stránce nemám k práci větších výtek. Práci považuji za aplikačně zaměřenou a díky použití konvolučních neuronových sítí za vysoce aktuální. Zadání práce je splněné v celém rozsahu, práci doporučuji k obhajobě a hodnotím známkou výborně (A – 94 bodů).

Navrhovaná známka
A
Body
94

Posudek oponenta

Hesko, Branislav

Diplomová práca študentky Peřinovej sa zaoberá rozpoznávaním textu s využitím konvolučných neurónových sietí. Práca je napísaná na 70 stranách, kde teória zaberá 26 strán. Po formálnej stránke mám iba drobné výhrady voči anglickým popiskám obrázkov a zbytočnému pridávaniu odkazov jednotlivých citovaných článkov, keď už v zázname sa vyskytuje DOI identifikátor. V teoretickej časti by som uvítal teoretický popis algoritmu Tesseract, ktorého úspešnosť je porovnávaná. Z riešenia nie je zrejmé, či autorka využila novú LSTM verziu daného algoritmu. Zároveň by som uvítal prítomnosť teoretickej rešerše na tému segmentácie znakov, ktorá je zrejme jedna z kľúčových častí algoritmu. V praktickej časti je popísaný algoritmus, ktorý najprv segmentuje a následne klasifikuje jednotlivé písmená textu. Oceňujem vytvorenie dostatočne veľkej databázy pre trénovanie neurónovej siete. Keďže musela byť z dôvodov kompatibility použitá knižnica využívajúca grafickú kartu, bolo by zaujímavé využiť aj komplikovanejšiu architektúru pre porovnanie, aj napriek tomu je však úspešnosť rozpoznania postačujúca. Výsledky ukazujú, že navrhnuté riešenie môže plne konkurovať v súčasnosti využívaným algoritmov pretože sa ukázalo, že pre danú aplikáciu sú výsledky lepšie ako s použitím Tesseract algoritmu. Záverom je potrebné poznamenať, že zadanie bolo splnené vo všetkých bodoch a s ohľadom na uvedené výhrady navrhujem hodnotenie A/91 bodov.

Navrhovaná známka
A
Body
91

Otázky

eVSKP id 110557