Konvoluční neuronové sítě pro detekci znaků ručně psaného písma

Loading...
Thumbnail Image

Date

Authors

Moučka, Filip

Mark

B

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií

ORCID

Abstract

Bakalářská práce se zabývá problematikou detekce znaků ručně psaného písma. Teoretická část popisuje strojové a hluboké učení, problematiku učení z malého množství dat, počítačové vidění a detekci objektů v obraze. Také je zde obsaženo stručné nahlédnutí do problematiky konvolučních neuronových sítí a transformerů. Praktická část se zaměřuje na návrh, implementaci a následné testování modelů a přístupů k detekci ručně psaného znaku „a“. Je zde testován výkon moderních detektorů YOLOv8, YOLO11, DINO, Faster R-CNN a vlastního navrženého detektoru při využití přeneseného učení a trénování na vlastní vytvořené datové množině s augmentací dat. Sledován je i výkon segmentační modelů YOLOv8-seg, YOLO11-seg a Mask R-CNN. Významnou součástí řešení je i testování dělené inference a vytvoření jednoduché webové platformy pro rychlou a snadnou anotaci daných znaků a trénink modelu s pomocí modifikovaného aktivního učení. Z výsledků práce vyplývá, že nejvhodnějším modelem pro řešený problém je YOLO11m. Také je prokázán pozitivní vliv dělené inference na počet detekovaných znaků a vhodnost kombinace aktivního učení a samoučení při iterativním tréninku modelu.
The bachelor thesis deals with the problem of handwritten character detection. The theoretical part describes machine and deep learning, the problem of learning from small amounts of data, computer vision and object detection in images. It also includes a brief insight into convolutional neural networks and transformers. The practical part focuses on the design, implementation and subsequent testing of models and approaches for detection of the handwritten character "a". The performance of modern detectors YOLOv8, YOLO11, DINO, Faster R-CNN and custom proposed detector is tested using transfer learning and training on a custom created dataset with data augmentations. The testing also includes segmentation models YOLOv8-seg, YOLO11-seg and Mask R-CNN. Another important part of the solution is testing of sliced inference and creation of a simple web platform for fast and easy annotation of given characters and model training using modified active learning. The results of this work show that YOLO11m is the most suitable model for the problem at hand. Also, the positive effect of sliced inference on the number of detected characters and the suitability of the combination of active learning and self-training for iterative model training is demonstrated.

Description

Citation

MOUČKA, F. Konvoluční neuronové sítě pro detekci znaků ručně psaného písma [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

bez specializace

Comittee

doc. Ing. Lukáš Malina, Ph.D. (předseda) JUDr. Pavel Loutocký, BA (Hons), Ph.D. (místopředseda) Ing. Petr Dzurenda, Ph.D. (člen) Ing. Radek Možný, Ph.D. (člen) Ing. Vítězslav Křivánek, Ph.D. (člen) Ing. David Smékal (člen) Ing. Marek Sikora (člen)

Date of acceptance

2025-06-17

Defence

Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil bakalářskou práci a odpověděl na otázky členů komise a oponenta. Otázky oponenta: V práci je uvedeno, že jsou snímky normalizovány na rozlišení 1920 x 1920 px, neboť toto rozlišení se ukázalo jako nejlepší poměr mezi ztrátou obrazové informace a potřebným výkonem pro zpracování daného snímku. O kolik klesne přenost, pokud dojde ke zmenšení rozlišení? Jaký vliv by mělo změnšení rozlišení na rychlost zpracování snímku? Mohla by být přesnost kompenzována větším počtem iterací? - student dostatečně vysvětlil otázku. "Jakou dobu trvá zpracování jednoho dokumentu testovanými modely, tak aby byla nalezena všecha písmena ""a""? " - student dostatečně vysvětlil otázku.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO