Zlepšování kvality digitalizovaných textových dokumentů

but.committeedoc. Mgr. Adam Rogalewicz, Ph.D. (předseda) doc. Ing. Lukáš Burget, Ph.D. (místopředseda) doc. Ing. Michal Bidlo, Ph.D. (člen) Ing. Michal Hradiš, Ph.D. (člen) Ing. Martin Hrubý, Ph.D. (člen) Ing. Jaroslav Rozman, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D. Otázky u obhajoby: Jaké kritérium "přesnosti" používáte pro kvalitu výstupu systému "zlepšování kvality digitalizovaných textových dokumentů". Je to odlišnost od "ground truth" obrazu? Čitelnost textů prostřednictvím OCR třetích stran? Nebo je to skutečně přepis (čtení) dokumentů? Kterého výsledku práce si ceníte nejvíce, respektive který považujete za nejslibnější z pohledu možného nasazení? Jak se Vaše výsledky srovnávají s výsledky jiných systémů pro přepis textů? Jak se podařilo vylepšit texty, aby se případně dále dařilo je lépe využít? Použil jste pro zpracování obrazu nějaké knihovny? Jaká je výpočetní náročnost vašeho řešení? Používá vaše práce diakritiku? Máte představu, jak by probíhalo trénování na reálných datech?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorJuránek, Romancs
dc.contributor.authorTrčka, Jancs
dc.contributor.refereeZemčík, Pavelcs
dc.date.created2020cs
dc.description.abstractCílem této práce je zvýšení úspěšnosti při rozpoznávání textových dokumentů. Práce je zaměřena především na texty nacházející se na degradovaném materiálu jako jsou noviny nebo staré knihy. K řešení tohoto problému jsou analyzovány současné metody a problémy spojené s rozpoznáváním textu. Na základě získaných poznatků je zvolena implementovaná metoda založena na GAN sítích. Na těchto sítích jsou provedeny experimenty pro nalezení jejich vhodné velikosti a parametrů učení. Následně je provedeno testování pro porovnání různých metod učení a srovnání jejich výsledků. Trénování a testování je provedeno na umělém datovém setu, u kterého se zvýší přesnost přepisu z 65.61 % pro nezpracované řádky textu na 93.23 % u řádků zpracovaných sítí GAN.cs
dc.description.abstractThe aim of this work is to increase the accuracy of the transcription of text documents. This work is mainly focused on texts printed on degraded materials such as newspapers or old books. To solve this problem, the current method and problems associated with text recognition are analyzed. Based on the acquired knowledge, the implemented method based on GAN network architecture is chosen. Experiments are a performer on these networks in order to find their appropriate size and their learning parameters. Subsequently, testing is performed to compare different learning methods and compare their results. Both training and testing is a performer on an artificial data set. Using implemented trained networks increases the transcription accuracy from 65.61 % for the raw damaged text lines to 93.23 % for lines processed by this network.en
dc.description.markDcs
dc.identifier.citationTRČKA, J. Zlepšování kvality digitalizovaných textových dokumentů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2020.cs
dc.identifier.other129327cs
dc.identifier.urihttp://hdl.handle.net/11012/192507
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectNeuronové sítěcs
dc.subjecthluboké neuronové sítěcs
dc.subjectkonvoluční neuronové sítěcs
dc.subjectGAN sítěcs
dc.subjectTensorFlowcs
dc.subjectzlepšování kvality obrazucs
dc.subjectNeural networksen
dc.subjectdeep neural networksen
dc.subjectconvolution neural networksen
dc.subjectGAN networksen
dc.subjectTensorFlowen
dc.subjectimage quality enhancementen
dc.titleZlepšování kvality digitalizovaných textových dokumentůcs
dc.title.alternativeDocument Quality Enhancementen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2020-07-14cs
dcterms.modified2020-07-17-14:40:14cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid129327en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 15:31:49en
sync.item.modts2025.01.17 10:29:32en
thesis.disciplineInteligentní systémycs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
14.36 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-23086_v.pdf
Size:
85.83 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-23086_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-23086_o.pdf
Size:
88.85 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-23086_o.pdf
Loading...
Thumbnail Image
Name:
review_129327.html
Size:
1.45 KB
Format:
Hypertext Markup Language
Description:
file review_129327.html
Collections