Klasifikace typů stran dokumentu

but.committeeprof. Ing. Adam Herout, Ph.D. (předseda) Ing. Vladimír Bartík, Ph.D. (člen) Ing. Michal Hradiš, Ph.D. (člen) Ing. Josef Strnadel, Ph.D. (člen) doc. Mgr. Adam Rogalewicz, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorKohút, Jancs
dc.contributor.authorŠmida, Matějcs
dc.contributor.refereeBeran, Vítězslavcs
dc.date.created2025cs
dc.description.abstractTato diplomová práce se zabývá se zabývá problémem automatické klasifikace stran v dokumentech, což je jeden z klíčových bodů v oblasti analýzy a zpracování dokumentů, jako je extrakce informací nebo digitální archivace. Práce se zaměřuje na metody hlubokého učení a zejména na architektury založené na vizuálních transformerech, jako je Vision Transformer (ViT model). Speciální pozornost je věnována multimodálnímu přístupu, který kombinuje vizuální informace z obrazu a extrahovaná textová data dokumentu a modelu CLIP, který jsem upravil pro klasifikaci a experimentoval s ním.cs
dc.description.abstractThis thesis deals with the problem of automatic classification of pages in documents, which is one of the key issues in document analysis and processing, such as information extraction or digital archiving. The thesis focuses on deep learning methods and in particular on architectures based on visual transformers, such as the Vision Transformer (ViT model). Special attention is paid to a multimodal approach that combines visual information from an image and extracted text data from a document, and to the CLIP model that I have adapted for classification and experimented with.en
dc.description.markBcs
dc.identifier.citationŠMIDA, M. Klasifikace typů stran dokumentu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.cs
dc.identifier.other164607cs
dc.identifier.urihttp://hdl.handle.net/11012/252812
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectklasifikace dokumentucs
dc.subjectzpracování obrazucs
dc.subjectanalýza dokumentůcs
dc.subjectpočítačové viděnícs
dc.subjectstrojové učenícs
dc.subjectVision Transformer (ViT)cs
dc.subjectCLIP (Contrastive Language–Image Pre-training)cs
dc.subjectmultimodální učenícs
dc.subjectdocument classificationen
dc.subjectimage processingen
dc.subjectdocument analysisen
dc.subjectcomputer visionen
dc.subjectmachine learningen
dc.subjectVision Transformer (ViT)en
dc.subjectCLIP (Contrastive Language–Image Pre-training)en
dc.subjectmultimodal learningen
dc.titleKlasifikace typů stran dokumentucs
dc.title.alternativeDocument Page Type Classificationen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2025-06-16cs
dcterms.modified2025-06-16-15:20:04cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid164607en
sync.item.dbtypeZPen
sync.item.insts2025.08.26 23:03:55en
sync.item.modts2025.08.26 19:47:49en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs

Files

Original bundle

Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
12.75 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_164607.html
Size:
11.16 KB
Format:
Hypertext Markup Language
Description:
file review_164607.html

Collections