Inteligentní nástroj pro obsahovou analýzu specifické audiovizuální tvorby
Loading...
Date
Authors
Advisor
Referee
Mark
P
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
ORCID
Abstract
Tato disertační práce se zabývá vývojem inteligentního nástroje pro analýzu obsahu specifické audiovizuální tvorby s využitím moderních metod umělé inteligence. Práce reaguje na rostoucí potřebu kvalitní automatizované analýzy uměleckých audiovizuálních děl, jejichž specifické prvky činí běžné analytické postupy nedostatečnými a časově náročnými. Hlavním cílem je návrh robustní klasifikační metodiky pro vizuální a zvukový obsah, a realizace interaktivního webového nástroje pro efektivní analýzu bibliografických a obsahových dat pro uměnovědce. Práce dále zahrnuje vytvoření detailně anotované datové sady se speciálně definovanými kategoriemi pro trénink a validaci pokročilých CNN modelů. Experimentální část práce ověřuje účinnost předtrénovaného modelu CNN a modelů VGG, Inception ResNet, Xception a NASNet trénovaných speciálně na vytvořené datové sadě. Pro audio analýzu byly trénovány modely CNN 14, ResNet a Wavegram-Logmel-CNN. Výsledky ukazují přesnost, jež potvrzuje vhodnost zvolených metod pro daný typ dat. Dalším výsledkem práce je komplexní, uživatelský přívětivý webový nástroj umožňující interaktivní zkoumání audiovizuálních dat, jakož i rozhraní pro detailní tvorbu datové sady.
This doctoral thesis focuses on developing an intelligent tool for analysing the content of specific audiovisual production by means of modern artificial intelligence techniques. It answers the growing demand for high-quality automated analysis of artistic audiovisual pieces whose distinctive features render conventional analytic procedures inadequate and time-consuming. The primary objective is to design a robust classification methodology for both visual and audio content and to implement an interactive web-based application that allows art historians to examine bibliographic and content data efficiently. The study also introduces a thoroughly annotated data set with specially defined categories for training and validating advanced CNN models. The experimental section evaluates the performance of a pre-trained CNN together with VGG, Inception, Xception and NASNet architectures fine-tuned on the curated data set. For audio analysis, CNN 14, ResNet and Wavegram networks are employed. The results verify the suitability of the chosen methods for the data under investigation. Finally, the work delivers a comprehensive, user-friendly tool that supports interactive exploration of audiovisual material and provides a dedicated interface for detailed data set construction.
This doctoral thesis focuses on developing an intelligent tool for analysing the content of specific audiovisual production by means of modern artificial intelligence techniques. It answers the growing demand for high-quality automated analysis of artistic audiovisual pieces whose distinctive features render conventional analytic procedures inadequate and time-consuming. The primary objective is to design a robust classification methodology for both visual and audio content and to implement an interactive web-based application that allows art historians to examine bibliographic and content data efficiently. The study also introduces a thoroughly annotated data set with specially defined categories for training and validating advanced CNN models. The experimental section evaluates the performance of a pre-trained CNN together with VGG, Inception, Xception and NASNet architectures fine-tuned on the curated data set. For audio analysis, CNN 14, ResNet and Wavegram networks are employed. The results verify the suitability of the chosen methods for the data under investigation. Finally, the work delivers a comprehensive, user-friendly tool that supports interactive exploration of audiovisual material and provides a dedicated interface for detailed data set construction.
Description
Keywords
Citation
SIKORA, P. Inteligentní nástroj pro obsahovou analýzu specifické audiovizuální tvorby [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2026.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
bez specializace
Comittee
prof. Ing. Zdeněk Smékal, CSc. (předseda)
prof. Ing. Ivan Baroňák, Ph.D. (člen)
prof. Ing. Radim Burget, Ph.D. (člen)
doc. Mgr. Jana Horáková, Ph.D. (člen)
doc. Ing. Jiří Schimmel, Ph.D. (člen)
doc. Ing. Rastislav Róka, Ph.D. (člen)
doc. PhDr. Martin Flašar, Ph.D. (člen)
Date of acceptance
2026-01-13
Defence
Disertant seznámil komisi s výsledky své vědecké práce. Rozvinula se široká diskuze, po které byli oponenti i členové komise spokojeni s odpověďmi.
Result of defence
práce byla úspěšně obhájena
