Syntéza zvuku z video dat

but.committeeDoc.Ing.MgA. Ondřej Urban, Ph.D. (předseda) doc. Ing. Kamil Říha, Ph.D. (místopředseda) Ing. František Rund, Ph.D. (člen) MgA. et Mgr. Ondřej Jirásek, Ph.D. (člen) Mgr. Tomáš Staudek, Ph.D. (člen) Ing. Štěpán Miklánek, Ph.D. (člen) MgA. Jan Kavan, Ph.D. (člen)cs
but.defenceStudent prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil diplomovou práci. Student odpověděl na otázky členů komise a oponenta: Popište rozdíl mezi formáty RGB, HSV, HSL a YCbCr a uveďte, jaký mohou mít tyto formáty vliv na syntézu zvuku. Jaký je rozdíl mezi diskrétní kosinovou transformací a diskrétní vlnkovou transformací s diskrétním časem a jak jsou využitelné pro syntézu zvuku. Uveďte několik aplikací, kde se Vámi navržené metody syntézy mohou uplatnit. Jaký je rozdíl mezi stupnicí a tóninou, co z této dvojice využíváte?cs
but.jazykslovenština (Slovak)
but.programAudio inženýrstvícs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorŘíha, Kamilsk
dc.contributor.authorLazorčák, Danielsk
dc.contributor.refereeSmékal, Zdeněksk
dc.date.created2023cs
dc.description.abstractV tejto diplomovej práci je vyhotovená rešerš metód syntézy zvuku z obrazových a video dát na dáta zvukové a relizovaná je implementácia troch nových metód syntézy. Prvá časť práce poskytuje prehľad o existujúcich prístupoch k tvorbe zvuku z obrazu, identifikuje ich výhody, obmedzenia a prípadné možnosti rozšírenia. V druhej časti je popísaná implementácia aplikácie Vsyntha, ktorá syntetizuje zvuk z videa v reálnom čase s možnosťou ovládania hudobných parametrov. V tretej časti je opísaná aplikácia ReAmper, ktorá ozvučuje scény pomocou zvukových objektov a hudobných tónov na základe detekcie a sledovania objektov v obraze. Vo štvrtej časti je popísaná aplikácia SegMentor, ktorá vytvára MIDI súbory z videa pomocou rôznych techník segmentácie obrazu. Implementované metódy poskytujú nové nástroje pre tvorbu zvuku a multimediálnych diel, otvárajú priestor pre ďalší výskum a vývoj v oblasti syntézy zvuku z obrazu a poskytujú užitočné nástroje pre tvorbu zvukového obsahu a interakciu s vizuálnymi dátami vo forme zvuku. Výsledky tejto práce poskytujú prehľad o súčasnom stave výskumu a praxe v tejto oblasti a ponúkajú možnosti pre ďalší rozvoj a aplikácie v praxi.sk
dc.description.abstractIn this thesis, a survey of audio synthesis methods from image and video data to audio data is performed and the implementation of three new synthesis methods is reviewed. The first part of the thesis provides an overview of existing approaches to sound from image, identifying their advantages, limitations and possible extensions. The second part describes the implementation of VSyntha, an application that synthesizes audio from video in real-time with the ability to control musical parameters. The third section describes the ReAmper application, which performs soundscaping using sound objects and musical cues based on the detection and tracking of objects in the image. The fourth section describes the SegMentor application, which creates MIDI files from video using various image segmentation techniques. The implemented methods provide new tools for the creation of audio and multimedia works, open the way for further research and development in the field of sound-from-image synthesis, and provide useful tools for creating audio content and interacting with visual data in the form of audio. The results of this work provide an overview of the current state of research and practice in this area and offer opportunities for further development and applications in practice.en
dc.description.markAcs
dc.identifier.citationLAZORČÁK, D. Syntéza zvuku z video dat [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2023.cs
dc.identifier.other144196cs
dc.identifier.urihttp://hdl.handle.net/11012/210200
dc.language.isoskcs
dc.publisherVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectaplikáciesk
dc.subjectdetekcia objektovsk
dc.subjectmapovanie dátsk
dc.subjectmetódy syntézysk
dc.subjectMIDIsk
dc.subjectobrazové dátask
dc.subjectozvučovanie scénysk
dc.subjectpythonsk
dc.subjectsegmentácia obrazusk
dc.subjectsledovanie objektovsk
dc.subjectsyntéza zvukusk
dc.subjectvideo dátask
dc.subjectapplicationsen
dc.subjectaudio synthesisen
dc.subjectdata mappingen
dc.subjectimage dataen
dc.subjectimage segmentationen
dc.subjectMIDIen
dc.subjectobject detectionen
dc.subjectobject trackingen
dc.subjectpythonen
dc.subjectsoundscapingen
dc.subjectsynthesis methodsen
dc.subjectvideo dataen
dc.titleSyntéza zvuku z video datsk
dc.title.alternativeSynthesis of Sound from Videoen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2023-06-08cs
dcterms.modified2024-05-17-12:51:02cs
eprints.affiliatedInstitution.facultyFakulta elektrotechniky a komunikačních technologiícs
sync.item.dbid144196en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 14:40:36en
sync.item.modts2025.01.17 14:33:14en
thesis.disciplineZvuková produkce a nahrávánícs
thesis.grantorVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav telekomunikacícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
15.41 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
appendix-1.zip
Size:
1.62 MB
Format:
zip
Description:
appendix-1.zip
Loading...
Thumbnail Image
Name:
review_144196.html
Size:
3.53 KB
Format:
Hypertext Markup Language
Description:
file review_144196.html
Collections