Separace nástrojů a zpěvu z hudební nahrávky

but.committeeprof. Dr. Ing. Jan Černocký (předseda) doc. Ing. Zdeněk Vašíček, Ph.D. (člen) Ing. Václav Šátek, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen) Ing. Vladimír Bartík, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.cs
but.jazykslovenština (Slovak)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorMošner, Ladislavsk
dc.contributor.authorHolík, Viliamsk
dc.contributor.refereeVeselý, Karelsk
dc.date.created2023cs
dc.description.abstractNa separáciu zdrojov z hudobných nahrávok sa používajú neurónové siete. Jednou z takýchto sietí je Conv-TasNet. Cieľom práce je experimentovať s už existujúcou implementáciou tejto siete za účelom potenciálneho zlepšenia. Trénovanie modelov prebiehalo na dátovej sade MUSDB18. Postupne sa experimentovalo so zmenou štruktúry siete, transformáciou signálov z časovej domény do frekvenčnej pre účely počítania objektívnej funkcie, zámenou rôznych objektívnych funkcií za pôvodnú, hľadaním optimálneho koeficientu rýchlosti učenia pre každú objektívnu funkciu a jeho postupným zmenšovaním v priebehu učenia. Ako najlepšie experimenty podla metriky SDR vyšli trénovania s objektívnymi funkciami L1 a logaritmickou L2 v časovej doméne pri vyššom počiatočnom koeficiente rýchlosti učenia s jeho postupným zmenšovaním v priebehu učenia. V relatívnom porovnaní najlepších modelov oproti východziemu ide o viac ako 2,5% zlepšenie.sk
dc.description.abstractNeural networks are used for the problem of music source separation from recordings. One such network is Conv-TasNet. The aim of the work is to experiment with the already existing implementation of this network for the purpose of potential improvement. The models were trained on the MUSDB18 dataset. It was successively experimented with the change of the network structure, transforming signals from the time domain to the frequency domain for the purpose of calculating the loss function, replacing different loss functions with the original one, finding the optimal learning rate for each loss function and gradually decreasing the learning rate during the learning process. The best experiments according to the SDR metric were training with loss functions L1 and logarithmic L2 in the time domain with a higher initial learning rate with its gradual decrease during the learning process. In a relative comparison of the best models to the baseline, it is more than 2.5% improvement.en
dc.description.markCcs
dc.identifier.citationHOLÍK, V. Separace nástrojů a zpěvu z hudební nahrávky [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.cs
dc.identifier.other147883cs
dc.identifier.urihttp://hdl.handle.net/11012/211139
dc.language.isoskcs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectseparácia zdrojov hudbysk
dc.subjectneurónové sietesk
dc.subjectobjektívne funkciesk
dc.subjectL1sk
dc.subjectL2sk
dc.subjectlogaritmická L1sk
dc.subjectlogaritmická L2sk
dc.subjectSI-SDRsk
dc.subjectSDRsk
dc.subjectSIRsk
dc.subjectSARsk
dc.subjectSTFTsk
dc.subjectrýchlosť učeniask
dc.subjectfrekvenčná doménask
dc.subjectčasová doménask
dc.subjectConv-TasNetsk
dc.subjectMUSDB18sk
dc.subjectmusic source separationen
dc.subjectneural networksen
dc.subjectloss functionsen
dc.subjectL1en
dc.subjectL2en
dc.subjectlogarithmic L1en
dc.subjectlogarithmic L2en
dc.subjectSI-SDRen
dc.subjectSDRen
dc.subjectSIRen
dc.subjectSARen
dc.subjectSTFTen
dc.subjectlearning rateen
dc.subjectfrequency domainen
dc.subjecttime domainen
dc.subjectConv-TasNeten
dc.subjectMUSDB18en
dc.titleSeparace nástrojů a zpěvu z hudební nahrávkysk
dc.title.alternativeMusic Source Separationen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2023-06-15cs
dcterms.modified2023-06-15-16:13:22cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid147883en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 20:59:24en
sync.item.modts2025.01.15 23:58:02en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
3.05 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_147883.html
Size:
10.18 KB
Format:
Hypertext Markup Language
Description:
file review_147883.html
Collections