Automatické rozpoznávání hudebního zápisu pomocí neuronových sítí

but.committeeprof. Dr. Ing. Pavel Zemčík, dr. h. c. (předseda) doc. Ing. Lukáš Burget, Ph.D. (člen) doc. Ing. Petr Matoušek, Ph.D., M.A. (člen) doc. Mgr. Lukáš Holík, Ph.D. (člen) Ing. Tomáš Martínek, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorHradiš, Michalcs
dc.contributor.authorVlach, Vojtěchcs
dc.contributor.refereeKohút, Jancs
dc.date.accessioned2023-07-17T08:03:56Z
dc.date.available2023-07-17T08:03:56Z
dc.date.created2023cs
dc.description.abstractTato práce řeší problém rozpoznání hudebních zápisů z obrázku do textové podoby pomocí umělé inteligence a neuronových sítí. Zaměřuje se konkrétně na tištěnou polyfonní hudbu (více not a hlasů naráz). Cílem práce je vytvořit model schopný rozpoznat složité zápisy a jeho úspěšnost porovnat s předchozí literaturou a známými modely. Zvolený problém jsem vyřešil díky využití architektury Vision-transformer, kde jsem testoval několik variant sítě za účelem nalezení té nejvýkonější, a vytvoření nového datasetu s polyfonní hudbou. Práce představuje proces vytvoření datasetu pomocí syntetizování obrázků z formátu MusicXML programem MuseScore. Nejúspěšnější varianta architektury Vision-Transformer dosahuje minimální chybovosti pouze 7,86 %, což je velmi slibné pro další vývoj a využití. Hlavním zjištěním je, že architektura má potenciál dominovat na tomto poli stejně jako na jiných polích výzkumu a pro konkrétní úlohu rozpoznání polyfonních hudebních zápisů existuje funkční řešení, což bylo doteď předmětem debaty.cs
dc.description.abstractThis thesis consideres the problem of optical music recognition from images to text using Artificial inteligence and neural networks. I have choosed particularly the field of printed polyphonic music (more notes and voices at the same time). The goal of this thesis is to create a model capable of recognising complex notations and its accuracy compare with previous literature and other known models. I solved the chosen problem by utilizing the Vision Transformer architecture, where I tested several network variants to find the most powerful one. And by creating a new dataset with polyphonic music. The work presents the process of creating the dataset by synthesizing images from MusicXML format using the MuseScore program. The most successful variant of the Vision Transformer architecture achieves an error rate of only 7.86 %, which is very promising for further development and utilization. The main finding is that the architecture has the potential to dominate in this field, just as it does in other areas of research, and there is a functional solution for the specific task of polyphonic music notation recognition, which has been only up for a debate until now.en
dc.description.markBcs
dc.identifier.citationVLACH, V. Automatické rozpoznávání hudebního zápisu pomocí neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.cs
dc.identifier.other146120cs
dc.identifier.urihttp://hdl.handle.net/11012/211088
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectPočítačové viděnícs
dc.subjectneuronové sítěcs
dc.subjecttransformercs
dc.subjectrozpoznání hudebních zápisůcs
dc.subjectOMRcs
dc.subjectpolyfonní hudbacs
dc.subjectpříprava trénovacích datcs
dc.subjectComputer visionen
dc.subjectneural networksen
dc.subjecttransformeren
dc.subjectoptical music recognitionen
dc.subjectOMRen
dc.subjectpolyphonic musicen
dc.subjectpreparation of training dataen
dc.titleAutomatické rozpoznávání hudebního zápisu pomocí neuronových sítícs
dc.title.alternativeNeural Networks for Optical Music Recognitionen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2023-06-12cs
dcterms.modified2023-06-12-17:00:56cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid146120en
sync.item.dbtypeZPen
sync.item.insts2023.07.17 10:03:56en
sync.item.modts2023.07.17 09:47:11en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
2.27 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_146120.html
Size:
9.73 KB
Format:
Hypertext Markup Language
Description:
review_146120.html
Collections