Detekce přednahraných úseků v řeči

but.committeeprof. Dr. Ing. Jan Černocký (předseda) doc. Ing. Jiří Jaroš, Ph.D. (místopředseda) doc. RNDr. Milan Češka, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: There is diarization mentioned in the conclusion as the possible way of solving this issue. Can you name positive and negative aspects of this approach? You run the experiments on the simulated data. Can you guess the performance on the real data. Did you try to run it on few real recordings? Jak probíhá detekce u neznámých nahrávek?cs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorČernocký, Janen
dc.contributor.authorBoboš, Dominiken
dc.contributor.refereeMatějka, Pavelen
dc.date.created2021cs
dc.description.abstractRozpoznání před-nahraných zpráv v řeči (tzv. plechové huby) je užitečné pro jakékoliv následující dolování informací v řečových datech. Tato práce shrnuje teorii hledání podobných promluv v řeči a efektivní přístupy k porovnání dvou sekvencí. Ke zkoumání identifikace opakujících se informací v audiu je nutné mít velké množství dat s přesně se opakujícími úseky. Takovou datovou sadu jsme vygenerovali smícháním předem nahraných zpráv s telefonními hovory se změnami rychlosti, hlasitosti a opakování. Náš systém řeší scénáře "známých zpráv a "neznámých zpráv pomocí shlukování nebo detekce v blocích. Porovnali jsme techniky dynamického borcení času (DTW), přibližné shody řetězců a rekurentní kvantifikační analýzy, a nakonec jsme všechny uvedené techniky zkombinovali a získali tak přesný a efektivně pracující systém.en
dc.description.abstractRecognition of pre-recorded messages in speech is useful for any follow-up speech data mining. This thesis summarises the theory of searching similar utterances in speech and efficient approaches to compare two sequences. To investigate identification of redundant information in audio, it is necessary to have a large amount of data with the exact phrases repeated multiple times. We generated a dataset by mixing pre-recorded messages into phone calls with variations in speed, volume and repetitions. Our system tackles known messages and unknown messages'' scenarios by using approaches like clustering or detection in chunks. Dynamic time warping, approximate string matching and recurrent quantification analysis are compared, and finally, all mentioned techniques are combined to obtain a precise and efficient system.cs
dc.description.markAcs
dc.identifier.citationBOBOŠ, D. Detekce přednahraných úseků v řeči [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2021.cs
dc.identifier.other136420cs
dc.identifier.urihttp://hdl.handle.net/11012/198907
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectdetekce opakujících se sekvencí v nahrávkáchen
dc.subjectsegmentální dynamické borcení časuen
dc.subjectanalýza rekurentní kvantifikaceen
dc.subjectpřibližná shoda řetězcůen
dc.subjectbottleneck příznakyen
dc.subjectfonémové pravděpodobnostien
dc.subjectpříznaky Mel-frekvenčních kepstrálních koeficientůen
dc.subjectdetection of re-occurring sequences in audiocs
dc.subjectsegmental dynamic time warpingcs
dc.subjectrecurrence quantification analysiscs
dc.subjectfuzzy string matchingcs
dc.subjectbottleneck featurescs
dc.subjectphoneme posteriorscs
dc.subjectMel-frequency cepstral coefficients featurescs
dc.titleDetekce přednahraných úseků v řečien
dc.title.alternativeDetection of Pre-Recorded Messages in Speechcs
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2021-06-16cs
dcterms.modified2021-08-27-17:16:45cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid136420en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 19:33:40en
sync.item.modts2025.01.15 20:10:59en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
3.13 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-22504_v.pdf
Size:
86.17 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-22504_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-22504_o.pdf
Size:
86.79 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-22504_o.pdf
Loading...
Thumbnail Image
Name:
review_136420.html
Size:
1.43 KB
Format:
Hypertext Markup Language
Description:
file review_136420.html
Collections