Vyhledávání výrazů v řeči pomocí mluvených příkladů

but.committeecs
but.defencecs
but.jazykangličtina (English)
but.programVýpočetní technika a informatikacs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorČernocký, Janen
dc.contributor.authorFapšo, Michalen
dc.contributor.refereeMatoušek, Jindřichen
dc.contributor.refereeMetze, Florianen
dc.date.accessioned2019-04-04T07:21:56Z
dc.date.available2019-04-04T07:21:56Z
dc.date.createdcs
dc.description.abstractTato práce se zabývá vyhledáváním výrazů v řeči pomocí mluvených příkladů (QbE STD). Výrazy jsou zadávány v mluvené podobě a jsou vyhledány v množině řečových nahrávek, výstupem vyhledávání je seznam detekcí s jejich skóre a časováním. V práci popisujeme, analyzujeme a srovnáváme tři různé přístupy ke QbE STD v jazykově závislých a jazykově nezávislých podmínkách, s jedním a pěti příklady na dotaz. Pro naše experimenty jsme použili česká, maďarská, anglická a arabská (levantská) data, a pro každý z těchto jazyků jsme natrénovali 3-stavový fonémový rozpoznávač. To nám dalo 16 možných kombinací jazyka pro vyhodnocení a jazyka na kterém byl natrénovaný rozpoznávač. Čtyři kombinace byly tedy závislé na jazyce (language-dependent) a 12 bylo jazykově nezávislých (language-independent). Všechny QbE systémy byly vyhodnoceny na stejných datech a stejných fonémových posteriorních příznacích, pomocí metrik: nesdružené Figure-of-Merit (non pooled FOM) a námi navrhnuté nesdružené Figure-of-Merit se simulací normalizace přes promluvy (utterrance-normalized non-pooled Figure-of-Merit). Ty nám poskytly relevantní údaje pro porovnání těchto QbE přístupů a pro získání lepšího vhledu do jejich chování. QbE přístupy použité v této práci jsou: sekvenční statistické modelování (GMM/HMM), srovnávání vzorů v příznacích (DTW) a srovnávání grafů hypotéz (WFST). Abychom porovnali výsledky QbE přístupů s běžnými STD systémy vyhledávajícími textové výrazy, vyhodnotili jsme jazykově závislé konfigurace také s akustickým detektorem klíčových slov (AKWS) a systémem pro vyhledávání fonémových řetězců v grafech hypotéz (WFSTlat). Jádrem této práce je vývoj, analýza a zlepšení systému WFST QbE STD, který po zlepšení dosahuje podobných výsledků jako DTW systém v jazykově závislých podmínkách.en
dc.description.abstractThis thesis investigates query-by-example (QbE) spoken term detection (STD). Queries are entered in their spoken form and searched for in a pool of recorded spoken utterances, providing a list of detections with their scores and timing. We describe, analyze and compare three different approaches to QbE STD, in various language-dependent and language-independent setups with diverse audio conditions, searching for a single example and five examples per query. For our experiments we used Czech, Hungarian, English and Levantine data and for each of the languages we trained a 3-state phone posterior estimator. This gave us 16 possible combinations of the evaluation language and the language of the posterior estimator, out of which 4 combinations were language-dependent and 12 were language-independent. All QbE systems were evaluated on the same data and the same features, using the metrics: non-pooled Figure-of-Merit and our proposed utterrance-normalized non-pooled Figure-of-Merit, which provided us with relevant data for the comparison of these QbE approaches and for gaining a better insight into their behavior. QbE approaches presented in this work are: sequential statistical modeling (GMM/HMM), template matching of features (DTW) and matching of phone lattices (WFST). To compare the performance of QbE approaches with the common query-by-text STD systems, for language-dependent setups we also evaluated an acoustic keyword spotting system (AKWS) and a system searching for phone strings in lattices (WFSTlat). The core of this thesis is the development, analysis and improvement of the WFST QbE STD system, which after the improvements, achieved similar performance to the DTW system in language-dependent setups.cs
dc.description.markPcs
dc.identifier.citationFAPŠO, M. Vyhledávání výrazů v řeči pomocí mluvených příkladů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. .cs
dc.identifier.other99805cs
dc.identifier.urihttp://hdl.handle.net/11012/63240
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectvyhledávání podle vzorůen
dc.subjectdetekce mluvených výrazůen
dc.subjectkonečné stavové automatyen
dc.subjectsrovnání systémůen
dc.subjectzávislost na jazykuen
dc.subjectjazyky s malým množstvím dostupných daten
dc.subjectQuery-by-Examplecs
dc.subjectSpoken Term Detectioncs
dc.subjectFinite State Transducerscs
dc.subjectSystem comparisoncs
dc.subjectLanguage dependencycs
dc.subjectLow-resource languagescs
dc.titleVyhledávání výrazů v řeči pomocí mluvených příkladůen
dc.title.alternativeQuery-by-Example Spoken Term Detectioncs
dc.typeTextcs
dc.type.driverdoctoralThesisen
dc.type.evskpdizertační prácecs
dcterms.dateAccepted2014-12-17cs
dcterms.modified2020-05-10-17:46:41cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid99805en
sync.item.dbtypeZPen
sync.item.insts2021.11.22 23:18:36en
sync.item.modts2021.11.22 22:24:53en
thesis.disciplineVýpočetní technika a informatikacs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelDoktorskýcs
thesis.namePh.D.cs
Files
Original bundle
Now showing 1 - 5 of 6
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
1.52 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
thesis-1.pdf
Size:
344.62 KB
Format:
Adobe Portable Document Format
Description:
thesis-1.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-282_s1.pdf
Size:
356.57 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-282_s1.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-282_o1.pdf
Size:
4.26 MB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-282_o1.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-282_o2.pdf
Size:
167.1 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-282_o2.pdf
Collections