2024

Permanent URI for this collection

Browse

Recent Submissions

Now showing 1 - 5 of 5
  • Item
    Od modulárních k celostním systémům diarizace řečníka
    (Vysoké učení technické v Brně. Fakulta informačních technologií, ) Landini, Federico Nicolás; Burget, Lukáš; Ganapathy, Sriram; Bredin, Herve
    Diarizace mluvčího se obvykle popisuje jako úloha, která určuje, "kdo kdy mluvil" v nahrávce. Ještě před několika lety byly všechny konkurenceschopné přístupy modulární, tj. detekce hlasové aktivity, segmentace, extrakce embeddingů, shlukování a detekce a zpracování překrývající se řeči byly řešeny různými subsystémy a aplikovány jeden po druhém. Takto konstruované systémy dosahovaly ve většině scénářů nejlepších výsledků, ale měly velké potíže vypořádat se s překrývající se řečí. V poslední době vzbudil velkou pozornost nástup end-to-end modelů, které jsou schopny řešit všechny aspekty diarizace mluvčího pomocí jediného modelu a mají lepší úspěšnost, pokud jde o překrývající se řeč.   Tato práce vznikla v období koexistence těchto dvou trendů. Popisujeme systém založený na bayesovském skrytém Markovově modelu používaném ke shlukování x-vektorů (embeddingů mluvčích získaných pomocí neuronové sítě), známý jako VBx, který prokázal pozoruhodnou úspěšnost na různých souborech dat a evaluačních v různých kampaních. Popíšeme jeho výhody a omezení a vyhodnotíme výsledky na různých relevantních korpusech. Poté přejdeme k metodám end-to-end neuronové diarizace (EEND). Vzhledem k potřebě velkých trénovacích sad pro trénování těchto modelů a nedostatku ručně anotovaných diarizačních dat v dostatečném množství spočívá kompromisní řešení v umělém generování trénovacích dat. Popíšeme přístup ke generování syntetických dat, která se z hlediska změn a překryvů mluvčích podobají skutečným rozhovorům. Ukážeme, jak tato metoda generování simulovaných konverzací umožňuje dosáhnout lepší úspěšnosti než dříve navržená metoda vytváření simulovaných směsí při trénování populárního EEND s enkodér-dekodér atraktory (EEND-EDA). Navrhneme také nový model založený na EEND, který nazýváme DiaPer, a ukážeme, že může dosáhnout lepších výsledků než EEND-EDA, zejména při práci s mnoha mluvčími a při zpracování překrývající se řeči. Nakonec porovnáváme oba systémy, VBx i DiaPer, na široké škále datových sad a prodiskutejeme výhody každého z nich.
  • Item
    Automatická kalibrace dohledové kamery pozorováním rigidních objektů
    (Vysoké učení technické v Brně. Fakulta informačních technologií, ) Bartl, Vojtěch; Herout, Adam; Buchholz, Michael; Hurtík, Petr
    Tato práce je zaměřena na automatickou kalibraci kamery na základě vícečetných pozorování libovolných rigidních předmětů. Na základě pozorování rigidních objektů pohybujících se ve společné rovině jsme schopni kalibrovat kameru vzhledem ke společné rovině, a tak jsme schopni provádět měření ve scéně. Objekty v rovině obrazu jsou detekovány a klasifikovány a význačné body na těchto objektech jsou lokalizovány. Motivací bylo použití těchto metod v dopravním prostředí, proto naše "objekty" jsou nejčastěji vozidla. Navrhujeme tři různé metody, které jsou schopny vypočítat kalibraci kamery na základě těchto lokalizovaných význačných bodů v rovině obrazu s jediným omezením - musí být známy 3D modely, ale ty mohou být známy kalibračnímu systému ještě před samotnou kalibrací. Proces kalibrace kamery je pak plně automatický a žádné další informace nejsou již potřeba. Na rozdíl od předchozích aktuálních metod pro automatickou kalibraci kamery, navržené metody jsou schopny odhadnout všechny parametry kamery (včetně ohniskové vzdálenosti). Vytvořili jsme rovněž nový dataset BrnoCarPark , který obsahuje záznamy různých scén a detekovaná vozidla spolu s lokalizovanými význačnými body. K dispozici jsou měření vzdáleností ve scénách, která mohou být přepočítány pomocí vypočtených parametrů kalibrace kamery. Všechny navrhované metody překonávají současné aktuální metody. Vyhodnotili jsme naše metody na zkonstruovaném datasetu a také dalším datasetu BrnoCompSpeed . Také jsme provedli experimenty na syntetických datech, které prokazují stabilitu a použitelnost navrhovaných metod.
  • Item
    Kroky ke zlepšení metod počítačového vidění pro analýzu dopravy
    (Vysoké učení technické v Brně. Fakulta informačních technologií, ) Špaňhel, Jakub; Herout, Adam; Sablatnig, Robert; Šikudová, Elena
    Rostoucí urbanizace a zvyšující se počet vozidel na silnicích přetěžují tradiční systémy řízení dopravy na hranici jejich možností. Řešení nabízejí inteligentní dopravní systémy (ITS), které využívají pokročilé technologie ke zvýšení plynulosti a bezpečnosti dopravy. Zásadní oblastí, kterou je třeba zlepšit, však zůstává robustnost metod počítačového vidění v rámci ITS, které jsou nezbytné pro analýzu dopravy.  Tato práce přispívá k této oblasti, konkrétně se zaměřuje na přesné (fine-grained) rozpoznávání vozidel, reidentifikaci vozidel, rozpoznávání registračních značek a monokulární měření rychlosti vozidel. Bylo představeno několik nových datových sad, vysoce ceněných výzkumnou komunitou, které rozšiřují hodnocení a zkoumání v každé z výše uvedených oblastí.     Hlavní přínosy lze shrnout následovně: Nové technicky augmentace pro přesné rozpoznávání vozidel & rozšíření dříve publikované datové sady. Nová metoda agregace vizuálních znaků pro re-identifikaci vozidel & datová sada. Inovativní přístup k rozpoznávání registračních značek pomocí zarovnání registrační značky a holistického rozpoznávání & tři publikované datové sady. Největší datová sada pro měření rychlosti vozidel & stanovení výchozího vyhodnocení s dostupnými metodami vizuálního meření rychlosti. Klíčová zjištění této práce prokazují významné zvýšení přesnosti, účinnosti a robustnosti metod počítačového vidění aplikovaných na analýzu dopravy.  Přínosy tohoto výzkumu byly oceněny na nejvýznamnějších konferencích a v časopisech v oblasti ITS a stanovují nové standardy pro budoucí práci.  Tím, že tato práce posunula současný stav ITS a přispěla cennými zdroji pro probíhající výzkum, představuje zásadní krok směrem k udržitelnějším, efektivnějším a inteligentnějším dopravním systémům. Má důsledky pro řízení dopravy a širší společenský cíl vytvořit citlivější a přizpůsobivější městské prostředí.
  • Item
    Paralelní numerické řešení diferenciálních rovnic
    (Vysoké učení technické v Brně. Fakulta informačních technologií, ) Nečasová, Gabriela; Šátek, Václav; Čermák, Martin; Kozek, Martin
    Diferenciální rovnice se studují již vice než 300 let. Poprvé parciální diferenciální rovnice použil švýcarský matematik a právník Nicolaus Bernoulli v 18. století. Parciální diferenciální rovnice druhého řádu se používají k modelování široké škály jevů ve vědě, technice a matematice, například šíření světelných a zvukových vln, pohybu tekutin a šíření tepla. Práce se zabývá paralelním numerickým řešením parciálních diferenciálních rovnic. Parciální diferenciální rovnice druhého řádu jsou pomocí metody přímek převedeny na rozsáhlé soustavy obyčejných diferenciálních rovnic. Prostorové derivace v parciální diferenciální rovnici jsou nahrazeny různými typy konečných diferencí. Výsledné soustavy obyčejných diferenciálních rovnic (problémy počátečních hodnot) jsou řešeny paralelně pomocí Runge-Kutta metod a nově navržené metody vyššího řádu založené na Taylorově řadě. Numerické experimenty vybraných problémů jsou realizovány na superpočítači s různým počtem výpočetních uzlů. Výsledky ukazují, že metoda založená na Taylorově řadě výrazně překonává standardní Runge-Kutta metody.
  • Item
    Numerická metoda vyššího řádu v modelování a řízení
    (Vysoké učení technické v Brně. Fakulta informačních technologií, ) Veigend, Petr; Šátek, Václav; Horák, David; Schirrer, Alexander
    Systémy pro řízení a regulaci jsou používány téměř ve všech průmyslových oblastech. Pro jejich modelování se často používají diferenciální rovnice, které popisují dynamické chování těchto systémů a umožňují je detailněji analyzovat z hlediska přesnosti, stability, výkonu a reakcí těchto systémů v reálném čase. V této oblasti se běžně nepoužívají metody vyšších řádů, protože vykonávají velké množství operací.  Tato práce zkoumá numerické řešení obyčejných diferenciálních rovnic s použitím metody s proměnným řádem a proměnnou velikostí kroku, která je založena na Taylorově řadě. Metoda je navržena jak pro lineární, tak pro nelineární problémy a jsou implementovány její optimalizace pro snížení výpočetního času bez degradace jejích vlastností. Pozitivní vlastnosti metody jsou demonstrovány na sadě příkladů z technické praxe. Výsledky práce ukazují, že metoda založena na Taylorově řadě může být použita v oblasti řízení a regulace a má lepší vlastnosti než běžně používané metody.