2022

Browse

Recent Submissions

Now showing 1 - 5 of 10
  • Item
    Metody 2D-3D registrace modelů pro analýzu konvenčních rentgenových snímků
    (Vysoké učení technické v Brně. Fakulta informačních technologií, ) Klíma, Ondřej; Zemčík, Pavel; Kälviäinen, Heikki; Krupa, Petr
    Konvenční radiografie hraje klíčovou roli v oblastech dignostiky zlomenin kostí, předoperačního plánování a pooperačního hodnocení ortopedických zákroků. Tato dizertační práce je zaměřena na metody umožňující 3D analýzu konvenčních rentgenových snímků, založené na registraci digitálních modelů. Práce prezentuje metodu pro rekonstrukci celistvých modelů kostí, které utrpěly dislokované zlomeniny diafýzy, na základě konvenčních rentgenových snímků jejich fragmentů. Rekonstrukce je dosaženo použitím 2D-3D registrace statistického tvarového modelu do jednotlivých fragmentů a jejich současně prováděné repozice. Repozice je umožněna díky přesnému odhadu délky kosti, kterého je dosaženo automatickým dělením statistického tvarového modelu do jednotlivých fragmentů. Vytvořená metoda byla vestavěna do softwarové aplikace určené pro předoperační plánování osteosyntézy diafýzy se zaměřením na výběr vhodného intramedulárního hřebu nebo rekonstruční dlahy. Rekonstrukce částečně využívá navrženou intenzitní revizi registrační procedury minimalizující nepřekrývající se oblasti, určenou pro radiostereometrii založenou na modelech. Oproti původnímu přístupu využívajcí kontury modelů je revidovaná metoda schopna pracovat s jejich překrytými nebo nespolehlivými částmi. Provedené evaluace také vykazují řádově vyšší přesnost ve srovnání s přístupem založeným na konturách a dosahují srovnatelných hodnot se současnými hranovými metodami, zatímco je umožněno použití modelů s vysokým počtem polygonů, přímá akcelerace a snadná interpretovatelnost. Pro rekonstrukci modelů kostí byla kromě přístupu založeném na nepřekrývajících se oblastech vytvořena také registrace založená na hustotách a využívající stastistické tvarové a intenzitní modely. Ačkoliv metoda dosahuje mírně nižší přesnosti rekonstrukce povrchu, registrace založená na hustotách umožňuje odhadnout vnitřní struktury kosti tvořené kompaktní a houbovitou tkání a poskytnout tak více informací pro plánování. Pro praktické využití bylo také zkoumáno nasazení různých optimalizačních metod a možnosti ztrátové komprese statistických tvarových a intenzitních modelů.
  • Item
    Detekce a obnova slov mimo slovník
    (Vysoké učení technické v Brně. Fakulta informačních technologií, ) Egorova, Ekaterina; Černocký, Jan; Hannemann, Mirko; Schaaf, Thomas
    Tato disertační práce zkoumá oblast zpracování slov mimo slovník (out-of-vocabulary word, OOV) v rámci úlohy automatického rozpoznávání řeči (automatic speech recognition, ASR). Definuje dvě samostatné úlohy zpracování OOV - detekci a obnovu - a pro obě úlohy navrhuje metriky úspěšnosti. Prezentuje několik přístupů k detekci a obnově OOV v rámci hybridních a end-to-end (E2E) ASR systémů. Experimentální práce a srovnání přístupů bylo provedeno na otevřené databázi LibriSpeech, aby byla zajištěna reprodukovatelnost experimentů.  Hybridní přístup využívá upravený dekódovací graf s fonémovými podřetězci a pro detekci a obnovu opakujících se OOV využívá reprezentaci založenou na plných rozpoznávacích grafech (lattices). Obnovená OOV jsou přidána do slovníku a jazykového modelu (LM), což vede ke zlepšení úspěšnosti ASR systému. Druhý přístup využívá k řešení úlohy detekce OOV vnitřní reprezentace systému E2E architektury "Listen Attend and Spell" (LAS) s predikcí slov. Tato metoda oproti hybridnímu přístupu výrazně zlepšuje míru úplnosti a přesnosti (recall a precision). Obnova opakujících se OOV se provádí pomocí samostatného systému predikce znaků s využitím detekovaných časových rámců a pravděpodobnostního shlukování.Nakonec navrhujeme novou "speller" architekturu se schopností učit se reprezentace OOV společně s trénováním sítě pro predikci slov (word predicting network, WPN). Komponent "speller" ovlivňuje během trénování slovní embeddingy tak, aby dobře reprezentovaly i fonetickou podobu slov, a tím zajišťuje nejen možnost kvalitní obnovy OOV, ale i zlepšení výkonu sítě pro predikci slov.
  • Item
    Dynamicky rekonfigurovatelné softwarové architektury pro distribuované řídicí systémy
    (Vysoké učení technické v Brně. Fakulta informačních technologií, ) Richta, Tomáš; Janoušek, Vladimír; Kavička, Antonín; Sawa, Zdeněk
    Tato prace se zabyva dynamickou rekonfigurovatelnosti distribuovanych ridicich systemu. Vzhledem k charakteristice techto systemu je pro definici jejich behu pouzit formalismus Petriho siti. Tyto jsou transformovany do proveditelne podoby a nasledne pak interpretovany specializovanym software nainstalovanym na jednotlivych uzlech systemu. Diky vlastnostem pouziteho formalismu je mozne jednotlive casti systemu nahrazovat novymi variantami. Stejne tak je mozne generovat formalni specifikace dilcich casti systemu z abstraktnejsich workflow modelu a popisu ve forme domenove specifickych jazyku.
  • Item
    Akcelerace 2D Vlnkové transformace na paralelních architekturách
    (Vysoké učení technické v Brně. Fakulta informačních technologií, ) Kula, Michal; Zemčík, Pavel; Schier, Jan; Sojka, Eduard
    I přesto, že byla 2D diskrétní vlnková transformace předmětem řady rozsáhlých studií, některé aspekty této problematiky byly doposud opomíjeny. Mezi takové aspekty lze zařadit techniky pro výpočet této transformace se zaměřením na vyvažování synchronizací, aritmetických instrukcí a využití paměti pro různé architektury. Tato práce ukazuje několik nových metod výpočtu této transformace s různě nastaveným vybalancováním těchto operací. Tyto metody jsou detailně popsány a jejich chování je vyhodnoceno na několika grafických adaptérech za použití GPGPU, zpracování pomocí grafické pipeliny a vícejádrových procesorů pomocí OpenMP.
  • Item
    Využití informací o nejistotě v ověřování mluvčího a diarizaci mluvčích
    (Vysoké učení technické v Brně. Fakulta informačních technologií, ) Silnova, Anna; Burget, Lukáš; Šmídl, Václav; Villalba Lopez, Jesus Antonio
    Tato práce se zabývá dvěma modely, které umožňují využít informace o nejistotě v úlohách automatického ověřování mluvčího a diarizace mluvčích. První model, který zvažujeme, je modifikací široce používané gaussovské pravděpodobnostní lineární diskriminační analýzy (G-PLDA), modelující rozložení vektorových reprezentací promluv nazývaných embeddingy. V G-PLDA se předpokládá, že embeddingy jsou generovány přidáním šumového vektoru navzorkovaného z Gaussova rozložení k vektoru reprezentujícímu mluvčího. Ukazujeme, že za předpokladu, že šum byl místo toho vzorkován ze Studentova T-rozdělení, model PLDA (tuto verzi nazýváme PLDA s těžkým chvostem, heavy-tail, HT-PLDA) může při rozhodnutí o ověření mluvčího využít informace o nejistotě. Náš model je koncepčně podobný modelu HT-PLDA definovanému Kennym et al. v roce 2010, ale jak ukazujeme v této práci, umožňuje rychlé skórování, zatímco původní definice HT-PLDA je značně časové a výpočetně náročná. Představujeme algoritmus pro trénování naší verze HT-PLDA jako generativního modelu a zvažujeme rovněž různé strategie diskriminativního trénování parametrů tohoto modelu. Generativně a diskriminativně trénovanou HT-PLDA testujeme na úloze ověřování mluvčího. Výsledky naznačují, že HT-PLDA funguje podobně jako standardní G-PLDA, přičemž má výhodu v odolnosti vůči změnám v předzpracování dat. Experimenty s diarizací mluvčích ukazují, že HT-PLDA poskytuje nejen lepší výsledky než základní G-PLDA, ale skóre logaritmického poměru věrohodností (log-likelihood ratio, LLR) produkovaná tímto modelem jsou lépe kalibrována. Ve druhém modelu nepovažujeme (na rozdíl od HT-PLDA) embeddingy za pozorovaná data. Místo toho jsou v tomto modelu embeddingy normálně rozložené skryté proměnné. Přesnost (precision) embeddingů nese informaci o kvalitě řečového segmentu: u čistých dlouhých segmentů by přesnost měla být vysoká a u krátkých a zašuměných promluv by měla být nízká. Ukazujeme, jak lze takové pravděpodobnostní embeddingy začlenit do skórování založeného na G-PLDA, a jak parametry skrytého embeddingu ovlivňují jeho vliv při výpočtu věrohodností s tímto modelem. V experimentech demonstrujeme, jak lze využít existující extraktor embeddingů založený na neuronové síti (NN) k produkci nikoli embeddingu, ale parametrů pravděpodobnostního rozložení embeddingu. Pravděpodobnostní embeddingy testujeme na úloze diarizace mluvčích. Výsledky ukazují, že tento model poskytuje dobře kalibrovaná skóre LLR umožňující lepší diarizaci, pokud není k dispozici vývojová datová sada pro ladění shlukovacího algoritmu.