2021

Browse

Recent Submissions

Now showing 1 - 5 of 16
  • Item
    Čítačové automaty ve vyhledávání podle regulárních výrazů
    (Vysoké učení technické v Brně. Fakulta informačních technologií, ) Holíková, Lenka; Holík, Lukáš; Meyer, Roland; Masopust, Tomáš
    Vyhledávání podle regulárních výrazů (regexové vyhledávání) je široce využívaný prostředek např. pro vyhledávání informací, ověřování dat, vyhledávání a nahrazování, získávání dat nebo zvýrazňování syntaxe v mnoha programovacích jazycích. Jedná se o výpočetně náročný proces, který se často aplikuje na rozsáhlé texty. Jeho předvídatelnost a stabilita má v praxi významný dopad na celkovou použitelnost softwarových aplikací. Problémem je, že standardní přístupy pro regexové vyhledávání mají vysokou složitost a nešťastná kombinace regexu a textu může dobu vyhledávání řádově prodloužit. To může být vstupní branou pro tzv. ReDoS útoky, což je závažný bezpečnostní problém, kdy útočník způsobí odepření služby pomocí speciálně vytvořeného regexu nebo textu. Automatové regexové vyhledávače jsou v současné době nejefektivnějšími nástroji pro regexové vyhledávání používanými v praxi, zejména v průmyslových výkonnostně kritických aplikacích. Dlouholeté empirické studie ukazují, že tyto přístupy mají mnohem stabilnější výkonnost, než jakou mají existující nástroje pro regexové vyhledávání založené na zpětném prohledávání. Nicméně i automatové regexové vyhledávače se mohou dostat do potíží. Omezená opakování, např. [ab]{100}, představují hlavní zdroj problémů i pro nejrychlejší nástroje pro regexové vyhledávání. Tato práce se touto problematikou zabývá systematicky. V této práci jsme nejprve představili rozsáhlou studii zranitelnosti nástrojů pro regexové vyhledávání založených na konečných automatech. Za tímto účelem jsme navrhli nový ReDoS generátor. Jedná se o první generátor schopný využívat omezené opakování ke generování útoků pro automatové regexové vyhledávače. Byli jsme schopni experimentálně prokázat, že omezená opakování skutečně představují vážnou bezpečnostní hrozbu, jak pro automatové regexové vyhledávače, tak pro ty založené na zpětném prohledávání.Dále jsme navrhli řešení problému efektivního regexové vyhledávání s omezeným opakováním. Obecný přístup je založen na kompilaci regexů do nedeterministických čítačových automatů a jejich následné determinizaci. Hlavním problémem je najít stručnou deterministickou reprezentaci, která dokáže provádět rychlé regexové vyhledávání (naivní determinizace vytváří deterministické konečné automaty exponenciálně velké k velikosti regexu a k maximům mezí opakování, které se v nich nachází). Nejprve jsme navrhli determinizační algoritmus vycházející z klasické podmnožinové konstrukce, který generuje deterministické čítačové automaty. Tyto automaty jsou exponenciálně stručnější než odpovídající deterministické konečné automaty. Hlavní přínos této práce jsme pak získali, když jsme determinizaci rozpracovali pomocí myšlenky čítacích množin. Navrhli jsme stručnou transformaci čítačového automatu na deterministický automat se speciálním typem registrů, které mohou obsahovat množinu celočíselných hodnot. Představili jsme také novou kompilaci regexů na čítačové automaty, která zobecňuje Antimirovu derivatovou konstrukci. Vytvořili jsme aplikační rámec založený na simulaci automatů s čítačovými registry a Antimirově derivatové konstrukci. Porovnali jsme rychlost vyhledávání jednotlivých nástrojů na rozsáhlé sadě reálných regexů s omezeným opakováním. Zjistili jsme, že náš algoritmus je mnohem robustnější, překonává nejmodernější nástroje pro regexové vyhledávání na regexech s omezeným opakováním a není závislý na velikosti mezí opakování. Snadno řeší většinu případů, ve kterých mají stávající nástroje pro regexové vyhledávání problém s omezeným opakováním.
  • Item
    Využití verifikace pro ověřování odolnosti proti poruchám u systémů založených na FPGA
    (Vysoké učení technické v Brně. Fakulta informačních technologií, ) Podivínský, Jakub; Kotásek, Zdeněk; Fišer, Petr; Racek, Stanislav
    Odolnost proti poruchám je jedna z nejčastěji využívaných technik pro eliminaci vlivu poruch na číslicové systémy a zvýšení jejich spolehlivosti. Tato práce popisuje platformu pro testování technik pro zajištění odolnosti proti poruchám v systémech založených na FPGA. Platforma využívá principů funkční verifikace, přičemž experimentální elektronická řídicí jednotka je přesunuta na FPGA, což umožňuje využít injekci poruch přímo do FPGA. Platforma umožňuje využít elektro-mechanickou aplikaci jako experimentální systém a sledovat vliv poruch jak na elektronickou řídicí jednotku, tak na chování řízené mechanické části. V práci jsou představeny experimenty se dvěma experimentálními systémy - robot pro hledání cesty v bludišti a elektronický zámek. Platforma je navržena tak, aby umožnila využití libovolného experimentálního systému s elektronickou řídicí jednotkou implementovanou v FPGA.
  • Item
    Neurální extrakce řeči cílového řečníka
    (Vysoké učení technické v Brně. Fakulta informačních technologií, ) Žmolíková, Kateřina; Černocký, Jan; Erdogan, Hakan; Koldovský, Zbyněk
    S rostoucím nasazením řečových technologií v praxi roste důležitost jejich robustnosti. Zejména zpracování řeči poškozené rušícími překrývajícími se řečníky je stále výzva. Přístupy separace řeči tento problém řeší rozkladem smíchané řeči na signály jednotlivých řečníků. Tyto metody v nedávné době výrazně pokročily s využitím vývoje v hlubokém učení. Ve spoustě aplikací, jako jsou chytré telefony nebo digitální domácí asistenti, je cílem zvýraznit řečový signál jednoho cílového řečníka, a potlačit ostatní řečníky a šum. V~této práci formulujeme tento problém jako extrakci řeči cílového řečníka a navrhujeme přímé řešení --- použití neuronové sítě, která na vstupu přijímá předregistrovanou nahrávku cílového řečníka a pozorovanou směs, a na výstupu vrací extrahovanou řeč cílového řečníka. Diskutujeme a experimentálně ukazujeme výhody tohoto přístupu ve srovnání s konvenční separací řeči. Výhody zahrnují nepotřebnost počítání řečníku ve směsi nebo lepší konzistenci výstupu pro delší nahrávky. Zkoumáme různé aspekty neurální extrakce řeči cílového řečníka, jako jsou embeddingy reprezentující řečníka, metody jak informovat neuronovou síť, vstupní a výstupní doména a ztrátová funkce. Dále demonstrujeme, jak kombinovat extrakci cílového řečníka s multi-kanálovými metodami, jako je beamforming založený na neurálních maskách nebo prostorové shlukování. Tyto kombinace využívají jak konvenčních statistických metod pro zpracování prostorové informace, tak silné modelovací schopnosti neuronových sítí. Na závěr aplikujeme extrakci řeči cílového řečníka na dva finální úkoly: automatické rozpoznávání řeči a diarizaci založenou na shlukování. Zkoumáme jak nejlépe zkombinovat předzpracování signálu s cílovými systémy včetně společné optimalizace, nebo trénování se slabou supervizí založenou na informaci o řečnících.
  • Item
    Principy generování testovacích stimulů
    (Vysoké učení technické v Brně. Fakulta informačních technologií, ) Čekan, Ondřej; Kotásek, Zdeněk; Kubátová, Hana; Plíva, Zdeněk
    Výzkum prezentovaný v této práci je zaměřen na návrh obecných principů v oblasti generování stimulů pro různé systémy. Stimuly představují vstupní data systému, které určují jeho chování. Značnou výhodou je využití těchto principů v oblasti funkční verifikace. Funkční verifikace je jedna z verifikačních technik, která ověřuje správné chování systému monitorováním jeho vstupů a výstupů. Návrh zohlednil čtyři klíčová kritéria z hlediska generování stimulů - parametrizovatelnost, rychlost, náhodnost, univerzálnost.   Na základě návrhu byla definována architektura generování stimulů pro obecné použití. Pro popis stimulů slouží vstupní struktury, které definují požadovaný formát stimulu a omezující podmínky na něj kladené. Díky tomu je možno získat jak validní stimul, tak měnit omezující podmínky v průběhu generování, což je vhodné především pro získání vyššího pokrytí ve funkční verifikaci. Obecnost definice stimulů je zajištěna pomocí formálního popisu. V rámci výzkumu byly definovány principy tvorby stimulů pro procesory, funkční jednotky i aplikační data. Představený způsob dosahuje zlepšení oproti konvenčním přístupům.
  • Item
    Detekce repetitivních sekvencí v genomech
    (Vysoké učení technické v Brně. Fakulta informačních technologií, ) Puterová, Janka; Zendulka, Jaroslav; Jedlička, Pavel; Kléma, Jiří
    Repetitivní sekvence mohou tvořit významnou část genomu, v některých případech více než 80%, která však bývala vědci často přehlížena. Dnes je známo, že repetice mají v genomu různé funkce a rozdělují se na dvě hlavní skupiny: rozptýlené a tandemové repetice. Cílem této práce bylo vytvoření bioinformatických nástrojů pro detekci repetic, ať už přímo ze sekvenačních dat generovaných sekvenátory, nebo ze sestavených genomů. V úvodní části práce poskytuje náhled do problematiky a přehled typů repetic vyskytujících se v genomech. Dále se práce zabývá stávajícími přístupy a nástroji zaměřenými na identifikaci repetic přímo ze sestavených sekvencí. Hlavním přínosem do této oblasti bylo vytvoření nástroje digIS, který se zaměřuje na detekci inserčních sekvencí, které přestavují nejhojněji se vyskytující rozptýlené repetice u prokaryot. digIS je založen na principu profilových skrytých Markovových modelů zkonstruovaných pro katalytické domény transpozáz, které představují nejkonzervativnější část inserčních sekvencí a zachovávají si sekundární strukturu v rámci rodiny. Následně práce poskytuje přehled sekvenačních technologií a rozebírá stávající metody pro detekci repetic přímo ze sekvenačních dat, bez nutnosti procházejícího sestavení genomu. Je představen nový přístup pro detailní analýzu tandemových repetic. Tento přístup rozšiřuje základní analýzu nástroje RepeatExplorer, který detekuje a charakterizuje repetice přímo ze sekvenačních dat. Práce dále diskutuje aplikace detekce repetic v biologickém výzkumu zejména z pohledu srovnávacích studií repeatomu a evoluce pohlavních chromozomů. V závěrečné části práce poskytuje souhrn dosažených výsledků výzkumu v podobě čtyř článků publikovaných v mezinárodních časopisech, jejichž plné znění je dostupné v přílohách, a celkové shrnutí práce a možnosti budoucího výzkumu.