2014
Browse
Recent Submissions
- ItemNávrh adaptivního systému na rekonfigurovatelné platformě s využitím vestavěného analogově číslicového převodníku(Vysoké učení technické v Brně. Fakulta informačních technologií, ) Zamba, Martin; Dobai, Roland; Růžička, RichardTáto práca sa zaoberá možnosťou využitia rekonfigurovateľných číslicových systémov na báze FPGA v aplikáciách využívajúcich zmiešané signály. V práci je uvedený opis rekonfigurovateľných architektúr a rekonfigurovateľných a adaptívnych systémov vo všeobecnosti. Ďalej sú analyzované možnosti využitia rekonfigurovateľných vlastností v konjunkcii s využitím prevodníka XADC u FPGA rady 7 od firmy Xilinx a systému Zynq-7000. V práci je predstavená myšlienka možnosti využitia XADC pre meranie indukčnosti ako alternatíva k existujúcemu riešeniu obvodom LDC1000 od Texas Instruments. Systém s využitím FPGA a XADC by priniesol mnoho výhod ako sú: lepšia integrácia systému, lepšie možnosti spracovania signálov, možnosť skonštruovať adaptívny systém s mnoho senzorickými elementmi a v neposlednom rade potencionálne nižšia cena riešenia. V závere práce sú tieto výhody a nevýhody analyzované a sú navrhnuté ďalšie možnosti pokračovania tejto práce.
- ItemŘízení dynamických systémů v reálném čase(Vysoké učení technické v Brně. Fakulta informačních technologií, ) Veigend, Petr; Kunovský, Jiří; Šátek, VáclavTato práce se zabývá řízením dynamických systémů v reálném čase a navazuje na předchozí bakalářskou práci. V její úvodní části jsou definovány základní pojmy z oblasti řízení a regulace, aby byl čtenář uveden do problematiky. Systémy v rámci této práce jsou popsány pomocí diferenciálních rovnic, proto je část práce věnována seznámení se s různými metodami řešení diferenciálních rovnic a jejich přesnosti. Je také představena Moderní metoda Taylorovy řady, kterou řeší diferenciální rovnice přiložené programy. Pro simulaci byl inovován existující návrhový systém a implementováno několik dalších pomocných a výukových nástrojů. Je zmíněno i řešení dopravního zpoždění.
- ItemPočítání tlakových lahví v obraze(Vysoké učení technické v Brně. Fakulta informačních technologií, ) Klos, Dominik; Španěl, Michal; Juránek, RomanTato práce se zabývá automatickým počítáním tlakových lahví, které jsou umístěny na korbě nákladního automobilu, pomocí kamery umístěné nad korbou projíždějícího vozu. K dosažení tohoto cíle je využito SVM klasifikátoru natrénovaného pomocí HOG příznaků, který detekuje tlakové lahve a také metody Optical flow, která zajišťuje tracking nalezených lahví v obraze. Výsledkem práce je aplikace, která dokáže spočítat láhve umístěné na korbě s přesností 93,08 % na jeden vůz a vizualizovat tyto výsledky.
- ItemParalelizace ultrazvukových simulací pomocí 2D dekompozice(Vysoké učení technické v Brně. Fakulta informačních technologií, ) Nikl, Vojtěch; Jaroš, Jiří; Dvořák, VáclavTato práce je součástí projektu k-Wave, což je simulační nástroj akustické tomografie sloužící k simulaci a rekonstrukci akustických vlnových polí a jeho hlavním přínosem je plánování ultrazvukových operací lidské tkáně, např. nádoru na mozku. Dopředné simulace jsou založeny na řešení k-prostorové pseudospektrální časové domény. Simulace jsou časově a výpočetně velice náročné. Simulace probíhají na 3D maticích, které reprezentují určité vlastnosti reálné tkáně, např. hustotu absorbce nebo rychlost šíření zvuku. K výpočtu gradientu se používá Rychlá Fourierova transformace (dále jen FFT), jejíž výpočet zabere zhruba 60% simulačního času. 3D FFT byla do této doby počítána pomocí softwarové knihovny FFTW, která interně využívá 1D dekompozici, tj. dekompozici podél jedné osy. Hlavní nevýhoda 1D dekompozice je relativně malý maximální počet výpočetních jader, přes které lze paralelizovat výpočet. Matice mají velikost řádově 1024x2048x3072, tím pádem lze efektivně paralelizovat přes maximálně 1024 jader. Dnešní superpočítače umožnují využít až stovky tisíc jader a tomu bychom se rádi přiblížili. Řešením je využití 2D dekompozice, která by teoretický maximální počet jader posunula až do řádu milionů. Její efektivní implementací se zabývá právě tato práce. 2D dekompozice je obecně paralelizována pouze pomocí MPI procesů, např. v~knihovnách PFFT nebo P3DFFT, v této práci ale využíváme pokročilejší kombinace MPI procesů a OpenMP vláken, kterou jsme nazvali hybridní 2D dekompozice (HybridFFT). Má tři hlavní části: výpočet 1D FFTs, lokální transpozice dat a globální transpozice dat. Pro výpočet sérií 1D FFT je využita knihovna FFTW.Lokální transpozice jsou implementovány pomocí blokové transpozice 2D matice, která je vektorizována pomocí SSE/AVX instrukcí. Jak 1D FFT, tak lokální lokální transpozice, jsou akcelerovány pomocí OpenMP vláken. Globální transpozice je opět implementována prostřednictvím knihovny FFTW, která při použití pokročilého plánování dokáže výrazně snížit dobu potřebnou pro její realizaci. Hlavním cílem této práce je tedy dosáhnout maximálního možného zrychlení a škálovatelnosti oproti předchozímu řešení, zároveň ale i zachovat kompatibilitu a přenositelnost. Hybridní transformace pracuje nejlépe, pokud na jednom socketu spustíme jeden MPI proces a v rámci tohoto socketu využijeme tolik vláken, kolik máme k dispozici jader. Díky tomu nemusí jádra v rámci jednoho socketu komunikovat přes MPI zprávy, ale využívají rychlejší sdílenou paměť, a zároveň je MPI komunikace efektivnější, protože máme pouze jeden MPI proces na socket a tím pádem jsou MPI zprávy vetší a je jich méně, což vede k menšímu zahlcení propojovací sítě a lepší efektivitě komunikace. Řešení bylo testováno na superpočítačích Anselm (Ostrava), Zapat (Brno) a Supernova (Wroclaw). Pro nižší počty jader, v řádu několika set, je výkon přibližně stejný nebo o pár procent lepší, než původně použitá 1D dekompozice FFTW knihovny nebo knihony PFFT a P3DFFT. Jeden z velmi dobrých výsledků je např. 512^3 FFT na 512 jádrech, kde hybridní dekompozice dosáhla času 31 ms, zatímco FFTW 39 ms a PFFT 44ms. Na stroji Anselm jsme spustili výpočet až na 2048 jádrech a škálovatelnost byla stále lineární. Nejlepší nárust výkonu oproti ostatním knihovnám by se měl projevit při počtu zhruba 8-16 tisíc jader pro kostky velikosti 1024^3, protože v této konfiguraci bude mít jeden MPI proces na starosti jednu desku matice a zároveň budou MPI zprávy dostatečně velké a v takovém počtu, že by se měla projevit lepší efektivita komunikace oproti ostatním knihovnám.
- ItemInteligentní distribuce souborů v CDN(Vysoké učení technické v Brně. Fakulta informačních technologií, ) Kaleta, Marek; Škoda, Petr; Kouřil, JanTato práce se zabývá algoritmy pro rozdělování obsahu v CDN na jednotlivé uzly systému. Srovnává lokální a globální algoritmy pro ukládání dat na zdrojové a cachovací servery, jednotlivé přístupy cachování a rychlost reakce a kvalitu případné předpovědi zátěže. Je vytvořen vysokoúrovňový simulátor CDN, navržen popis mapování pomocí matic a navrženo několik algoritmů včetně genetických k mapování souborů na jednotlivé servery