2024

Permanent URI for this collection

Browse

Recent Submissions

Now showing 1 - 5 of 10
  • Item
    Akcelerace real-time light field renderingu na GPU
    (Vysoké učení technické v Brně. Fakulta informačních technologií, ) Chlubna, Tomáš; Zemčík, Pavel; Chalmers, Alan; Sedláček, David
    Tato práce popisuje originální návrhy týkající se vykreslování light fieldů, zaostřování, komprese, streamování a metod pro jejich optimální využití na 3D displejích. Vykreslování light fieldů spadá do oblasti tzv. image-based renderingu. Jedná se o rychlý způsob vykreslování jinak výpočetně náročných syntetických nebo také reálných scén. Vstupní sada obrázků, která zachycuje scénu, se používá k syntéze nového pohledu bez složitých 3D rekonstrukcí. Hlavním vědeckým přínosem této práce je důkaz hypotézy. Hypotéza uvádí, že moderní metody vykreslování light fieldů mohou být překonány novou metodou, v oblasti vizuální kvality, paměťových požadavků a časové náročnosti. Nová metoda navržena v této práci umožňuje využití light fieldů v reálném čase bez zhoršení vizuální kvality a bez nadměrných hardwarových požadavků. Hypotéza je experimentálně dokázána a podpořena referenčními implementacemi a publikovanými články. Práce obsahuje i další nové návrhy, které slouží jako podklady pro hlavní metodu. Tyto návrhy řeší zásadní problémy při vykreslování light fieldů. Hlavním přínosem práce je otevření cesty k využití light fieldů v herním a filmovém průmyslu. Tato práce obsahuje přehled stávajících nejmodernějších metod, hypotézu s experimentálním důkazem a popis navrhovaných aplikací light fieldů na 3D displejích.
  • Item
    Biologií inspirované řízení kráčivého robota
    (Vysoké učení technické v Brně. Fakulta informačních technologií, ) Žák, Marek; Zbořil, František; Musílek, Petr; Ondráček, Tomáš
    Mobilní roboti se stávají součástí každodenního života. Jsou konstruováni nejrůznější roboti, kteří dokáží provádět celou řadů různých úkolů nebo se pohybovat i v místech, kam lidé nemohou. Jejich využití lze najít při záchranných operacích nebo při průzkumu těžko dostupných míst na Zemi nebo ve vesmíru. Kráčiví roboti tvoří speciální kategorii mobilních robotů, protože se svými vlastnostmi výrazně odlišují od jiných typů robotů. Dokáží se pohybovat v členitém terénu, překonávat různé překážky a mohou využívat svoje končetiny k manipulaci s okolními předměty. Přestože jsou kráčiví roboti skvěle vybaveni pro pohyb v náročném terénu, jejich běžnějšímu užívání zatím brání řada faktorů. Jejich pohyb je relativně pomalý a energeticky náročný, unesou poměrně málo nákladu a jejich konstrukce je mnohem složitější v porovnání s kolovými nebo pásovými roboty. Kráčiví roboti často disponují desítkami kloubů, a jejich řízení je proto velmi složité. Tato dizertační práce popisuje návrh, konstrukci a řízením nového biologií inspirovaného šestinohého robota WHexaR (z anglického Wheeled Hexapod Robot, kolový šestinohý robot), kterého jsem postavil. Tento robot je schopen energeticky úsporného pohybu ve členitém terénu. Struktura jeho končetin je inspirována stavbou končetiny hmyzu. Robot dokáže přizpůsobit svůj pohyb okolnímu terénu. Speciální trochanterový kloub umožňuje natočení celé končetiny robota rovnoběžně s gravitačním zrychlením, což vede ke snížení spotřeby energie, zvýšení stability robota a schopnosti překonávat strmější svahy. Pro pohyb na rovné terénu je robot vybaven natočitelnými koly, díky kterým se robot může pohybovat vyšší rychlostí s nižší energetickou spotřebou než při pohybu pomocí chůze. Navržený kontrolér robota disponuje řadou reflexů, které byly pozorovány u hmyzu. Tyto reflexy zvyšují efektivitu pohybu robota ve členitém terénu a umožňují mu překonávat různé překážky. Robot byl podroben řadě experimentů, které prokázaly jeho schopnosti pohybu ve členitém a svažitém terénu.
  • Item
    Od modulárních k celostním systémům diarizace řečníka
    (Vysoké učení technické v Brně. Fakulta informačních technologií, ) Landini, Federico Nicolás; Burget, Lukáš; Ganapathy, Sriram; Bredin, Herve
    Diarizace mluvčího se obvykle popisuje jako úloha, která určuje, "kdo kdy mluvil" v nahrávce. Ještě před několika lety byly všechny konkurenceschopné přístupy modulární, tj. detekce hlasové aktivity, segmentace, extrakce embeddingů, shlukování a detekce a zpracování překrývající se řeči byly řešeny různými subsystémy a aplikovány jeden po druhém. Takto konstruované systémy dosahovaly ve většině scénářů nejlepších výsledků, ale měly velké potíže vypořádat se s překrývající se řečí. V poslední době vzbudil velkou pozornost nástup end-to-end modelů, které jsou schopny řešit všechny aspekty diarizace mluvčího pomocí jediného modelu a mají lepší úspěšnost, pokud jde o překrývající se řeč.   Tato práce vznikla v období koexistence těchto dvou trendů. Popisujeme systém založený na bayesovském skrytém Markovově modelu používaném ke shlukování x-vektorů (embeddingů mluvčích získaných pomocí neuronové sítě), známý jako VBx, který prokázal pozoruhodnou úspěšnost na různých souborech dat a evaluačních v různých kampaních. Popíšeme jeho výhody a omezení a vyhodnotíme výsledky na různých relevantních korpusech. Poté přejdeme k metodám end-to-end neuronové diarizace (EEND). Vzhledem k potřebě velkých trénovacích sad pro trénování těchto modelů a nedostatku ručně anotovaných diarizačních dat v dostatečném množství spočívá kompromisní řešení v umělém generování trénovacích dat. Popíšeme přístup ke generování syntetických dat, která se z hlediska změn a překryvů mluvčích podobají skutečným rozhovorům. Ukážeme, jak tato metoda generování simulovaných konverzací umožňuje dosáhnout lepší úspěšnosti než dříve navržená metoda vytváření simulovaných směsí při trénování populárního EEND s enkodér-dekodér atraktory (EEND-EDA). Navrhneme také nový model založený na EEND, který nazýváme DiaPer, a ukážeme, že může dosáhnout lepších výsledků než EEND-EDA, zejména při práci s mnoha mluvčími a při zpracování překrývající se řeči. Nakonec porovnáváme oba systémy, VBx i DiaPer, na široké škále datových sad a prodiskutejeme výhody každého z nich.
  • Item
    Automatická kalibrace dohledové kamery pozorováním rigidních objektů
    (Vysoké učení technické v Brně. Fakulta informačních technologií, ) Bartl, Vojtěch; Herout, Adam; Buchholz, Michael; Hurtík, Petr
    Tato práce je zaměřena na automatickou kalibraci kamery na základě vícečetných pozorování libovolných rigidních předmětů. Na základě pozorování rigidních objektů pohybujících se ve společné rovině jsme schopni kalibrovat kameru vzhledem ke společné rovině, a tak jsme schopni provádět měření ve scéně. Objekty v rovině obrazu jsou detekovány a klasifikovány a význačné body na těchto objektech jsou lokalizovány. Motivací bylo použití těchto metod v dopravním prostředí, proto naše "objekty" jsou nejčastěji vozidla. Navrhujeme tři různé metody, které jsou schopny vypočítat kalibraci kamery na základě těchto lokalizovaných význačných bodů v rovině obrazu s jediným omezením - musí být známy 3D modely, ale ty mohou být známy kalibračnímu systému ještě před samotnou kalibrací. Proces kalibrace kamery je pak plně automatický a žádné další informace nejsou již potřeba. Na rozdíl od předchozích aktuálních metod pro automatickou kalibraci kamery, navržené metody jsou schopny odhadnout všechny parametry kamery (včetně ohniskové vzdálenosti). Vytvořili jsme rovněž nový dataset BrnoCarPark , který obsahuje záznamy různých scén a detekovaná vozidla spolu s lokalizovanými význačnými body. K dispozici jsou měření vzdáleností ve scénách, která mohou být přepočítány pomocí vypočtených parametrů kalibrace kamery. Všechny navrhované metody překonávají současné aktuální metody. Vyhodnotili jsme naše metody na zkonstruovaném datasetu a také dalším datasetu BrnoCompSpeed . Také jsme provedli experimenty na syntetických datech, které prokazují stabilitu a použitelnost navrhovaných metod.
  • Item
    Kroky ke zlepšení metod počítačového vidění pro analýzu dopravy
    (Vysoké učení technické v Brně. Fakulta informačních technologií, ) Špaňhel, Jakub; Herout, Adam; Sablatnig, Robert; Šikudová, Elena
    Rostoucí urbanizace a zvyšující se počet vozidel na silnicích přetěžují tradiční systémy řízení dopravy na hranici jejich možností. Řešení nabízejí inteligentní dopravní systémy (ITS), které využívají pokročilé technologie ke zvýšení plynulosti a bezpečnosti dopravy. Zásadní oblastí, kterou je třeba zlepšit, však zůstává robustnost metod počítačového vidění v rámci ITS, které jsou nezbytné pro analýzu dopravy.  Tato práce přispívá k této oblasti, konkrétně se zaměřuje na přesné (fine-grained) rozpoznávání vozidel, reidentifikaci vozidel, rozpoznávání registračních značek a monokulární měření rychlosti vozidel. Bylo představeno několik nových datových sad, vysoce ceněných výzkumnou komunitou, které rozšiřují hodnocení a zkoumání v každé z výše uvedených oblastí.     Hlavní přínosy lze shrnout následovně: Nové technicky augmentace pro přesné rozpoznávání vozidel & rozšíření dříve publikované datové sady. Nová metoda agregace vizuálních znaků pro re-identifikaci vozidel & datová sada. Inovativní přístup k rozpoznávání registračních značek pomocí zarovnání registrační značky a holistického rozpoznávání & tři publikované datové sady. Největší datová sada pro měření rychlosti vozidel & stanovení výchozího vyhodnocení s dostupnými metodami vizuálního meření rychlosti. Klíčová zjištění této práce prokazují významné zvýšení přesnosti, účinnosti a robustnosti metod počítačového vidění aplikovaných na analýzu dopravy.  Přínosy tohoto výzkumu byly oceněny na nejvýznamnějších konferencích a v časopisech v oblasti ITS a stanovují nové standardy pro budoucí práci.  Tím, že tato práce posunula současný stav ITS a přispěla cennými zdroji pro probíhající výzkum, představuje zásadní krok směrem k udržitelnějším, efektivnějším a inteligentnějším dopravním systémům. Má důsledky pro řízení dopravy a širší společenský cíl vytvořit citlivější a přizpůsobivější městské prostředí.