Akcelerace ultrazvukových simulací pomocí multi-GPU systémů

Loading...
Thumbnail Image

Date

Authors

Stodůlka, Martin

Mark

E

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

V této práci je kladen důraz na multi - GPU systémy a využití CUDA unifikované paměti.Hlavním cílem je akcelerovat výpočet 3D FFT, který je hlavní součástí simulací knihovny k- Wave .K- Wave je C++/ Matlab knihovna určena pro simulaci šíření ultrazvukových vln v 1D , 2D nebo 3D prostoru.Akcelerace těchto funkcí je potřebná, jelikož se jedná o výpočetně náročně simulace.
The main focus of this project is usage of multi - GPU systems and usage of CUDA unified memory . Its goal is to accelerate computation of 2D and 3D FFT, which is the main part of simulations in k- Wave library .K- Wave is a C++/ Matlab library used for simulations of propagation of ultrasonic waves in 1D , 2D or 3D space . Acceleration of these functions is necessary , because the simulations are computationally intensive .

Description

Citation

STODŮLKA, M. Akcelerace ultrazvukových simulací pomocí multi-GPU systémů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2021.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Superpočítání

Comittee

prof. Ing. Lukáš Sekanina, Ph.D. (předseda) doc. Ing. Jiří Jaroš, Ph.D. (místopředseda) doc. Ing. Michal Bidlo, Ph.D. (člen) prof. RNDr. Milan Češka, CSc. (člen) doc. Ing. Tomáš Martínek, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen)

Date of acceptance

2021-06-22

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm E. Otázky u obhajoby: Ve vyhodnocení operace broadcast zmiňujete, že propustnost může být omezena komunikací mezi CPU a každým GPU samostatně. Jakým způsobem by bylo možné tento problém odstranit? Jak se tento problém obvykle řeší v systémech s mnoha uzly? V textu práce na několika místech popisujete, že daná úloha byla příliš krátká a nebylo tedy možné dosáhnout dostatečné přesnosti měření. Jakým způsobem se tento problém obvykle řeší? Jaké prostředky pro přesné měření délky vykonávání operací na GPU nabízí CUDA a proč je nebylo možné použít? Jak by bylo navržené řešení možné rozšířit, tak aby umožnilo efektivní zpracování simulačních domén vetších než paměť jednoho GPU?

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO