Rozsáhlé simulace ultrazvuku za použití akcelerovaných clusterů

Loading...
Thumbnail Image
Date
ORCID
Mark
P
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Efektivní využití akcelerovaných HPC clusterů je obzvlášť závislé na efektivitě komunikace použitých algoritmů. Tato práce se tedy věnuje přezkoumání pseudo-spektrálních algorimů používaných pro řešení vlnových problémů převážně v oblasti medicínského ultrazvuku s cílem umožnit jejich běh na akcelerovaných strojích. Je ukázáno, že doménová dekompozice je preferovaný způsob dosažení daného cíle, jelikož řada alternativních přístupů vykazuje výrazně horší numerické vlastnosti. Na základě tohoto přístupu a k-Wave modelu ultrazvuku, široce používaného v medicíně, je navržen nový simulační algoritmus. Následnými experimenty je ukázáno, že tento přístup dosahuje až 7.5x zrychlení a dosahuje téměř perfektního slabého škálování až do 512 GPU akcelerovaných uzlů. Zároveň toto řešení umožňuje plné využití výpočetních uzlů s několika GPU akcelerátory a pokročilým propojením jako je NVIDIA DGX-2 s NVLink. Tato metoda také nabízí možnost flexibilní volby mezi přesností a efektivitou. Volbou hloubky překryvu subdomén lze dosáhnout jak přesnosti srovnatelné s původní k-Space metodou, tak i maximalizovat výkon při zachování dostatečné přesnosti.
Efficient utilization of accelerated HPC clusters is particularly sensitive to communication efficiency of deployed algorithms. In this thesis, we reexamine pseudo-spectral solvers for wave-like problems in medical ultrasonics to allow their deployment on these machines. The domain decomposition is shown to be a preferable approach to improving data locality of these solvers as a range  of suitable alternative discretizations exhibited considerably worse numerical properties. The local Fourier basis domain decomposition is then used to construct a novel solver based on the state of the art model for ultrasound in medicine -- k-Wave. We show that this approach is up to 7.5x faster and achieves almost perfect weak-scaling up to 512 GPU accelerated nodes, while being able to take full advantage of advanced GPU interconnects such as NVLink in NVIDIA DGX-2 multi-GPU nodes. The method offers flexible accuracy--efficiency trade off, which allows to nearly match accuracy of the global k-Space method or maximize performance at sufficient accuracy by subdomain overlap scaling.
Description
Citation
VAVERKA, F. Rozsáhlé simulace ultrazvuku za použití akcelerovaných clusterů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Výpočetní technika a informatika
Comittee
prof. Ing. Adam Herout, Ph.D. (předseda) prof. RNDr. Luděk Matyska, CSc. (člen) doc. Ing. Lubomír Říha, Ph.D. (člen) doc. Ing. Ivan Šimeček, Ph.D. (člen) prof. Ing. Tomáš Kozubek, Ph.D. (člen)
Date of acceptance
2023-06-26
Defence
Student přednesl cíle a výsledky, kterých v rámci řešení disertační práce dosáhl. V rozpravě student odpověděl na otázky komise a oponentů. Diskuze je zaznamenána na diskuzních lístcích, které jsou přílohou protokolu. Počet diskuzních lístků: 4. Komise se v závěru jednomyslně usnesla, že student splnil podmínky pro udělení akademického titulu doktor.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO