Efektivní implementace vysoce náročných algoritmů na vícejádrových procesorech

Loading...
Thumbnail Image

Date

Authors

Tomečko, Lukáš

Mark

D

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Cieľom tejto práce je paralelizovať a vektorizovať simuláciu toku kvapalín. Dosiahne sa to pomocou knižnice OpenMP a prekladaču od Intelu. Implementované boli rôzne prístupy k problému, ako napr. cache blocking, zoraďovanie dát počas behu a dočasné reorganizovanie dát v pamäti. Skombinovaním najrýchlejších riešení sa podarilo simuláciu celkovo zrýchliť 11,4krát na 16 jadrách, pričom testy prebiehali na ostravskom superpočítači Anselm. Výsledky ukazujú, že výsledná aplikácia dobre škáluje s pribúdajúcim počtom jadier. Ďalej, vektorizovanie daného problému bolo možné len čiastočne z dôvodu nevhodného spôsobu práce s dátami.
This thesis describes the process of parallelization and vectorization of fluid simulation using OpenMP library and Intel compiler. Various approaches were tried e.g. cache blocking, data sorting and data reorganization. By combining the best of them, final application preformed 11.4 times faster than the original one, using 16 cores. Benchmarks show that used algorithms are not suitable for vectorization.

Description

Citation

TOMEČKO, L. Efektivní implementace vysoce náročných algoritmů na vícejádrových procesorech [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Informační technologie

Comittee

doc. Ing. Josef Schwarz, CSc. (předseda) doc. Ing. Ondřej Ryšavý, Ph.D. (místopředseda) Dr. Ing. Petr Peringer (člen) Ing. Igor Szőke, Ph.D. (člen) doc. Ing. Zdeněk Vašíček, Ph.D. (člen)

Date of acceptance

2016-06-13

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " D ". Otázky u obhajoby: Z jakého důvodu jsou při násobení matic zcela vypnuty optimalizace kompilátoru (-O0)? Je možné použít pro vytvořené aplikace jiný překladač než ten od společnosti Intel (např. GNU C++)? Jaké zde vidíte případné problémy? Jaký počet vláken by byl ve Vámi optimalizované aplikaci (teoreticky) použitelný, pro který by bylo možné s uvedeným nastavením pozorovat zrychlení? Zdůvodněte. Můžete více objasnit smysl 2D simulace kapaliny?

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO