Efektivní implementace vysoce náročných algoritmů na vícejádrových procesorech
Loading...
Date
Authors
Tomečko, Lukáš
ORCID
Advisor
Referee
Mark
D
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Cieľom tejto práce je paralelizovať a vektorizovať simuláciu toku kvapalín. Dosiahne sa to pomocou knižnice OpenMP a prekladaču od Intelu. Implementované boli rôzne prístupy k problému, ako napr. cache blocking, zoraďovanie dát počas behu a dočasné reorganizovanie dát v pamäti. Skombinovaním najrýchlejších riešení sa podarilo simuláciu celkovo zrýchliť 11,4krát na 16 jadrách, pričom testy prebiehali na ostravskom superpočítači Anselm. Výsledky ukazujú, že výsledná aplikácia dobre škáluje s pribúdajúcim počtom jadier. Ďalej, vektorizovanie daného problému bolo možné len čiastočne z dôvodu nevhodného spôsobu práce s dátami.
This thesis describes the process of parallelization and vectorization of fluid simulation using OpenMP library and Intel compiler. Various approaches were tried e.g. cache blocking, data sorting and data reorganization. By combining the best of them, final application preformed 11.4 times faster than the original one, using 16 cores. Benchmarks show that used algorithms are not suitable for vectorization.
This thesis describes the process of parallelization and vectorization of fluid simulation using OpenMP library and Intel compiler. Various approaches were tried e.g. cache blocking, data sorting and data reorganization. By combining the best of them, final application preformed 11.4 times faster than the original one, using 16 cores. Benchmarks show that used algorithms are not suitable for vectorization.
Description
Citation
TOMEČKO, L. Efektivní implementace vysoce náročných algoritmů na vícejádrových procesorech [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
doc. Ing. Josef Schwarz, CSc. (předseda)
doc. Ing. Ondřej Ryšavý, Ph.D. (místopředseda)
Dr. Ing. Petr Peringer (člen)
Ing. Igor Szőke, Ph.D. (člen)
doc. Ing. Zdeněk Vašíček, Ph.D. (člen)
Date of acceptance
2016-06-13
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " D ". Otázky u obhajoby: Z jakého důvodu jsou při násobení matic zcela vypnuty optimalizace kompilátoru (-O0)? Je možné použít pro vytvořené aplikace jiný překladač než ten od společnosti Intel (např. GNU C++)? Jaké zde vidíte případné problémy? Jaký počet vláken by byl ve Vámi optimalizované aplikaci (teoreticky) použitelný, pro který by bylo možné s uvedeným nastavením pozorovat zrychlení? Zdůvodněte. Můžete více objasnit smysl 2D simulace kapaliny?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení