Optimalizace platformy pro distribuované výpočty Hadoop
Loading...
Date
Authors
Čecho, Jaroslav
ORCID
Advisor
Referee
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Tato diplomová práce se zabývá možnostmi optimalizace frameworku Hadoop za pomocí platformy CUDA. Apache Hadoop je frameworku umožnující analýzu obrovských objemů dat. Obsahuje distribuovaný souborový systém a implementaci programovacího paradigmatu mapreduce s jehož pomocí se poté píší uživatelské aplikace. Platforma CUDA firmy NVIDIA umožnuje využít výkon grafické karty počítače i k jiným účelům než je generování grafického výstupu na zobrazovací zařízení počítače. Má prace obsahuje seznam a experimentální implementaci výpočtů frameworku Hadoop vhodných k přesunu z hlavního procesoru počítače na grafickou kartu za účelem dosáhutí časové optimalizace běžících mapreduce aplikací.
This thesis is focusing on possibilities of improving the Apache Hadoop framework by outsourcing some computation to a graphic card using the NVIDIA CUDA technology. The Apache Hadoop software library is a framework that allows for the distributed processing of large data sets across clusters of computers using a simple programming model called mapreduce. NVIDIA CUDA is a platform which allows one to use a graphic card for a general computation. This thesis contains description and experimental implementations of suitable computation inside te Hadoop framework that can benefit from being executed on a graphic card.
This thesis is focusing on possibilities of improving the Apache Hadoop framework by outsourcing some computation to a graphic card using the NVIDIA CUDA technology. The Apache Hadoop software library is a framework that allows for the distributed processing of large data sets across clusters of computers using a simple programming model called mapreduce. NVIDIA CUDA is a platform which allows one to use a graphic card for a general computation. This thesis contains description and experimental implementations of suitable computation inside te Hadoop framework that can benefit from being executed on a graphic card.
Description
Citation
ČECHO, J. Optimalizace platformy pro distribuované výpočty Hadoop [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2012.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Inteligentní systémy
Comittee
prof. Ing. Tomáš Vojnar, Ph.D. (předseda)
prof. Ing. Lukáš Sekanina, Ph.D. (místopředseda)
Ing. Martin Hrubý, Ph.D. (člen)
doc. Ing. Jan Janoušek, Ph.D. (člen)
RNDr. Marek Rychlý, Ph.D. (člen)
doc. Ing. František Zbořil, Ph.D. (člen)
Date of acceptance
2012-06-21
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Navrhněte praktické příklady použití, ve kterém vaše řešení bude dosahovat lepších výsledků než v nativní Java implementaci.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení