Akcelerace algoritmů pro shlukování tunelů v proteinech

Loading...
Thumbnail Image

Date

Authors

Jaroš, Marta

Mark

C

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Práce se zabývá problémem shlukování tunelů z dat získaných molekulární dynamikou proteinů. Tento proces je velmi výpočetně náročný a představuje výzvu pro vědecké komunity. Cílem je najít algoritmus s optimálním poměrem časové a prostorové složitosti. Práce začíná rešerší shlukovacích algoritmů. Rovněž se zabývá způsobem, jak pracovat s velkými datovými sadami, způsobem vizualizace a porovnání výsledků shlukování. Jádro práce představuje návrh řešení tohoto problému s využitím algoritmu Twister Tries . Rozebírá jeho implementační detaily a poskytuje výsledky testování z hlediska kvality výsledků a výpočetní náročnosti. Cílem práce bylo experimentálně ověřit, zda stochastickým algoritmem  Twister Tries dosáhneme stejných výsledků jako s exaktním algoritmem ( average-linkage ). Tento předpoklad se nepovedlo jednoznačně potvrdit. Z poznatků při testování hashovacích funkcí vyplývá, že stejných výsledků jsme schopni dosáhnout i s funkcí, která pracuje na nízkém stupni dimenzionality, avšak v mnohem kratším výpočetním čase.
This thesis deals with the clustering of tunnels in data obtained from the protein molecular dynamics simulation. This process is very computationaly intensive and it has been a challenge for scientific communities. The goal is to find such an algorithm with optimal time and space complexity ratio. The research of clustering algorithms, work with huge highdimensional datasets, visualisation and cluster-comparing methods are discussed. The thesis provides a proposal of the solution of this problem using the Twister Tries algorithm. The implementation details are analysed and the testing results of the solution quality and space complexity are provided. The goal of the thesis was to prove that we could achieve the same results with a stochastic algorithm - Twister Tries , as with an exact algorithm ( average-linkage ). This assumption was not confirmed confidently. Another finding of the hashing functions analysis shows that we could obtain the same results of hashing with a low dimensional hashing function but in much better computational time.

Description

Citation

JAROŠ, M. Akcelerace algoritmů pro shlukování tunelů v proteinech [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Počítačové a vestavěné systémy

Comittee

doc. Ing. Zdeněk Kotásek, CSc. (předseda) doc. Dr. Ing. Otto Fučík (místopředseda) doc. Ing. Vladimír Janoušek, Ph.D. (člen) doc. Ing. Tomáš Martínek, Ph.D. (člen) doc. Ing. Stanislav Racek, CSc. (člen) doc. Ing. Ondřej Ryšavý, Ph.D. (člen)

Date of acceptance

2016-06-17

Defence

Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázku oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm " C ". Otázky u obhajoby: Můžete diskutovat, jakým způsobem by bylo nutné modifikovat hash funkci, aby se výsledky shlukovacího algoritmu Twister Tries ještě více přiblížili výsledkům exaktní metody výpočtu?

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO