Systém pro správu distribuovaných kontejnerizovaných výpočtů

but.committeedoc. Ing. Martin Čadík, Ph.D. (předseda) doc. Ing. Vítězslav Beran, Ph.D. (člen) prof. RNDr. Alexandr Meduna, CSc. (člen) Ing. Tomáš Milet, Ph.D. (člen) Ing. Zdeněk Materna, Ph.D. (člen) Ing. David Bařina, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.cs
but.jazykangličtina (English)
but.programInformační technologie a umělá inteligencecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorRychlý, Mareken
dc.contributor.authorKováč, Kristiánen
dc.contributor.refereeJeřábek, Kamilen
dc.date.created2025cs
dc.description.abstractThis work addresses the challenges of secure, distributed genomic data processing by developing a workflow runner as part of the Genomic Data Infrastructure (GDI) compute product. Built on Snakemake, the system integrates robust authentication and authorization via the OAuth standard and uses GA4GH Passports for fine-grained access control. Workflow tasks are managed through the Task Execution Service (TES) API, backed by Funnel, while sensitive input data remains securely stored in the Sensitive Data Archive (SDA) and is only accessible with valid user credentials. The system ensures long-running computations remain authorized by implementing token refreshing within a custom Snakemake executor plugin. A web-based dashboard allows users to select and run predefined workflows, monitor job statuses, and access live logs. Support for federated computation enables workflows to operate across multiple locations, each with its own Funnel instance and SDA, maintaining data isolation and security. The platform is designed to run in both Kubernetes-based deployments and demonstration environments using Docker Compose. The system demonstrates a secure and scalable approach for managing distributed genomic analyses in sensitive environments.en
dc.description.abstractTáto práca sa zaoberá výzvami bezpečného a distribuovaného spracovania genomických dát vývojom workflow runnera ako súčasti výpočtovej platformy Genomic Data Infrastructure (GDI). Systém je postavený na nástroji Snakemake, integruje autentizáciu a autorizáciu prostredníctvom štandardu OAuth a využíva GA4GH Passport pre detailné riadenie prístupov. Úlohy workflowu sú spravované cez Task Execution Service (TES) API, ktoré je implementované systémom Funnel, zatiaľ čo citlivé vstupné dáta zostávajú bezpečne uložené~v~Sensitive Data Archive (SDA) a sú prístupné len na základe platných používateľských poverení. Systém zabezpečuje, aby aj dlhotrvajúce výpočty boli neustále autorizované, a to implementáciou obnovovania tokenov v rámci vlastného Snakemake executor pluginu. Webové rozhranie umožňuje používateľom vyberať a spúšťať preddefinované workflowy, sledovať ich stav počas behu a pristupovať k ich logom v reálnom čase. Podpora federovaného výpočtu umožňuje workflowom bežať naprieč rôznymi miestami, pričom každé z nich má vlastnú inštanciu Funnelu a SDA, čo zaručuje vysokú úroveň izolácie a~bezpečnosti dát. Platforma je navrhnutá tak, aby fungovala v prostredí Kubernetes, ale taktiež aj v demonštračných inštaláciách pomocou Docker Compose. Systém prezentuje bezpečný a škálovateľný prístup k správe distribuovaných genomických analýz v citlivých prostrediach.cs
dc.description.markAcs
dc.identifier.citationKOVÁČ, K. Systém pro správu distribuovaných kontejnerizovaných výpočtů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.cs
dc.identifier.other164570cs
dc.identifier.urihttp://hdl.handle.net/11012/254962
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectGenomic Data Infrastructureen
dc.subjectDistributed computationen
dc.subjectSnakemakeen
dc.subjectTask Execution Serviceen
dc.subjectFunnelen
dc.subjectSensitive Data Archiveen
dc.subjectOAuthen
dc.subjectGA4GH Visaen
dc.subjectSpráva workflowoven
dc.subjectAnalýza genomických dáten
dc.subjectGenomic Data Infrastructurecs
dc.subjectDistribuované výpočtycs
dc.subjectSnakemakecs
dc.subjectTask Execution Servicecs
dc.subjectFunnelcs
dc.subjectSensitive Data Archivecs
dc.subjectOAuthcs
dc.subjectGA4GH Visacs
dc.subjectWorkflow managementcs
dc.subjectGenomic data analysiscs
dc.titleSystém pro správu distribuovaných kontejnerizovaných výpočtůen
dc.title.alternativeA System for Distributed Computation Task Management in Containerscs
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2025-06-24cs
dcterms.modified2025-06-24-15:55:09cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid164570en
sync.item.dbtypeZPen
sync.item.insts2025.08.27 02:04:27en
sync.item.modts2025.08.26 19:43:15en
thesis.disciplinePočítačové viděnícs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémůcs
thesis.levelInženýrskýcs
thesis.nameIng.cs

Files

Original bundle

Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
2.49 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_164570.html
Size:
7.78 KB
Format:
Hypertext Markup Language
Description:
file review_164570.html

Collections