Systém pro správu distribuovaných kontejnerizovaných výpočtů
| but.committee | doc. Ing. Martin Čadík, Ph.D. (předseda) doc. Ing. Vítězslav Beran, Ph.D. (člen) prof. RNDr. Alexandr Meduna, CSc. (člen) Ing. Tomáš Milet, Ph.D. (člen) Ing. Zdeněk Materna, Ph.D. (člen) Ing. David Bařina, Ph.D. (člen) | cs |
| but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. | cs |
| but.jazyk | angličtina (English) | |
| but.program | Informační technologie a umělá inteligence | cs |
| but.result | práce byla úspěšně obhájena | cs |
| dc.contributor.advisor | Rychlý, Marek | en |
| dc.contributor.author | Kováč, Kristián | en |
| dc.contributor.referee | Jeřábek, Kamil | en |
| dc.date.created | 2025 | cs |
| dc.description.abstract | This work addresses the challenges of secure, distributed genomic data processing by developing a workflow runner as part of the Genomic Data Infrastructure (GDI) compute product. Built on Snakemake, the system integrates robust authentication and authorization via the OAuth standard and uses GA4GH Passports for fine-grained access control. Workflow tasks are managed through the Task Execution Service (TES) API, backed by Funnel, while sensitive input data remains securely stored in the Sensitive Data Archive (SDA) and is only accessible with valid user credentials. The system ensures long-running computations remain authorized by implementing token refreshing within a custom Snakemake executor plugin. A web-based dashboard allows users to select and run predefined workflows, monitor job statuses, and access live logs. Support for federated computation enables workflows to operate across multiple locations, each with its own Funnel instance and SDA, maintaining data isolation and security. The platform is designed to run in both Kubernetes-based deployments and demonstration environments using Docker Compose. The system demonstrates a secure and scalable approach for managing distributed genomic analyses in sensitive environments. | en |
| dc.description.abstract | Táto práca sa zaoberá výzvami bezpečného a distribuovaného spracovania genomických dát vývojom workflow runnera ako súčasti výpočtovej platformy Genomic Data Infrastructure (GDI). Systém je postavený na nástroji Snakemake, integruje autentizáciu a autorizáciu prostredníctvom štandardu OAuth a využíva GA4GH Passport pre detailné riadenie prístupov. Úlohy workflowu sú spravované cez Task Execution Service (TES) API, ktoré je implementované systémom Funnel, zatiaľ čo citlivé vstupné dáta zostávajú bezpečne uložené~v~Sensitive Data Archive (SDA) a sú prístupné len na základe platných používateľských poverení. Systém zabezpečuje, aby aj dlhotrvajúce výpočty boli neustále autorizované, a to implementáciou obnovovania tokenov v rámci vlastného Snakemake executor pluginu. Webové rozhranie umožňuje používateľom vyberať a spúšťať preddefinované workflowy, sledovať ich stav počas behu a pristupovať k ich logom v reálnom čase. Podpora federovaného výpočtu umožňuje workflowom bežať naprieč rôznymi miestami, pričom každé z nich má vlastnú inštanciu Funnelu a SDA, čo zaručuje vysokú úroveň izolácie a~bezpečnosti dát. Platforma je navrhnutá tak, aby fungovala v prostredí Kubernetes, ale taktiež aj v demonštračných inštaláciách pomocou Docker Compose. Systém prezentuje bezpečný a škálovateľný prístup k správe distribuovaných genomických analýz v citlivých prostrediach. | cs |
| dc.description.mark | A | cs |
| dc.identifier.citation | KOVÁČ, K. Systém pro správu distribuovaných kontejnerizovaných výpočtů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025. | cs |
| dc.identifier.other | 164570 | cs |
| dc.identifier.uri | http://hdl.handle.net/11012/254962 | |
| dc.language.iso | en | cs |
| dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
| dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
| dc.subject | Genomic Data Infrastructure | en |
| dc.subject | Distributed computation | en |
| dc.subject | Snakemake | en |
| dc.subject | Task Execution Service | en |
| dc.subject | Funnel | en |
| dc.subject | Sensitive Data Archive | en |
| dc.subject | OAuth | en |
| dc.subject | GA4GH Visa | en |
| dc.subject | Správa workflowov | en |
| dc.subject | Analýza genomických dát | en |
| dc.subject | Genomic Data Infrastructure | cs |
| dc.subject | Distribuované výpočty | cs |
| dc.subject | Snakemake | cs |
| dc.subject | Task Execution Service | cs |
| dc.subject | Funnel | cs |
| dc.subject | Sensitive Data Archive | cs |
| dc.subject | OAuth | cs |
| dc.subject | GA4GH Visa | cs |
| dc.subject | Workflow management | cs |
| dc.subject | Genomic data analysis | cs |
| dc.title | Systém pro správu distribuovaných kontejnerizovaných výpočtů | en |
| dc.title.alternative | A System for Distributed Computation Task Management in Containers | cs |
| dc.type | Text | cs |
| dc.type.driver | masterThesis | en |
| dc.type.evskp | diplomová práce | cs |
| dcterms.dateAccepted | 2025-06-24 | cs |
| dcterms.modified | 2025-06-24-15:55:09 | cs |
| eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
| sync.item.dbid | 164570 | en |
| sync.item.dbtype | ZP | en |
| sync.item.insts | 2025.08.27 02:04:27 | en |
| sync.item.modts | 2025.08.26 19:43:15 | en |
| thesis.discipline | Počítačové vidění | cs |
| thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémů | cs |
| thesis.level | Inženýrský | cs |
| thesis.name | Ing. | cs |
