Pokročilé kartézské genetické programování pro biomedicínské aplikace

Abstract

Genetické programování (GP) je evoluční algoritmus navržený ke tvorbě počítačových programů pomocí simulace principů přirozené evoluce. Využívá výpočet fitness, selekci a operátory křížení a mutace, aby v průběhu několika generací vyvinul postupně lépe fungující řešení vybraného problému. GP a jeho varianty byly úspěšně aplikovány na problémy z řady oblastí včetně symbolické regrese, zpracování obrazu a signálu, finančního modelování nebo návrh hyperheuristik, často za získání kompaktních a interpretovatelných řešení. Praktické využití GP však zůstává omezené, zejména kvůli problémům, jako jsou škálovatelnost, omezená složitost dosažitelných řešení, a výpočetní náročnost spojená s návrhem řešení pro komplexní reálné vícekriteriální problémy. Tato práce se zaměřuje na variantu GP známou jako kartézské genetické programování (CGP). Zkoumá pokročilé modifikace a adaptace pro řešení vybraných otevřených problémů a zlepšení schopnosti CGP řešit různé reálné klasifikační a predikční úlohy, zejména v biomedicínské informatice a bioinformatice. Práce se nejprve zaměřuje na redukci časové náročnosti CGP při práci s komplexními trénovacími datovými sadami (v kontextu CGP více než několik tisíc vektorů vstupních hodnot) pomocí využití technik aproximace fitness. Dále se snaží o snížení spotřeby energie navržených řešení pomocí využití aritmetiky s pevnou řádovou čárkou. Práce se také zkoumá různé přístupy k návrhu komplexních řešení, včetně kompoziční koevoluce jednotlivých komponent složitějšího systému. Koevoluční metoda je následovně dále upravena pro využití v nízkoenergetických systémech díky zaměření na vylepšený návrh klasifikátoru a vícekriteriální optimalizaci, což umožňuje klasifikaci levodopou indukované dyskineze přímo ve snímacím zařízení. Práce také zkoumá dvě nové aplikace CGP. Zaprvé přizpůsobuje výpočet skóre polygenního rizika (PRS) tak, aby byla využita symbolická regrese založená na CGP namísto tradičních metod lineární regrese. Zadruhé zkoumá koevoluci genetických algoritmů (GA) a CGP s cílem usnadnit rychlý návrh interpretovatelných klasifikátorů EEG dat v klasifikačních úlohách zaměřených na abúzus alkoholu a depresivní poruchu. Výsledky dosažené ve vybraných úlohách ukazují, že vylepšení CGP pomocí zavedení různých pokročilých technik mohou výrazně urychlit proces návrhu ve srovnání se základním CGP a mohou vést k získání řešení, která v určitých aspektech překonávají současné state-of-the-art řešení. Dosažené výsledky tedy podporují širší využití modifikovaného CGP na nové problémy, kde jsou kromě přesnosti řešení zásadní také další faktory jako vysvětlitelnost nebo hardwarové parametry řešení.
Genetic Programming (GP) is an evolutionary algorithm designed to create computer programs by simulating the principles of natural evolution. It utilises fitness calculation, selection, crossover, and mutation operators to, over the span of multiple generations, develop increasingly effective solutions to selected problems. GP and its variants have been successfully applied to various tasks and problem domains, including symbolic regression, image and signal processing, financial modelling, and hyper-heuristics, often resulting in compact and interpretable solutions. However, the practical use of GP remains limited, mainly due to issues such as scalability, the complexity constraints of the solutions it can generate, and the computational complexity connected with the design of solutions for complex real-world multi-objective tasks. This thesis focuses on a variant of GP known as Cartesian Genetic Programming (CGP). It explores advanced modifications and adaptations to address specific open issues and improve CGP’s performance in various real-world classification and prediction tasks, particularly within biomedical informatics and bioinformatics. The research first aims to enhance the time efficiency of CGP when dealing with complex training data sets (in the context of CGP, more than several thousand input vectors) by utilising fitness approximation techniques. It also seeks to reduce the energy consumption of the generated solutions through the use of fixed-point arithmetic. The study further evaluates different approaches to designing complex models, including the compositional coevolution of individual components of a computer system. Additionally, a coevolutionary pipeline is adapted for low-energy systems, focusing on improved classifier design and multi-objective optimisation, which enables the classification of Levodopa-induced dyskinesia directly within sensing units. The thesis also investigates two novel applications of CGP. First, it adapts the calculation of Polygenic Risk Scores (PRS) to leverage symbolic regression performed by CGP, instead of relying on traditional linear regression methods. Second, it explores the coevolution of Genetic Algorithms (GA) and CGP to facilitate the rapid design of interpretable classifiers of EEG data in the classification tasks related to Alcohol Use Disorder and Major Depressive Disorder. Results from these targeted applications indicate that the improvements made to CGP, through various additional techniques, can significantly accelerate the design process compared to baseline CGP and produce solutions that, in certain aspects, outperform current state-of-the-art alternatives. These results support the broader application of modified CGP to new problems, where accuracy and other factors, such as explainability and hardware efficiency, are essential.

Description

Citation

HURTA, M. Pokročilé kartézské genetické programování pro biomedicínské aplikace [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2026.

Document type

Document version

Date of access to the full text

Language of document

en

Study field

Informační technologie

Comittee

prof. Dr. Ing. Pavel Zemčík, dr. h. c. (předseda) doc. Ing. Petr Gajdoš, Ph.D. (člen) prof. RNDr. Martin Holeňa, CSc. (člen) doc. Ing. Pavel Kordík, Ph.D. (člen) prof. Ing. Roman Šenkeřík, Ph.D. (člen)

Date of acceptance

2026-01-21

Defence

Student přednesl cíle a výsledky, kterých v rámci řešení disertační práce dosáhl. V rozpravě student odpověděl na otázky komise a oponentů. Diskuze je zaznamenána na diskuzních lístcích, které jsou přílohou protokolu. Počet diskuzních lístků: 3. Komise se v závěru jednomyslně usnesla, že student splnil podmínky pro udělení akademického titulu doktor. The student presented the goals and results that he achieved within the solution of the dissertation. The student has competently answered the questions of the committee members and reviewers. The discussion is recorded on the discussion sheets, which are attached to the protocol. Number of discussion sheets: 3. The committee has agreed unanimously that the student has fulfilled the requirements for being awarded the academic title Ph.D.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO