Umělá neuronová síť pro rekonstruování vymřelých druhů

but.committeeProf. Ing. Roman Prokop, CSc. (předseda) doc. Ing. Václav Jirsík, CSc. (místopředseda) Ing. Peter Honec, Ph.D. (člen) Ing. Stanislav Pikula, Ph.D. (člen) Ing. Miloslav Richter, Ph.D. (člen) Ing. Soběslav Valach (člen)cs
but.defenceStudent obhájil bakalářskou práci s výhradami. V rámci obhajoby dokázal přesvědčit komisi o správnosti svých postupů a navrženého řešení. V průběhu odborné rozpravy reagoval na dotazy: Bylo v obrázcích i pozadí? Víte kdo byl John Nash? Jak by se data dala validovat?cs
but.jazykčeština (Czech)
but.programAutomatizační a měřicí technikacs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorJirsík, Václavcs
dc.contributor.authorPešek, Davidcs
dc.contributor.refereeBilík, Šimoncs
dc.date.created2023cs
dc.description.abstractTato práce se zabývala navrhnutím, naučením a zhodnocením umělé neuronové sítě pro rekonstrukci vymřelých živočišných druhů. Nejprve byl vybrán hlavní prvek navrhované UNS, tedy generativní model. Vzhledem k jejich výborným výsledkům v poli generování obrázků se odůvodněně jevila třída difúzních modelů jako správná volba. Konkrétně byl vybrán difúzí model Stable diffusion. Jeden z počátečních kroků práce bylo také vytvořit trénovací množinu pro navrhovaný model. K obrázkům živočichů bylo potřeba napárovat nějaké popisky, podle kterých by se dal živočich identifikovat. K tomuto účelu byly využity geny cyklooxygenázy-1 daných živočichů. Dále byl použit sekvenční transformátorový model GPT-2, který je naučen na trénovací množině lidského přirozeného jazyka. Tento model byl použitý pro zakódování DNA sekvencí do vektorové podoby, ve které byla zachycena sémantika a kontext mezi jednotlivými částmi DNA sekvence. Modely by bylo velmi složité učit od začátku kvůli velké potřebné velikosti trénovací množiny a výpočetní a časové náročnosti. GPT-2 model byl tedy pouze doučen na trénovací množině DNA sekvencí řádu pěvců a samotný difúzní model byl naučen na párech obrázků těchto živočichů a DNA sekvencí zakódovaných pomocí GPT-2 modelu. Pro generování obrázků byly pomocí GPT-2 generovány originální DNA sekvence, které se podobaly sekvencím z trénovací množiny. Následně bylo zakódování těchto sekvencí předáno difúznímu modelu, který vytvořil samotné obrázky. Metoda generování nových DNA sekvencí pomocí GPT-2 modelu stojí na myšlence, že vygenerovaná DNA sekvence se částečně podobá DNA sekvencím z trénovací množiny. Takto experimentálně vygenerované DNA sekvence se mohou podobat DNA sekvencím vymřelých předků nebo příbuzných řádu pěvců. Model byl schopný v části případů vygenerovat takové obrázky, které lze na pohled považovat za živočišný druh, ale je nutno konstatovat, že vygenerované obrázky často nešlo považovat za rekonstrukce živočichů. Úspěšnost vygenerování obstojného obrázku živočicha byla přibližně 10%. Funkčnost modelu byla testována i na testovací množině DNA sekvencí živočichů několika řádů, které spadají pod třídu ptáků stejně jako řád pěvců. Úspěšnost vygenerování rekonstrukce, kterou bylo možné porovnávat s fotografií se pohybovala okolo 15%.cs
dc.description.abstractThis work was focused on designing, learning and evaluating an artificial neural network for reconstructing extinct species. First, the main element of the proposed artificial neural network, i.e., the generative model, was selected. Given their excellent performance in the field of image generation, the class of diffusion models reasonably seemed to be the right choice. Specifically, the Stable diffusion model was chosen. One of the initial steps of the work was to create a training set for the proposed model. The animal images needed to be paired with some labels that could be used to identify the animal. For this purpose, the cytochrome c oxidase subunit I genes of the given animals were used. Furthermore, the sequential transformer model GPT-2, which is learned on the training set of human natural language, was used. This model was used to encode the DNA sequences into a vector form in which the semantics and context between the different parts of the DNA sequence were captured. The models would be very difficult to learn from scratch due to the large training set size required and the computational and time requirements. Thus, the GPT-2 model was only learned on the training set of DNA sequences of the passeriformes order, and the diffusion model itself was learned on pairs of images of these animals and DNA sequences encoded by the GPT-2 model. To generate the images, the original DNA sequences that resembled the sequences from the training set were generated using GPT-2. The encoding of these sequences was then passed to the diffusion model, which generated the images itself. The method of generating new DNA sequences using the GPT-2 model is based on the idea that the generated DNA sequence partially resembles the DNA sequences from the training set. Such experimentally generated DNA sequences may resemble DNA sequences of extinct ancestors or relatives of the passeriformes order. The model was in some cases able to generate images that could be considered as animal species , but it should be noted that often the generated images could not be considered as animal reconstructions. The success rate of generating a decent animal image was approximately 10%. The functionality of the model was also tested on a test set of DNA sequences of animals of several orders that fall under the class of birds as well as the order of passeriformes. The success rate of generating a reconstruction that could be compared to a photograph was around 5%.en
dc.description.markCcs
dc.identifier.citationPEŠEK, D. Umělá neuronová síť pro rekonstruování vymřelých druhů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2023.cs
dc.identifier.other151786cs
dc.identifier.urihttp://hdl.handle.net/11012/210980
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectumělá neuronová síťcs
dc.subjectdifúzní modelycs
dc.subjectgenerativní modelycs
dc.subjectDNAcs
dc.subjectGPT-2cs
dc.subjectStable diffusioncs
dc.subjectcyklooxygenáza-1cs
dc.subjectptácics
dc.subjectpěvcics
dc.subjectvymřelé živočišné druhycs
dc.subjectpaleoartcs
dc.subjecttransformátorycs
dc.subjectVAEcs
dc.subjectGANcs
dc.subjectučení neuronových sítícs
dc.subjectartificial neural networken
dc.subjectdiffusion modelsen
dc.subjectgenerative modelsen
dc.subjectDNAen
dc.subjectGPT-2en
dc.subjectStable diffusionen
dc.subjectcytochrome c oxidase subunit Ien
dc.subjectbirdsen
dc.subjectsongbirdsen
dc.subjectextinct speciesen
dc.subjectpaleoarten
dc.subjecttransformersen
dc.subjectVAEen
dc.subjectGANen
dc.subjectneural network learningen
dc.titleUmělá neuronová síť pro rekonstruování vymřelých druhůcs
dc.title.alternativeA neural network for reconstruction of extinct animalsen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2023-06-13cs
dcterms.modified2023-06-15-13:47:26cs
eprints.affiliatedInstitution.facultyFakulta elektrotechniky a komunikačních technologiícs
sync.item.dbid151786en
sync.item.dbtypeZPen
sync.item.insts2025.03.17 16:28:52en
sync.item.modts2025.01.15 13:32:20en
thesis.disciplinebez specializacecs
thesis.grantorVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav automatizace a měřicí technikycs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
12.48 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
appendix-1.zip
Size:
22.53 KB
Format:
zip
Description:
appendix-1.zip
Loading...
Thumbnail Image
Name:
review_151786.html
Size:
6.6 KB
Format:
Hypertext Markup Language
Description:
file review_151786.html
Collections