Taxonomie pro LLM v komponentě Kafka projektu Apache Camel

but.committeedoc. Ing. Jan Jeřábek, Ph.D. (předseda) JUDr. Ing. František Kasl, Ph.D. (místopředseda) Ing. Eva Holasová (člen) Ing. Michal Skořepa, Ph.D. (člen) Ing. Adrián Tomašov, Ph.D. (člen) RNDr. Ing. Pavel Šeda, Ph.D. (člen)cs
but.defenceStudent prezentoval výsledky své práce a komise byla seznámena s posudky. Otázky oponenta: Jak výrazné zlepšení kvality generovaného textu odhadujete v případě použití větší datové množiny a trénování s vyšším počtem iterací? Student obhájil bakalářskou práci s výhradami a odpověděl na otázky členů komise a oponenta.cs
but.jazykangličtina (English)
but.programInformační bezpečnostcs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorPhan, Viet Anhen
dc.contributor.authorKonovalov, Nikitaen
dc.contributor.refereeJežek, Štěpánen
dc.date.created2025cs
dc.description.abstractTato práce se zaměřuje na koncept umělé inteligence, konkrétně na velké jazykové modely (Large Language Models). Popisuje základní principy neuronových sítí a fáze trénování v oblasti umělé inteligence, strojového učení a jazykových modelů, přičemž se zabývá i výzvami efektivního trénování neuronových sítí. Práce dále zkoumá komponentu Kafka pro Apache Camel, její význam a využitelnost v kontextu trénování jazykových modelů. Hlavní část této práce se věnuje tvorbě taxonomie, která je klíčovým prvkem v procesu učení. Program pro extrakci a Annotation API mají produktovou kvalitu a byly napsány v jazyce Java. Práce ukazuje proces generování syntetických dat na základě poskytnuté kvalitativní taxonomie pomocí nástroje InstructLab a analýzu výsledků. Součástí práce je také ukázka procesu nasazení taxonomie na serveru Hugging Face.en
dc.description.abstractThis thesis focuses on the concept of artificial intelligence, specifically on Large Language Models. It describes the core principles of neural networks and the stages of training in artificial intelligence, machine learning, and language models, while addressing the challenges of efficient neural network training. Additionally, the thesis explores the Kafka component for Apache Camel, its significance, and applicability in the context of training language models. The main part of this thesis details the creation of a taxonomy, the most critical element in the training process. The extractor program and the Annotation API have product quality and was written in Java. This thesis shows the process of generating synthetic data based on the provided qualitative taxonomy using InstructLab and analysis of the results. Thesis also shows deployment process for the taxonomy on Hugging Face server.cs
dc.description.markDcs
dc.identifier.citationKONOVALOV, N. Taxonomie pro LLM v komponentě Kafka projektu Apache Camel [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.cs
dc.identifier.other167353cs
dc.identifier.urihttp://hdl.handle.net/11012/252973
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectUmělá inteligenceen
dc.subjectstrojové učeníen
dc.subjecthluboké učeníen
dc.subjectvelký jazykový modelen
dc.subjectzpracování přirozeného jazykaen
dc.subjectdataseten
dc.subjectmodelen
dc.subjectkomponenta Kafkaen
dc.subjectApache Camelen
dc.subjectútržek kóduen
dc.subjectsyntetická dataen
dc.subjectInstructLaben
dc.subjectHugging Faceen
dc.subjecttaxonomie.en
dc.subjectArtificial Intelligencecs
dc.subjectMachine Learningcs
dc.subjectDeep Learningcs
dc.subjectLarge Language Modelcs
dc.subjectNatural Language Processingcs
dc.subjectdatasetcs
dc.subjectmodelcs
dc.subjectKafka componentcs
dc.subjectApache Camelcs
dc.subjectcode snippetcs
dc.subjectInstructLabcs
dc.subjectsynthetic datacs
dc.subjectHugging Facecs
dc.subjecttaxonomy.cs
dc.titleTaxonomie pro LLM v komponentě Kafka projektu Apache Camelen
dc.title.alternativeTaxonomy for LLM in the Kafka Component of the Apache Camel Projectcs
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2025-06-17cs
dcterms.modified2025-06-19-09:29:59cs
eprints.affiliatedInstitution.facultyFakulta elektrotechniky a komunikačních technologiícs
sync.item.dbid167353en
sync.item.dbtypeZPen
sync.item.insts2025.08.26 20:04:19en
sync.item.modts2025.08.26 19:42:43en
thesis.disciplinebez specializacecs
thesis.grantorVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav telekomunikacícs
thesis.levelBakalářskýcs
thesis.nameBc.cs

Files

Original bundle

Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
4.33 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
appendix-1.zip
Size:
14.83 MB
Format:
Unknown data format
Description:
file appendix-1.zip
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-Thesis Assessment Final blur signature.pdf
Size:
116.91 KB
Format:
Adobe Portable Document Format
Description:
file Posudek-Vedouci prace-Thesis Assessment Final blur signature.pdf
Loading...
Thumbnail Image
Name:
review_167353.html
Size:
4.55 KB
Format:
Hypertext Markup Language
Description:
file review_167353.html

Collections