Taxonomie pro LLM v komponentě Kafka projektu Apache Camel
| but.committee | doc. Ing. Jan Jeřábek, Ph.D. (předseda) JUDr. Ing. František Kasl, Ph.D. (místopředseda) Ing. Eva Holasová (člen) Ing. Michal Skořepa, Ph.D. (člen) Ing. Adrián Tomašov, Ph.D. (člen) RNDr. Ing. Pavel Šeda, Ph.D. (člen) | cs |
| but.defence | Student prezentoval výsledky své práce a komise byla seznámena s posudky. Otázky oponenta: Jak výrazné zlepšení kvality generovaného textu odhadujete v případě použití větší datové množiny a trénování s vyšším počtem iterací? Student obhájil bakalářskou práci s výhradami a odpověděl na otázky členů komise a oponenta. | cs |
| but.jazyk | angličtina (English) | |
| but.program | Informační bezpečnost | cs |
| but.result | práce byla úspěšně obhájena | cs |
| dc.contributor.advisor | Phan, Viet Anh | en |
| dc.contributor.author | Konovalov, Nikita | en |
| dc.contributor.referee | Ježek, Štěpán | en |
| dc.date.created | 2025 | cs |
| dc.description.abstract | Tato práce se zaměřuje na koncept umělé inteligence, konkrétně na velké jazykové modely (Large Language Models). Popisuje základní principy neuronových sítí a fáze trénování v oblasti umělé inteligence, strojového učení a jazykových modelů, přičemž se zabývá i výzvami efektivního trénování neuronových sítí. Práce dále zkoumá komponentu Kafka pro Apache Camel, její význam a využitelnost v kontextu trénování jazykových modelů. Hlavní část této práce se věnuje tvorbě taxonomie, která je klíčovým prvkem v procesu učení. Program pro extrakci a Annotation API mají produktovou kvalitu a byly napsány v jazyce Java. Práce ukazuje proces generování syntetických dat na základě poskytnuté kvalitativní taxonomie pomocí nástroje InstructLab a analýzu výsledků. Součástí práce je také ukázka procesu nasazení taxonomie na serveru Hugging Face. | en |
| dc.description.abstract | This thesis focuses on the concept of artificial intelligence, specifically on Large Language Models. It describes the core principles of neural networks and the stages of training in artificial intelligence, machine learning, and language models, while addressing the challenges of efficient neural network training. Additionally, the thesis explores the Kafka component for Apache Camel, its significance, and applicability in the context of training language models. The main part of this thesis details the creation of a taxonomy, the most critical element in the training process. The extractor program and the Annotation API have product quality and was written in Java. This thesis shows the process of generating synthetic data based on the provided qualitative taxonomy using InstructLab and analysis of the results. Thesis also shows deployment process for the taxonomy on Hugging Face server. | cs |
| dc.description.mark | D | cs |
| dc.identifier.citation | KONOVALOV, N. Taxonomie pro LLM v komponentě Kafka projektu Apache Camel [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025. | cs |
| dc.identifier.other | 167353 | cs |
| dc.identifier.uri | http://hdl.handle.net/11012/252973 | |
| dc.language.iso | en | cs |
| dc.publisher | Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií | cs |
| dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
| dc.subject | Umělá inteligence | en |
| dc.subject | strojové učení | en |
| dc.subject | hluboké učení | en |
| dc.subject | velký jazykový model | en |
| dc.subject | zpracování přirozeného jazyka | en |
| dc.subject | dataset | en |
| dc.subject | model | en |
| dc.subject | komponenta Kafka | en |
| dc.subject | Apache Camel | en |
| dc.subject | útržek kódu | en |
| dc.subject | syntetická data | en |
| dc.subject | InstructLab | en |
| dc.subject | Hugging Face | en |
| dc.subject | taxonomie. | en |
| dc.subject | Artificial Intelligence | cs |
| dc.subject | Machine Learning | cs |
| dc.subject | Deep Learning | cs |
| dc.subject | Large Language Model | cs |
| dc.subject | Natural Language Processing | cs |
| dc.subject | dataset | cs |
| dc.subject | model | cs |
| dc.subject | Kafka component | cs |
| dc.subject | Apache Camel | cs |
| dc.subject | code snippet | cs |
| dc.subject | InstructLab | cs |
| dc.subject | synthetic data | cs |
| dc.subject | Hugging Face | cs |
| dc.subject | taxonomy. | cs |
| dc.title | Taxonomie pro LLM v komponentě Kafka projektu Apache Camel | en |
| dc.title.alternative | Taxonomy for LLM in the Kafka Component of the Apache Camel Project | cs |
| dc.type | Text | cs |
| dc.type.driver | bachelorThesis | en |
| dc.type.evskp | bakalářská práce | cs |
| dcterms.dateAccepted | 2025-06-17 | cs |
| dcterms.modified | 2025-06-19-09:29:59 | cs |
| eprints.affiliatedInstitution.faculty | Fakulta elektrotechniky a komunikačních technologií | cs |
| sync.item.dbid | 167353 | en |
| sync.item.dbtype | ZP | en |
| sync.item.insts | 2025.08.26 20:04:19 | en |
| sync.item.modts | 2025.08.26 19:42:43 | en |
| thesis.discipline | bez specializace | cs |
| thesis.grantor | Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav telekomunikací | cs |
| thesis.level | Bakalářský | cs |
| thesis.name | Bc. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 4.33 MB
- Format:
- Adobe Portable Document Format
- Description:
- file final-thesis.pdf
Loading...
- Name:
- appendix-1.zip
- Size:
- 14.83 MB
- Format:
- Unknown data format
- Description:
- file appendix-1.zip
Loading...
- Name:
- Posudek-Vedouci prace-Thesis Assessment Final blur signature.pdf
- Size:
- 116.91 KB
- Format:
- Adobe Portable Document Format
- Description:
- file Posudek-Vedouci prace-Thesis Assessment Final blur signature.pdf
Loading...
- Name:
- review_167353.html
- Size:
- 4.55 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_167353.html
