Generování dokumentace ke zdrojovému kódu v jazyce Python
but.committee | doc. Ing. František Zbořil, Ph.D. (předseda) Ing. Libor Polčák, Ph.D. (člen) doc. Mgr. Lukáš Holík, Ph.D. (člen) doc. Ing. Vítězslav Beran, Ph.D. (člen) Ing. Radek Hranický, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. | cs |
but.jazyk | slovenština (Slovak) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Smrž, Pavel | sk |
dc.contributor.author | Novosád, Juraj | sk |
dc.contributor.referee | Nosko, Svetozár | sk |
dc.date.created | 2024 | cs |
dc.description.abstract | Cieľom práce je adaptovať vybrané jazykové modely na doménových dátach a vytvoriť sys- tém, ktorý by umožnil ich použitie na bežne dostupnom hardware. Modely boli adaptované pre generovanie dokumentácie k nedokumentovanému zdrojovému kódu v programovacom jazyku Python, tak aby dodržiavali konvenciu Google Style. Prerekvizita adaptovania mo- delu bola získať doménové dáta a vhodne ich spracovať pre účely fine-tuningu modelu. Táto práca sa zameriava na fine-tuning modelov s ppočtom parametrov menej ako jedna mili- arda, z dôvodu umožnenia inferencie aj na bežne dostupnom hardware. Časťou práce bolo objektívne zhodnotiť kvalitu adaptovaných modelov. Z tohto dôvodu som vyvinul nástroj, ktorý na vybranom korpuse ohodnotí kvalitu generovanej dokumentácie na vybraných mo- deloch. Vyhodnotenie adaptovaných modelov ukázalo, že dosahujú porovnateľný výkon ako násobne väčšie modely trénované pre všeobecné úlohy, napríklad gpt-3.5-turbo-0125. Vý- sledkom práce je server, schopný horizontálneho škálovania, ktorý integruje možnosti nielen adaptovaných modelov cez ľahko použiteľné API. | sk |
dc.description.abstract | The aim of this work is to adapt selected language models on domain data and to develop a system that would allow their use on commonly available hardware. The models have been adapted to generate documentation for undocumented source code in the Python progra- mming language to follow the Google Style convention. A prerequisite of model adaptation was to obtain domain data and process it appropriately for the purpose of model fine-tuning. This work focuses on fine-tuning models with fewer than one billion parameters, for the sake of enabling inference even on commonly available hardware. Part of the work was to objectively evaluate the quality of the adapted models. For this reason, I developed a tool that evaluates the quality of the generated documentation on a selected corpus of models. The evaluation of the adapted models showed that they achieve comparable performance to multiply larger models for general tasks, such as gpt-3.5-turbo-0125. The result of this work is a server capable of horizontal scaling that integrates the capabilities of more than just the adapted models through an easy-to-use API. | en |
dc.description.mark | B | cs |
dc.identifier.citation | NOVOSÁD, J. Generování dokumentace ke zdrojovému kódu v jazyce Python [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024. | cs |
dc.identifier.other | 154278 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/246905 | |
dc.language.iso | sk | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | veľké jazykové modely | sk |
dc.subject | generovanie textu | sk |
dc.subject | sequence 2 sequence | sk |
dc.subject | transformers | sk |
dc.subject | HTTP | sk |
dc.subject | fastapi | sk |
dc.subject | huggingface | sk |
dc.subject | Python | sk |
dc.subject | BLEU | sk |
dc.subject | Rouge | sk |
dc.subject | Meteor | sk |
dc.subject | sentence-transformers | sk |
dc.subject | Large language models | en |
dc.subject | text generation | en |
dc.subject | sequence 2 sequence | en |
dc.subject | transformers | en |
dc.subject | HTTP | en |
dc.subject | fastapi | en |
dc.subject | huggingface | en |
dc.subject | Python | en |
dc.subject | BLEU | en |
dc.subject | Rouge | en |
dc.subject | Meteor | en |
dc.subject | sentence-transformers | en |
dc.title | Generování dokumentace ke zdrojovému kódu v jazyce Python | sk |
dc.title.alternative | Generating Documentation to Source Code in Python | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2024-06-11 | cs |
dcterms.modified | 2024-06-17-08:46:01 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 154278 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 21:01:09 | en |
sync.item.modts | 2025.01.17 15:04:49 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |
Files
Original bundle
1 - 3 of 3
Loading...
- Name:
- final-thesis.pdf
- Size:
- 2.29 MB
- Format:
- Adobe Portable Document Format
- Description:
- file final-thesis.pdf
Loading...
- Name:
- appendix-1.zip
- Size:
- 467.7 KB
- Format:
- Unknown data format
- Description:
- file appendix-1.zip
Loading...
- Name:
- review_154278.html
- Size:
- 9.85 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_154278.html