Generování dokumentace ke zdrojovému kódu v jazyce Python

Novosád, Juraj

Generování dokumentace ke zdrojovému kódu v jazyce Python

but.committee	doc. Ing. František Zbořil, Ph.D. (předseda) Ing. Libor Polčák, Ph.D. (člen) doc. Mgr. Lukáš Holík, Ph.D. (člen) doc. Ing. Vítězslav Beran, Ph.D. (člen) Ing. Radek Hranický, Ph.D. (člen)	cs
but.defence	Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.	cs
but.jazyk	slovenština (Slovak)
but.program	Informační technologie	cs
but.result	práce byla úspěšně obhájena	cs
dc.contributor.advisor	Smrž, Pavel	sk
dc.contributor.author	Novosád, Juraj	sk
dc.contributor.referee	Nosko, Svetozár	sk
dc.date.created	2024	cs
dc.description.abstract	Cieľom práce je adaptovať vybrané jazykové modely na doménových dátach a vytvoriť sys- tém, ktorý by umožnil ich použitie na bežne dostupnom hardware. Modely boli adaptované pre generovanie dokumentácie k nedokumentovanému zdrojovému kódu v programovacom jazyku Python, tak aby dodržiavali konvenciu Google Style. Prerekvizita adaptovania mo- delu bola získať doménové dáta a vhodne ich spracovať pre účely fine-tuningu modelu. Táto práca sa zameriava na fine-tuning modelov s ppočtom parametrov menej ako jedna mili- arda, z dôvodu umožnenia inferencie aj na bežne dostupnom hardware. Časťou práce bolo objektívne zhodnotiť kvalitu adaptovaných modelov. Z tohto dôvodu som vyvinul nástroj, ktorý na vybranom korpuse ohodnotí kvalitu generovanej dokumentácie na vybraných mo- deloch. Vyhodnotenie adaptovaných modelov ukázalo, že dosahujú porovnateľný výkon ako násobne väčšie modely trénované pre všeobecné úlohy, napríklad gpt-3.5-turbo-0125. Vý- sledkom práce je server, schopný horizontálneho škálovania, ktorý integruje možnosti nielen adaptovaných modelov cez ľahko použiteľné API.	sk
dc.description.abstract	The aim of this work is to adapt selected language models on domain data and to develop a system that would allow their use on commonly available hardware. The models have been adapted to generate documentation for undocumented source code in the Python progra- mming language to follow the Google Style convention. A prerequisite of model adaptation was to obtain domain data and process it appropriately for the purpose of model fine-tuning. This work focuses on fine-tuning models with fewer than one billion parameters, for the sake of enabling inference even on commonly available hardware. Part of the work was to objectively evaluate the quality of the adapted models. For this reason, I developed a tool that evaluates the quality of the generated documentation on a selected corpus of models. The evaluation of the adapted models showed that they achieve comparable performance to multiply larger models for general tasks, such as gpt-3.5-turbo-0125. The result of this work is a server capable of horizontal scaling that integrates the capabilities of more than just the adapted models through an easy-to-use API.	en
dc.description.mark	B	cs
dc.identifier.citation	NOVOSÁD, J. Generování dokumentace ke zdrojovému kódu v jazyce Python [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.	cs
dc.identifier.other	154278	cs
dc.identifier.uri	http://hdl.handle.net/11012/246905
dc.language.iso	sk	cs
dc.publisher	Vysoké učení technické v Brně. Fakulta informačních technologií	cs
dc.rights	Standardní licenční smlouva - přístup k plnému textu bez omezení	cs
dc.subject	veľké jazykové modely	sk
dc.subject	generovanie textu	sk
dc.subject	sequence 2 sequence	sk
dc.subject	transformers	sk
dc.subject	HTTP	sk
dc.subject	fastapi	sk
dc.subject	huggingface	sk
dc.subject	Python	sk
dc.subject	BLEU	sk
dc.subject	Rouge	sk
dc.subject	Meteor	sk
dc.subject	sentence-transformers	sk
dc.subject	Large language models	en
dc.subject	text generation	en
dc.subject	sequence 2 sequence	en
dc.subject	transformers	en
dc.subject	HTTP	en
dc.subject	fastapi	en
dc.subject	huggingface	en
dc.subject	Python	en
dc.subject	BLEU	en
dc.subject	Rouge	en
dc.subject	Meteor	en
dc.subject	sentence-transformers	en
dc.title	Generování dokumentace ke zdrojovému kódu v jazyce Python	sk
dc.title.alternative	Generating Documentation to Source Code in Python	en
dc.type	Text	cs
dc.type.driver	bachelorThesis	en
dc.type.evskp	bakalářská práce	cs
dcterms.dateAccepted	2024-06-11	cs
dcterms.modified	2024-06-17-08:46:01	cs
eprints.affiliatedInstitution.faculty	Fakulta informačních technologií	cs
sync.item.dbid	154278	en
sync.item.dbtype	ZP	en
sync.item.insts	2025.03.18 21:01:09	en
sync.item.modts	2025.01.17 15:04:49	en
thesis.discipline	Informační technologie	cs
thesis.grantor	Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií	cs
thesis.level	Bakalářský	cs
thesis.name	Bc.	cs

Files

Original bundle

Now showing 1 - 3 of 3

Name:: final-thesis.pdf
Size:: 2.29 MB
Format:: Adobe Portable Document Format
Description:: file final-thesis.pdf

Download

Name:: appendix-1.zip
Size:: 467.7 KB
Format:: Unknown data format
Description:: file appendix-1.zip

Download

Name:: review_154278.html
Size:: 9.85 KB
Format:: Hypertext Markup Language
Description:: file review_154278.html

Download

Collections

2024