Sémantická analýza logů pomocí LLM
| but.committee | doc. Ing. František Zbořil, Ph.D. (předseda) RNDr. Marek Rychlý, Ph.D. (člen) doc. Ing. Zdeněk Vašíček, Ph.D. (člen) doc. Ing. Vítězslav Beran, Ph.D. (člen) Ing. Ivana Burgetová, Ph.D. (člen) | cs |
| but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. | cs |
| but.jazyk | čeština (Czech) | |
| but.program | Informační technologie | cs |
| but.result | práce byla úspěšně obhájena | cs |
| dc.contributor.advisor | Setinský, Jiří | cs |
| dc.contributor.author | Lukáš, Jakub | cs |
| dc.contributor.referee | Žádník, Martin | cs |
| dc.date.created | 2025 | cs |
| dc.description.abstract | Tato práce se zabývá využitím velkých jazykových modelů (LLM) pro automatizaci sémantické analýzy logovacích záznamů, konkrétně pro anotaci dynamických parametrů v logových šablonách. Vzhledem k rostoucímu objemu logových dat a potřebě hlubšího porozumění jejich obsahu práce zkoumá potenciál LLM pro tuto úlohu. Byl navržen a implementován modulární nástroj Semantic Log Analyzer, který umožňuje flexibilní experimentování s různými jazykovými modely (včetně Llama 3 a Gemini Flash) a strategiemi promptování. Součástí řešení je také metoda pro automatizované hodnocení kvality generovaných sémantických anotací pomocí LLM. Efektivita nástroje byla ověřena prostřednictvím experimentů na standardních datasetech logů HDFS a OpenSSH. Výsledky těchto testů byly analyzovány s cílem identifikovat faktory ovlivňující přesnost anotací, jako je výběr modelu a struktura vstupních promptů. Práce demonstruje, že LLM představují slibný přístup pro automatizaci sémantické analýzy logů, a poukazuje na potenciál této technologie. Závěrem jsou diskutovány dosažené výsledky, limity zvolených metod a navrženy možné směry pro budoucí vylepšení a další výzkum v této oblasti. | cs |
| dc.description.abstract | This thesis investigates the use of Large Language Models (LLM) for automating the semantic analysis of log records, focusing on the annotation of dynamic parameters within log templates. Addressing the challenge of increasing log data volume and the need for deeper content comprehension, this work explores the potential of LLMs for this task. A modular tool, Semantic Log Analyzer, was designed and implemented, enabling flexible experimentation with different LLMs (including Llama 3 and Gemini Flash) and prompting strategies. The solution also incorporates a method for automatically evaluating the quality of the generated semantic annotations using an LLM. The tool's effectiveness was validated through experiments on standard log datasets: HDFS and OpenSSH. Analysis of the experimental results identifies factors influencing annotation accuracy, such as model selection and input prompt structure. The work demonstrates that LLMs offer a promising approach for automating semantic log analysis and highlights the potential of this technology. The thesis concludes with a discussion of the achieved results, the limitations of the employed methods, and suggests potential directions for future enhancements and further research in this field. | en |
| dc.description.mark | B | cs |
| dc.identifier.citation | LUKÁŠ, J. Sémantická analýza logů pomocí LLM [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025. | cs |
| dc.identifier.other | 164487 | cs |
| dc.identifier.uri | http://hdl.handle.net/11012/253733 | |
| dc.language.iso | cs | cs |
| dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
| dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
| dc.subject | analýza logů | cs |
| dc.subject | velké jazykové modely | cs |
| dc.subject | llm | cs |
| dc.subject | sémantická anotace | cs |
| dc.subject | logové šablony | cs |
| dc.subject | anotace parametrů | cs |
| dc.subject | prompt engineering | cs |
| dc.subject | few-shot learning | cs |
| dc.subject | llama 3 | cs |
| dc.subject | gemini flash | cs |
| dc.subject | automatizované vyhodnocení llm | cs |
| dc.subject | log analysis | en |
| dc.subject | large language models | en |
| dc.subject | llm | en |
| dc.subject | semantic annotation | en |
| dc.subject | log templates | en |
| dc.subject | parameter annotation | en |
| dc.subject | prompt engineering | en |
| dc.subject | few-shot learning | en |
| dc.subject | llama 3 | en |
| dc.subject | gemini flash | en |
| dc.subject | automated llm evaluation | en |
| dc.title | Sémantická analýza logů pomocí LLM | cs |
| dc.title.alternative | Semantic log analysis using LLM | en |
| dc.type | Text | cs |
| dc.type.driver | bachelorThesis | en |
| dc.type.evskp | bakalářská práce | cs |
| dcterms.dateAccepted | 2025-06-18 | cs |
| dcterms.modified | 2025-06-18-11:47:31 | cs |
| eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
| sync.item.dbid | 164487 | en |
| sync.item.dbtype | ZP | en |
| sync.item.insts | 2025.08.26 23:57:52 | en |
| sync.item.modts | 2025.08.26 19:52:53 | en |
| thesis.discipline | Informační technologie | cs |
| thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačových systémů | cs |
| thesis.level | Bakalářský | cs |
| thesis.name | Bc. | cs |
