Velké jazykové modely pro vyhledávání v dopravních videích
| but.committee | doc. Mgr. Adam Rogalewicz, Ph.D. (předseda) doc. RNDr. Pavel Smrž, Ph.D. (člen) doc. Ing. František Zbořil, CSc. (člen) Dr. Ing. Petr Peringer (člen) Ing. Aleš Smrčka, Ph.D. (člen) Ing. Ondřej Lengál, Ph.D. (člen) | cs |
| but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. | cs |
| but.jazyk | angličtina (English) | |
| but.program | Informační technologie a umělá inteligence | cs |
| but.result | práce byla úspěšně obhájena | cs |
| dc.contributor.advisor | Klíma, Ondřej | en |
| dc.contributor.author | Pyšík, Michal | en |
| dc.contributor.referee | Smrž, Pavel | en |
| dc.date.created | 2025 | cs |
| dc.description.abstract | Existující systémy pro vyhledávání a analýzu záznamů z dopravních kamer často spoléhají na předem definované metody detekce událostí a postrádají schopnost interagovat s uživateli prostřednictvím přirozeného jazyka. Hlavním cílem této diplomové práce je vytvořit takový systém s využítím multimodálních velkých jazykových modelů (MLLM) a souvisejících technologií, konkrétně multimodálních embedovacích modelů, přičemž oba typy modelů v nedávných letech zaznamenaly rychlý rozvoj. Systém je vytvořen tak, že podporuje výběr mezi více modely obou typů, čímž umožňuje jejich flexibilní integraci a porovnání. Všechny dostupné modely jsou dále porovnány specificky v oblasti dopravních záznamů za účelem zhodnocení jejich výkonu a vhodnosti pro praktické nasazení. | en |
| dc.description.abstract | Existing systems for searching and analyzing traffic surveillance footage often rely on predefined event detection methods and lack the ability to interact with users through natural language. The main goal of this thesis is to create such system by utilizing multimodal large language models (MLLMs) and related technologies, namely multimodal embedding models, both of which have seen rapid advancements in recent years. The system is designed to support multiple models of both types, enabling flexible integration and comparison. Furthermore, the available models are benchmarked specifically in the domain of traffic footage to evaluate their performance and suitability for practical deployment. | cs |
| dc.description.mark | A | cs |
| dc.identifier.citation | PYŠÍK, M. Velké jazykové modely pro vyhledávání v dopravních videích [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025. | cs |
| dc.identifier.other | 164073 | cs |
| dc.identifier.uri | http://hdl.handle.net/11012/255114 | |
| dc.language.iso | en | cs |
| dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
| dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
| dc.subject | doprava | en |
| dc.subject | videa | en |
| dc.subject | CCTV | en |
| dc.subject | systém | en |
| dc.subject | hledání | en |
| dc.subject | analýza | en |
| dc.subject | multimodální | en |
| dc.subject | model | en |
| dc.subject | embedding | en |
| dc.subject | velký jazykový model | en |
| dc.subject | CLIP | en |
| dc.subject | GPT | en |
| dc.subject | porovnání | en |
| dc.subject | strojové učení | en |
| dc.subject | umělá inteligence | en |
| dc.subject | auta | en |
| dc.subject | dopravní značky | en |
| dc.subject | Python | en |
| dc.subject | traffic | cs |
| dc.subject | videos | cs |
| dc.subject | CCTV | cs |
| dc.subject | system | cs |
| dc.subject | search | cs |
| dc.subject | analysis | cs |
| dc.subject | multimodal | cs |
| dc.subject | model | cs |
| dc.subject | embedding | cs |
| dc.subject | large language model | cs |
| dc.subject | CLIP | cs |
| dc.subject | GPT | cs |
| dc.subject | benchmark | cs |
| dc.subject | machine learning | cs |
| dc.subject | artificial intelligence | cs |
| dc.subject | cars | cs |
| dc.subject | traffic signs | cs |
| dc.subject | Python | cs |
| dc.title | Velké jazykové modely pro vyhledávání v dopravních videích | en |
| dc.title.alternative | Large Language Models for Traffic Surveillance Video Understanding | cs |
| dc.type | Text | cs |
| dc.type.driver | masterThesis | en |
| dc.type.evskp | diplomová práce | cs |
| dcterms.dateAccepted | 2025-06-26 | cs |
| dcterms.modified | 2025-06-26-11:59:59 | cs |
| eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
| sync.item.dbid | 164073 | en |
| sync.item.dbtype | ZP | en |
| sync.item.insts | 2025.08.27 02:04:36 | en |
| sync.item.modts | 2025.08.26 19:43:12 | en |
| thesis.discipline | Matematické metody | cs |
| thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
| thesis.level | Inženýrský | cs |
| thesis.name | Ing. | cs |
