Rozpoznávání osob a jejich činnosti ve videu z bezpečnostních kamer

but.committeeprof. Ing. Adam Herout, Ph.D. (předseda) Dr. Ing. Petr Peringer (člen) Ing. Matěj Grégr, Ph.D. (člen) Ing. Jaroslav Rozman, Ph.D. (člen) Ing. Jiří Matoušek, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSmrž, Pavelcs
dc.contributor.authorSkalka, Davidcs
dc.contributor.refereeJuránková, Markétacs
dc.date.created2025cs
dc.description.abstractTato práce se zabývá návrhem a implementací systému pro vyhledávání ve videozáznamech z bezpečnostních kamer na základě dotazu v přirozeném jazyce. Cílem je zkrátit a zefektivnit proces analýzy videa pomocí vícestupňového přístupu, který využívá klasické detekční metody, sledovací algoritmy a moderní multimodální modely, a uživateli následně nabízí potenciálně relevantní snímky k rychlé vizuální kontrole. Navržený systém zahrnuje tři úrovně zpracování. První úroveň využívá model YOLO k vyhledávání objektů podle jejich třídy, barvy a prostorových vztahů. Druhá úroveň aplikuje na tyto detekce algoritmus ByteTrack, čímž přidává možnost vyhledávání na základě směru pohybu. Třetí úroveň pak umožňuje vyhledávání komplexních činností prostřednictvím multimodálních modelů X-CLIP a SigLIP, které propojují vizuální a textovou reprezentaci. Systém byl otestován na vlastní datové sadě 41 videozáznamů. Výsledky ukazují, že detekční modely dosahují nejvyšší přesnosti při základních dotazech, zatímco multimodální modely umožňují flexibilnější, obecnější dotazy za cenu nižší přesnosti. Nasazení více modelů umožňuje přizpůsobit vyhledávání typu dotazu a dosáhnout vyšší celkové efektivity.cs
dc.description.abstractThis thesis focuses on the design and implementation of a system for query-based search in security camera video. The goal is to shorten and streamline the video analysis process by using a multi-stage approach that uses traditional detection methods, tracking algorithms and modern multimodal models, ultimately presenting the user with potentially relevant images for quick visual inspection. The proposed system consists of three processing levels. The first level uses the YOLO model to search for objects based on their class, color and spatial relationships. The second level applies the ByteTrack algorithm to these detections for object tracking, adding the ability to search based on direction of motion. The third level then allows complex activity to be retrieved using multimodal models X-CLIP and SigLIP, that combine visual and textual representations. The system was tested on a custom dataset of 41 video recordings. Results show that the detection models achieve the highest accuracy for basic queries, while the multimodal models allow for more flexible, general queries at the cost of lower accuracy. The use of multiple models allows the system to the type of query and achieve higher overall efficiency.en
dc.description.markAcs
dc.identifier.citationSKALKA, D. Rozpoznávání osob a jejich činnosti ve videu z bezpečnostních kamer [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.cs
dc.identifier.other162620cs
dc.identifier.urihttp://hdl.handle.net/11012/253698
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectpočítačové viděnícs
dc.subjectanalýza videozáznamucs
dc.subjectdetekce objektůcs
dc.subjectsledování objektůcs
dc.subjectmultimodální modelycs
dc.subjectcomputer visionen
dc.subjectvideo analysisen
dc.subjectobject detectionen
dc.subjectobject trackingen
dc.subjectmultimodal modelsen
dc.titleRozpoznávání osob a jejich činnosti ve videu z bezpečnostních kamercs
dc.title.alternativeRecognizing People and Their Activities in Video from Security Camerasen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2025-06-18cs
dcterms.modified2025-06-18-15:11:19cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid162620en
sync.item.dbtypeZPen
sync.item.insts2025.08.26 23:06:48en
sync.item.modts2025.08.26 20:19:19en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs

Files

Original bundle

Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
9.15 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_162620.html
Size:
10.78 KB
Format:
Hypertext Markup Language
Description:
file review_162620.html

Collections