Synchronizace videozáznamu přednášky a příslušných slajdů
Loading...
Date
Authors
Valníček, Dan
Advisor
Referee
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
ORCID
Abstract
Tato práce řeší automatickou anotaci snímků pro videopřednášky. Anotace umožňují uživateli přeskočit přednášku podle vzhledu snímku. Přiřazování snímků je založeno na SIFT (Scale Invariant Feature Transform) detekci klíčových bodů s využitím geometrické verifikace a kosinové podobnosti pro přiřazení klíčových bodů, jejich geometrické ověření a výběr nejpodobnějšího snímku. Anotace se ukládají přímo do souborů PDF pomocí vlastního rozšíření PDF, které ukládá anotace přímo do souboru PDF. Zároveň bylo vytvořeno grafické uživatelské rozhraní (GUI), které uživateli umožňuje prohlížet si slajdy ve formátu PDF a přecházet na příslušné části videa. Shoda snímků dosáhla 96% přesnosti na 41 385 anotovaných snímcích z 5 různých přednášek. Kód byl zveřejněn a aplikaci si může stáhnout a používat kdokoli k anotování a sledování videopřednášek.
This work solves automatic slide annotation for video lectures. The annotations enable the user to skip the lecture by slide appearance. The slide-matching is based on Scale Invariant Feature Transform (SIFT) keypoint detection using geometric verification and Cosine Similarity to match keypoints, verify them geometrically, and pick the most similar slide. The annotations are stored directly in PDF files using a custom PDF extension that stores the annotations directly in the PDF file. A graphical user interface (GUI) was made to let the user view the slides in PDF format and skip to the relevant parts of the video. The slide-matching achieved 96% accuracy on 41,385 annotated frames from 5 different lectures. The code was released, and the application can be downloaded and used by anyone to annotate and watch video lectures.
This work solves automatic slide annotation for video lectures. The annotations enable the user to skip the lecture by slide appearance. The slide-matching is based on Scale Invariant Feature Transform (SIFT) keypoint detection using geometric verification and Cosine Similarity to match keypoints, verify them geometrically, and pick the most similar slide. The annotations are stored directly in PDF files using a custom PDF extension that stores the annotations directly in the PDF file. A graphical user interface (GUI) was made to let the user view the slides in PDF format and skip to the relevant parts of the video. The slide-matching achieved 96% accuracy on 41,385 annotated frames from 5 different lectures. The code was released, and the application can be downloaded and used by anyone to annotate and watch video lectures.
Description
Keywords
SIFT , rozpoznávání instancí , PDF , slajdy , zpracování videa , prezentace , přiřazení slajdů , anotace videa , homografie , SIFT , instance recognition , PDF , slides , video processing , presentation , slide matching , video annotation , homography
Citation
VALNÍČEK, D. Synchronizace videozáznamu přednášky a příslušných slajdů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Informační technologie
Comittee
prof. Ing. Adam Herout, Ph.D. (předseda)
Dr. Ing. Petr Peringer (člen)
Ing. Matěj Grégr, Ph.D. (člen)
Ing. Jaroslav Rozman, Ph.D. (člen)
Ing. Jiří Matoušek, Ph.D. (člen)
Date of acceptance
2025-06-18
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.
Result of defence
práce byla úspěšně obhájena
