Automatic 3D-Display-Friendly Scene Extraction from Video Sequences and Optimal Focusing Distance Identification
Loading...
Date
2024-02-16
Authors
Chlubna, Tomáš
Milet, Tomáš
Zemčík, Pavel
Advisor
Referee
Mark
Journal Title
Journal ISSN
Volume Title
Publisher
Springer Nature
Altmetrics
Abstract
This paper proposes a method for an automatic detection of 3D-display-friendly scenes from video sequences. Manual selection of such scenes by a human user would be extremely time consuming and would require additional evaluation of the result on 3D display. The input videos can be intentionally captured or taken from other sources, such as films. First, the input video is analyzed and the camera trajectory is estimated. The optimal frame sequence that follows defined rules, based on optical attributes of the display, is then extracted. This ensures the best visual quality and viewing comfort. The following identification of a correct focusing distance is an important step to produce a sharp and artifact-free result on a 3D display. Two novel and equally efficient focus metrics for 3D displays are proposed and evaluated. Further scene enhancements are proposed to correct the unsuitably captured video. Multiple image analysis approaches used in the proposal are compared in terms of both quality and time performance. The proposal is experimentally evaluated on a state-of-the-art 3D display by Looking Glass Factory and is suitable even for other multi-view devices. The problem of optimal scene detection, which includes the input frames extraction, resampling, and focusing, was not addressed in any previous research. Separate stages of the proposal were compared with existing methods, but the results show that the proposed scheme is optimal and cannot be replaced by other state-of-the-art approaches.
Tento článek popisuje metodu pro automatickou detekci scén z video sekvencí vhodných pro 3D displeje. Ruční výběr takových scén lidským uživatelem by byl extrémně časově náročný a vyžadoval by dodatečné vyhodnocení výsledku na 3D displeji. Vstupní videa mohou být záměrně pořízena nebo převzata z jiných zdrojů, jako jsou filmy. Nejprve se analyzuje vstupní video a odhadne se trajektorie kamery. Poté je extrahována optimální sekvence snímků, která se řídí definovanými pravidly na základě optických vlastností displeje. To zajišťuje nejlepší vizuální kvalitu a pohodlí při sledování. Následující identifikace správné zaostřovací vzdálenosti je důležitým krokem k vytvoření ostrého výsledku bez artefaktů na 3D displeji. Jsou navrženy a vyhodnoceny dvě nové a stejně účinné metriky zaostření pro 3D displeje. Pro korekci nevhodně zachyceného videa jsou navržena další vylepšení scény. V návrhu jsou porovnány různé přístupy analýzy obrazu z hlediska kvality a časové náročnosti. Návrh je experimentálně vyhodnocen na nejmodernějším 3D displeji od Looking Glass Factory a je vhodný i pro další vícepohledová zařízení. Problém optimální detekce scény, který zahrnuje extrakci vstupních snímků, převzorkování a zaostření, nebyl v žádném předchozím výzkumu řešen. Jednotlivé fáze metody byly porovnány se stávajícími metodami, ale výsledky ukazují, že navržené schéma je optimální a nelze jej nahradit jinými existujícími přístupy.
Tento článek popisuje metodu pro automatickou detekci scén z video sekvencí vhodných pro 3D displeje. Ruční výběr takových scén lidským uživatelem by byl extrémně časově náročný a vyžadoval by dodatečné vyhodnocení výsledku na 3D displeji. Vstupní videa mohou být záměrně pořízena nebo převzata z jiných zdrojů, jako jsou filmy. Nejprve se analyzuje vstupní video a odhadne se trajektorie kamery. Poté je extrahována optimální sekvence snímků, která se řídí definovanými pravidly na základě optických vlastností displeje. To zajišťuje nejlepší vizuální kvalitu a pohodlí při sledování. Následující identifikace správné zaostřovací vzdálenosti je důležitým krokem k vytvoření ostrého výsledku bez artefaktů na 3D displeji. Jsou navrženy a vyhodnoceny dvě nové a stejně účinné metriky zaostření pro 3D displeje. Pro korekci nevhodně zachyceného videa jsou navržena další vylepšení scény. V návrhu jsou porovnány různé přístupy analýzy obrazu z hlediska kvality a časové náročnosti. Návrh je experimentálně vyhodnocen na nejmodernějším 3D displeji od Looking Glass Factory a je vhodný i pro další vícepohledová zařízení. Problém optimální detekce scény, který zahrnuje extrakci vstupních snímků, převzorkování a zaostření, nebyl v žádném předchozím výzkumu řešen. Jednotlivé fáze metody byly porovnány se stávajícími metodami, ale výsledky ukazují, že navržené schéma je optimální a nelze jej nahradit jinými existujícími přístupy.
Description
Citation
MULTIMEDIA TOOLS AND APPLICATIONS. 2024, vol. 83, issue 7, p. 74535-74562.
https://link.springer.com/article/10.1007/s11042-024-18573-6
https://link.springer.com/article/10.1007/s11042-024-18573-6
Document type
Peer-reviewed
Document version
Published version
Date of access to the full text
Language of document
en