Převod obrazu na zvuk pro nevidomé
Loading...
Date
Authors
Rozek, Jakub
Advisor
Referee
Mark
F
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
ORCID
Abstract
Cílem této práce je navrhnout, implementovat a zhodnotit metody pro optimální konverzi vizuální informace do zvuku. Tato práce popisuje několik algoritmů, které mohou být použity pro simulaci vidění zvukem. Tohoto je docíleno extrakcí informací ze vstupního videa a pokusem zkonstruovat zvuk, v němž dokáže lidské ucho rozpoznat co největší množství původní obrazové informace. Byl implementován Python projekt, který prozkoumává různé metody konverze, se kterými je možno experimentovat nastavením jejich vlastností, aby byla nalezena nejefektivnější metoda konverze. Tato práce poskytuje experimentální prostředí pro porovnání takovýchto metod.
The goal of this thesis is to propose, implement, and evaluate methods for optimal conversion of visual information to sound. The work represents a selection of algorithms that one might use to simulate sight with hearing. This is done by extracting the most information from the input video stream and then attempting to construct an audio signal in which most of the visual information is distinguishable by human ear. A Python project was implemented that explores the various conversion techniques where one can experiment with individual settings to find the best performing conversion technique. This work provides an experimental framework for comparing such methods.
The goal of this thesis is to propose, implement, and evaluate methods for optimal conversion of visual information to sound. The work represents a selection of algorithms that one might use to simulate sight with hearing. This is done by extracting the most information from the input video stream and then attempting to construct an audio signal in which most of the visual information is distinguishable by human ear. A Python project was implemented that explores the various conversion techniques where one can experiment with individual settings to find the best performing conversion technique. This work provides an experimental framework for comparing such methods.
Description
Keywords
Citation
ROZEK, J. Převod obrazu na zvuk pro nevidomé [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Informační technologie
Comittee
prof. Ing. Adam Herout, Ph.D. (předseda)
Dr. Ing. Petr Peringer (člen)
Ing. Matěj Grégr, Ph.D. (člen)
Ing. Jaroslav Rozman, Ph.D. (člen)
Ing. Jiří Matoušek, Ph.D. (člen)
Date of acceptance
2025-06-18
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Komise ohodnotila práci stupněm 4F, protože realizační výstup není adekvátním řešením zadání a technická zpráva neodpovídá požadavkům na bakalářskou práci. Komise shledala nedostatky práce natolik závažné, že se práci rozhodla hodnotit jako nevyhovující.
Result of defence
práce nebyla úspěšně obhájena
