Využití knihovny ALIZE pro identifikaci mluvčích
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
V posledních letech, kdy dochází k výraznému nárůstu výkonu počítačů, se na popředí dostaly mimo jiné i systémy pro rozeznávání mluvčího. Vznikla řada knihoven, ať již open--source či proprietárních, které se této problematice věnují. Jednou z takových knihoven je například ALIZE, která byla vyvinuta na univerzitě v Avignonu. Tato knihovna nabízí obecný koncept práce s biometrickými údaji, statistickými výpočty a kompletní framework pro zamýšlenou aplikaci. Úkolem této práce je tuto knihovnu vyzkoušet, a to postavením praktické aplikace pro rozeznávání mluvčího. Tato práce popisuje úspěšné sestavení této aplikace. Aplikace je platformně nezávislá a je také vyzkoušená na všech třech základních platformách. Ty jsou přílohou práce jako soubory do virtuálního stroje VirtualBox. Práce si všímá praktických zkušeností s knihovnou ALIZE, popisuje její strukturu a architekturu. Pro testování je použito celkem 50 vzorků od 9ti mluvčích, v délkách okolo 20ti sekund. Pro tyto délky funguje rozeznávání naprosto spolehlivě s dodanými vzorky. Proto je na závěr v tezi uskutečněn test skutečné délky potřebné k rozeznání mluvčího.
Recently computing power has been significantly increasing and speaker identification systems have been drawing to the foreground among others. Many libraries have been developed, no matter if open--source or proprietary. One of them is for example ALIZE that was developed at Avignon university. This library offers general concept for staff with biometric values, statistic computations and complex framework for intended application. The goal of this thesis is to test this library, namely by constructing a practical application for speaker identification. This thesis describes successful assembly of that application. Application is platform independent and it is also tested on three basic platforms. These platforms are attached as files into VirtualBox virtual machine. This thesis takes notice of practical experiences with ALIZE library and also describes it's structure and architecture. There are 50 patterns of 9 speakers used for testing in average length 20 seconds. Application recognizes speakers very reliable in these given patterns. Therefore real neccesary length test for speaker recognition was accomplished at the end of this thesis.
SKULÍNEK, Z. Využití knihovny ALIZE pro identifikaci mluvčích [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2015.
prof. Ing. Karel Bartušek, DrSc. (předseda)
prof. Ing. Dan Komosný, Ph.D. (místopředseda)
Ing. Jaroslav Vrána, Ph.D. (člen)
Ing. Radim Číž, Ph.D. (člen)
Ing. Jiří Přinosil, Ph.D. (člen)
Uveďte jaké příznaky byly extrahovány z textu a které mají největší vliv na přesnost detekce mluvčího.
práce byla úspěšně obhájena
Standardní licenční smlouva - přístup k plnému textu bez omezení