Knihovna pro parametrizaci hlasu a řeči v jazyce Python
| but.committee | prof. Ing. Zdeněk Smékal, CSc. (předseda) Ing. Miroslav Balík, Ph.D. (místopředseda) RNDr. Lubor Přikryl (člen) PhDr. Aleš Dvořák (člen) Ing. Štěpán Miklánek, Ph.D. (člen) | cs |
| but.defence | Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta Otázky: Jaké další dostupné knihovny určené pro parametrizaci hlasu a řeči existují? Jaké hlavní rozdíly vidíte mezi těmito nástroji a Vámi navrženou knihovnou VuVoPy z hlediska funkcionality, modularity a možnosti klinického využití? | cs |
| but.jazyk | slovenština (Slovak) | |
| but.program | Audio inženýrství | cs |
| but.result | práce byla úspěšně obhájena | cs |
| dc.contributor.advisor | Galáž, Zoltán | sk |
| dc.contributor.author | Ladislav, Richard | sk |
| dc.contributor.referee | Novotný, Kryštof | sk |
| dc.date.created | 2025 | cs |
| dc.description.abstract | Táto diplomová práca sa zaoberá využitím moderných metód spracovania rečového signálu na účely diagnostiky hypokinetickej dyzartrie, typickej pre Parkinsonovu chorobu. V práci je najskôr predstavený teoretický základ rečových porúch spojených s neurodegeneratívnymi ochoreniami, ako aj súčasné diagnostické prístupy, vrátane porovnania tradičných metód s algoritmickými riešeniami založenými na spracovaní reči. V praktickej časti bola navrhnutá a implementovaná knižnica VuVoPy, určená na extrakciu vybraných rečových parametrov pomocou algoritmov ako SWIPE’ (pre výpočet základného tónu F0), Levinson-Durbin (pre výpočet LPC koeficientov a formantov F1, F2), detekcia znelosti pomocou Gaussových zmiešaných modelov a výpočet HNR cez autokoreláciu. Knižnica je implementovaná v jazyku Python, dostupná ako open-source balíček na platforme PyPi a je sprevádzaná dokumentáciou a jednotkovými testami. Na validáciu navrhnutého riešenia boli vykonané dve fázy štatistickej analýzy. V prvej fáze boli výsledky základných algoritmov porovnané s výstupmi softvéru PRAAT. V druhej fáze bola knižnica aplikovaná na podmnožinu databázy PARCZ obsahujúcu vyvážený súbor zdravých a postihnutých subjektov. Výsledky analýzy vrátane korelačných máp a boxplotov preukázali schopnosť vybraných parametrov odlíšiť jednotlivé skupiny subjektov. Výsledky práce potvrdzujú potenciál využitia rečovej analýzy ako podporného nástroja pri diagnostike neurologických porúch. Knižnica VuVoPy predstavuje flexibilný nástroj, ktorého ďalší vývoj bude zameraný na optimalizáciu výkonu a rozšírenie funkcionality. | sk |
| dc.description.abstract | This thesis explores the application of modern speech signal processing methods for the diagnosis of hypokinetic dysarthria, a condition commonly associated with Parkinson’s disease. The theoretical part presents an overview of speech disorders linked to neurodegenerative diseases, as well as a comparison of conventional diagnostic approaches with algorithmic solutions based on speech analysis. In the practical part, a Python-based software library called VuVoPy was developed to extract selected speech parameters using algorithms such as SWIPE’ (for estimating the fundamental frequency F0), LevinsonDurbin recursion (for computing LPC coefficients and estimating formants F1 and F2), unvoiced/voiced detection via Gaussian Mixture Models, and harmonic-to-noise ratio (HNR) calculation through autocorrelation. The library is available as an open-source package on the PyPi platform and is supported by full documentation and unit tests. To validate the proposed solution, two stages of statistical analysis were performed. In the first phase, the performance of the core algorithms was compared to results obtained from the PRAAT software. In the second phase, the library was applied to a balanced subset of the PARCZ speech database, containing both healthy controls and Parkinson’s patients. The resulting correlation matrices and boxplots demonstrated the discriminative power of the extracted parameters across diagnostic and demographic groups. The findings confirm the potential of speech analysis as a valuable tool in the support of neurological disease diagnosis. VuVoPy represents a flexible framework, with future development focused on performance optimization and extended functionality. | en |
| dc.description.mark | A | cs |
| dc.identifier.citation | LADISLAV, R. Knihovna pro parametrizaci hlasu a řeči v jazyce Python [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025. | cs |
| dc.identifier.other | 167237 | cs |
| dc.identifier.uri | http://hdl.handle.net/11012/252310 | |
| dc.language.iso | sk | cs |
| dc.publisher | Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií | cs |
| dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
| dc.subject | Parinsonova choroba | sk |
| dc.subject | hypokinetická dyzartria | sk |
| dc.subject | spracovanie reči | sk |
| dc.subject | PDAs | sk |
| dc.subject | formantové frekvenice | sk |
| dc.subject | základný tón reči | sk |
| dc.subject | Python | sk |
| dc.subject | pip | sk |
| dc.subject | Parkinson’s disease | en |
| dc.subject | hypokinetic dysarthria | en |
| dc.subject | speech processing | en |
| dc.subject | PDAs | en |
| dc.subject | formant frequencies | en |
| dc.subject | fundamental frequency of voice | en |
| dc.subject | Python | en |
| dc.subject | pip | en |
| dc.title | Knihovna pro parametrizaci hlasu a řeči v jazyce Python | sk |
| dc.title.alternative | Python library for parametrization of dysarthric voice | en |
| dc.type | Text | cs |
| dc.type.driver | masterThesis | en |
| dc.type.evskp | diplomová práce | cs |
| dcterms.dateAccepted | 2025-06-12 | cs |
| dcterms.modified | 2025-06-13-09:36:53 | cs |
| eprints.affiliatedInstitution.faculty | Fakulta elektrotechniky a komunikačních technologií | cs |
| sync.item.dbid | 167237 | en |
| sync.item.dbtype | ZP | en |
| sync.item.insts | 2025.08.27 02:04:00 | en |
| sync.item.modts | 2025.08.26 20:08:37 | en |
| thesis.discipline | Akustika a audiovizuální technika | cs |
| thesis.grantor | Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav telekomunikací | cs |
| thesis.level | Inženýrský | cs |
| thesis.name | Ing. | cs |
Files
Original bundle
1 - 3 of 3
Loading...
- Name:
- final-thesis.pdf
- Size:
- 4.12 MB
- Format:
- Adobe Portable Document Format
- Description:
- file final-thesis.pdf
Loading...
- Name:
- appendix-1.zip
- Size:
- 12.24 MB
- Format:
- Unknown data format
- Description:
- file appendix-1.zip
Loading...
- Name:
- review_167237.html
- Size:
- 4.51 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_167237.html
