BÁŇA, J. Klasifikace přenosových kanálů na základě analýzy řečového signálu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2013.

Posudky

Posudek vedoucího

Atassi, Hicham

Student Bc. Josef Báňa vypracoval diplomovou práci na téma „Klasifikace přenosových kanálů na základě analýzy řečového signálu“. Po domluvě bylo upřesněno zadání a nastaven nový cíl práce, a sice odhad charakteristik VoIP kanálů na základě zpracování řečového signálu. Zadání bylo splněno v plném rozsahu, kde student dokázal vytvořit databázi řečových nahrávek pro účely trénování a testování, dále student dokázal pochopit a efektivně použit nástroje v prostředí Matlab pro rozpoznání vzoru a využit tyto nástroje pro vlastní experimenty. Bohužel celkovou úroveň práce snižují některé formální nedostatky. Přesto práci doporučuji k obhajobě a navrhuji známku 75/C.

Navrhovaná známka
C
Body
75

Posudek oponenta

Sysel, Petr

Zadání diplomové práce bylo splněno pouze částečně. Byla vytvořena trénovací databáze nahrávek po průchodu pouze VoIP kanálem s různými typy zkreslení (jitter, šířka pásma, ztráty paketů). Nebyly analyzovány ostatní typy kanálů ani realizován systém pro odhad typu kanálu. Nicméně v textu práce je zmíněno, že odklon od zadání byl konzultován a schválen vedoucím práce. Zásadní výtku mám k samotnému pořizování nahrávek. Z obrázku 3.2 a jeho popisu vyplývá, že originální nahrávky byly nejprve převedeny do analogové podoby zvukovou kartou jednoho počítače a zpět digitalizovány zvukovou kartou druhého počítače a teprve následně odeslány do sítě. Podobně na přijímací straně. Už tento dvojí přenos určitě vnesl nějaké (i když pravděpodobně malé) zkreslení nahrávky. Pokud cílem bylo zjistit vliv parametrů přenosového kanálu na kvalitu nahrávky, považuji uvedené zkreslení za nežádoucí. Navíc by nevznikl v práci popisovaný problém s přístupem virtuálního počítače na zvukovou kartu. Z popisu není úplně zřejmé, v čem problém spočíval. Nicméně se domnívám, že při použití externí USB zvukové karty a povolení přímého přístupu virtuálního počítače k USB zařízení, by bylo možné zvukovou kartu používat i ve virtuálním počítači. Vzhledem k tomu, že stejně byly přenášeny zaznamenané nahrávky databáze TIMIT ve formátu WAV, bylo by vhodnější data v digitální podobě přímo načítat ze souborů a odesílat některou z knihoven pro RTP protokol (např. OPAL, ccRTP, oRTP, RTP library, apod.), případně i RTSP protokol. Takovéto řešení by zjednodušilo vytváření databáze, protože by odpadlo navazování spojení přes SIP a současně by bylo možné měnit či přímo sledovat některé další parametry RTP protokolu. Jednou z výhod by bylo i snadnější rozdělování nahrávky na jednotlivé promluvy. Jak je uvedeno v práci použití detekce pípnutí vložené mezi nahrávkami je obtížné z důvodu, že simulaci ztrátovosti paketů může celé vypadnout, případně jsou ovlivněny průchodem kodérem. Naproti tomu každý RTP paket obsahuje časovou značku jako informaci o čase pořízení. Délky odesílaných promluv jsou známé, takže na přijímací straně by stačilo porovnat časovou značkou aktuálního paketu s očekávanou délkou promluvy. Kvalitu práce dále snižuje několik formálních nedostatků. Elektronická verze není shodná s tištěnou verzí, když v elektronické verzi je místo oficiálního zadání a poděkování projektu SIX pouze poznámka o nutnosti vložení. Dále se vyskytují neslabičné předložky na konci řádku, slangové výrazy a několik překlepů: str. 2: „ořezaný na pásmo 300-3400 Hz“ str. 4: parazity ovlivňující“ str. 5: „G.7.22“ místo „G.722“ str. 6: „také chatovacích programech“ str. 7: „Vlastnosti a parazity“ str. 11: „G7.22“ str. 15: „viz.“ místo „viz“ str. 20: „Energies and zcr (Zcr a energie)“ - nevysvětlená zkratka ZCR str. 21: „Rornice“ místo „Rovnice“ str. 24: „Spektral koeficient“ str. 32: „SpeFe“ pravděpodobně místo příznaku „SpFe“ str. 37: „trénovačích“ místo „trénovacích“ str. 37: „vyplívá“ místo „vyplývá“

Navrhovaná známka
C
Body
72

Otázky

eVSKP id 62925