Topic Identification from Spoken TED-Talks
but.committee | prof. Dr. Ing. Jan Černocký (předseda) doc. Ing. Jiří Jaroš, Ph.D. (místopředseda) doc. RNDr. Dana Hliněná, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Komise shledala nedostatky práce natolik závažné, že se práci rozhodla hodnotit jako nevyhovující. Práce je nedokončená, obsahuje řadu nekompletních sekcí, implementace není popsána, práce nemá minimální rozsah, a není splněn bod zadání číslo 6. Otázky u obhajoby: * How to describe in a few sentences the main components of an ASR system? * How to analyze the results of the topic identification system? Is there any comparable results already published on similar corpus? | cs |
but.jazyk | angličtina (English) | |
but.program | Informační technologie | cs |
but.result | práce nebyla úspěšně obhájena | cs |
dc.contributor.advisor | Kesiraju, Santosh | en |
dc.contributor.author | Vašš, Adam | en |
dc.contributor.referee | Ondel, Lucas Antoine Francois | en |
dc.date.created | 2019 | cs |
dc.description.abstract | Táto práca sa zaoberá problémom spracovania prirodzeného jazyka a následnej klasifikácie. Použité systémy boli modelované na TED-LIUM korpuse. Systém automatického spracovania jazyka bol modelovaný s použitím sady nástrojov Kaldi. Vo výsledku bol dosiahnutý WER s hodnotou 16.6\%. Problém klasifikácie textu bol adresovaný s pomocou metód na lineárnu klasifikáciu, konkrétne Multinomial Naive Bayes a Linear Support Vector Machines, kde druhá technika dosiahla vyššiu presnosť klasifikácie. | en |
dc.description.abstract | This thesis deals with the problems of language recognition and topic classification, using TED-LIUM corpus to train both the ASR and classification models. The ASR system is built using the Kaldi toolkit, achieving the WER of 16.6\%. The classification problem is addressed using linear classification methods, specifically Multinomial Naive Bayes and Linear Support Vector Machines, the latter method achieving higher topic classification accuracy. | cs |
dc.description.mark | C | cs |
dc.identifier.citation | VAŠŠ, A. Topic Identification from Spoken TED-Talks [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2019. | cs |
dc.identifier.other | 121941 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/180586 | |
dc.language.iso | en | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | TED | en |
dc.subject | talks | en |
dc.subject | identifikácia tém | en |
dc.subject | strojové učenie | en |
dc.subject | klasifikácia | en |
dc.subject | transkripcia | en |
dc.subject | lineárna klasifikácia | en |
dc.subject | Kaldi | en |
dc.subject | support vector machines | en |
dc.subject | akustický model | en |
dc.subject | lingvistický model | en |
dc.subject | TED-LIUM | en |
dc.subject | ASR | en |
dc.subject | TED | cs |
dc.subject | talks | cs |
dc.subject | topic identification | cs |
dc.subject | machine learning | cs |
dc.subject | classification | cs |
dc.subject | transcription | cs |
dc.subject | linear classification | cs |
dc.subject | Kaldi | cs |
dc.subject | support vector machines | cs |
dc.subject | acoustic modeling | cs |
dc.subject | language modeling | cs |
dc.subject | TED-LIUM | cs |
dc.subject | ASR | cs |
dc.title | Topic Identification from Spoken TED-Talks | en |
dc.title.alternative | Topic Identification from Spoken TED-Talks | cs |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2019-06-14 | cs |
dcterms.modified | 2020-05-10-16:13:38 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 121941 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 19:26:53 | en |
sync.item.modts | 2025.01.15 21:57:18 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 859.57 KB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-21519_v.pdf
- Size:
- 85.89 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-21519_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-21519_o.pdf
- Size:
- 86.24 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-21519_o.pdf
Loading...
- Name:
- review_121941.html
- Size:
- 1.45 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_121941.html