Webova aplikace pro efektivní editaci přepisů řeči
Loading...
Date
Authors
Marek, Pavel
Advisor
Referee
Mark
C
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
ORCID
Abstract
Tato bakalářská práce se zabývá návrhem a implementací webové aplikace s názvem EleScribe, která slouží k efektivní kontrole a úpravě automaticky generovaných přepisů řeči. Cílem je zpřístupnit úpravy přepisů i běžným uživatelům bez technického zázemí, a to prostřednic- tvím přehledného, responzivního a snadno ovladatelného rozhraní. Aplikace je postavena na klient-serverové architektuře, kde backend využívá framework FastAPI a frontend je postaven ve Vue.js s použitím Quasar Frameworku. Pro samotný přepis řeči je integrován model Faster Whisper, který umožňuje automatické rozpozná- vání mluveného slova z nahraných videí. Přepisy jsou následně dostupné ve dvou editačních režimech – klasickém a titulkovém – s funkcemi jako zvýraznění slov s nízkou jistotou rozpo- znání, synchronizace s přehrávačem a hromadné operace s přepisy. Nechybí ani organizace do složek, sdílení s jinými uživateli a správa účtu. Výsledkem práce je plně funkční webová aplikace, která uživatelům umožňuje nahrávat video, vygenerovat jeho přepis, provádět úpravy, sdílet ho s ostatními a stáhnout výstup ve formátu TXT nebo SRT. Funkčnost byla ověřena praktickým testováním s důrazem na použitelnost a rychlost editace. Přínosem práce je vytvoření univerzálního nástroje pro práci s přepisy, který je vhodný zejména pro přepis rozhovorů, interview a videomateriálů, kde je kladen důraz na následnou editaci a přesnost výstupu.
This bachelor’s thesis focuses on the design and implementation of a web application na- med EleScribe, developed for efficient review and editing of automatically generated speech transcripts. The goal is to make transcript editing accessible to regular users without tech- nical knowledge by offering a clear, responsive, and user-friendly interface. The application is based on a client-server architecture using FastAPI on the backend and Vue.js with the Quasar Framework on the frontend. For speech recognition, the Faster Whisper model is integrated, allowing automatic transcription of uploaded video content. Transcripts can be edited in two modes – classic and subtitle – with features such as low- confidence word highlighting, synchronization with a media player, and bulk operations. Additional functionality includes organizing transcripts into folders, sharing with other users, and managing user accounts. The result is a fully functional web application that enables users to upload a video, generate its transcript, edit it, share it with others, and export the final transcript in TXT or SRT format. The system was tested with a focus on usability and editing speed. The contribution of this work lies in delivering a practical tool for working with transcripts, especially useful for interviews, conversations, or video content where accurate post-editing is essential.
This bachelor’s thesis focuses on the design and implementation of a web application na- med EleScribe, developed for efficient review and editing of automatically generated speech transcripts. The goal is to make transcript editing accessible to regular users without tech- nical knowledge by offering a clear, responsive, and user-friendly interface. The application is based on a client-server architecture using FastAPI on the backend and Vue.js with the Quasar Framework on the frontend. For speech recognition, the Faster Whisper model is integrated, allowing automatic transcription of uploaded video content. Transcripts can be edited in two modes – classic and subtitle – with features such as low- confidence word highlighting, synchronization with a media player, and bulk operations. Additional functionality includes organizing transcripts into folders, sharing with other users, and managing user accounts. The result is a fully functional web application that enables users to upload a video, generate its transcript, edit it, share it with others, and export the final transcript in TXT or SRT format. The system was tested with a focus on usability and editing speed. The contribution of this work lies in delivering a practical tool for working with transcripts, especially useful for interviews, conversations, or video content where accurate post-editing is essential.
Description
Keywords
Vue.js , Webová aplikace , Quasar , Faster-Whisper , SQLAlchemy , FastAPI , Vue.js , Web application , Quasar , Faster-Whisper , SQLAlchemy , FastAPI
Citation
MAREK, P. Webova aplikace pro efektivní editaci přepisů řeči [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
doc. Ing. Tomáš Martínek, Ph.D. (předseda)
Ing. Vladimír Bartík, Ph.D. (člen)
Ing. Jiří Hynek, Ph.D. (člen)
doc. Mgr. Adam Rogalewicz, Ph.D. (člen)
doc. Ing. Michal Španěl, Ph.D. (člen)
Date of acceptance
2025-06-17
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.
Result of defence
práce byla úspěšně obhájena
