Detekce klíčových informací v hovorech na tísňové linky

Sarvaš, Marek

Detekce klíčových informací v hovorech na tísňové linky

Files

final-thesis.pdf(2.93 MB)

review_156967.html(10.1 KB)

Authors

Sarvaš, Marek

Advisor

Schwarz, Petr

Referee

Plchot, Oldřich

Mark

A

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

Abstract

Tiesňové volania sa zvyčajne uskutočňujú v extrémne stresujúcich podmienkach, kde volajúci často poskytuje dôležité informácie rýchlo, čo sťažuje operátorom tiesňovej linky presne zachytiť všetky podrobnosti. To môže viesť k opakovaným otázkam o už poskytnutých informáciách a oneskoreniu reakcie pohotovostnej služby. Cieľom tejto práce je zmierniť tento problém a potenciálne urýchliť reakciu pohotovostných služieb nasadením neurónovej siete na extrakciu informácií, konkrétne so zameraním na úlohu Rozpoznávania pomenovaných entít (NER). Táto práca skúma rôzne prístupy založené na architektúre typu Transformers, ako sú predtrénované enkodér modely, enkodér-dekodér (sequence-2-sequence) a veľké jazykové modely. Vybrané modely dosiahli zatiaľ najlepšie výsledky na verejne dostupných českých NER datasetoch. Okrem toho boli vytvorené nové NER datasety z poskytnutých nahrávok skutočných tiesňových volaní a odpovedajúcich metadát. Predstavené modely boli natrénované a vyhodnotené na týchto novovytvorených datasetoch a úspešne dosiahli rozumné výsledky pre extrakciu mien a polohy.
Emergency calls are usually made under extremely stressful conditions, where callers often provide crucial information rapidly, making it difficult for emergency line agents to capture all details accurately. This can result in repeated questions about information that was already provided and cause delays in response times from emergency services. This work aims to mitigate this problem and potentially speed up the response of emergency services by deploying a neural network models for information extraction, specifically targeting the Named Entity Recognition (NER) task. This work explores various Transformer-based approaches for NER task, such as pre-trained encoder-only, encoder-decoder (sequence-2-sequence) and Large Language Models. The best models achieved state-of-the-art results on publicly available Czech NER datasets. In addition, new NER datasets were created from available recordings of real emergency calls and the corresponding metadata. The models were trained and evaluated on the created datasets successfully achieving reasonable performance in name and location extraction.

Keywords

spracovanie prirodzeného jazyka, rozpoznávanie menných entít, hovory tiesňovej linky, veľké jazykové modely, natural language processing, Named Entity Recognition, emergency line calls, Large Language Models

Citation

SARVAŠ, M. Detekce klíčových informací v hovorech na tísňové linky [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.

Language of document

en

Study field

Strojové učení

Comittee

doc. Ing. Lukáš Burget, Ph.D. (předseda) doc. RNDr. Pavel Smrž, Ph.D. (člen) Ing. Zbyněk Křivka, Ph.D. (člen) doc. Ing. František Zbořil, Ph.D. (člen) Ing. František Grézl, Ph.D. (člen) Ing. Vojtěch Mrázek, Ph.D. (člen)

Date of acceptance

2024-06-19

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.

Result of defence

práce byla úspěšně obhájena

Document licence

Standardní licenční smlouva - přístup k plnému textu bez omezení