Metodika pro převod strukturovaných znalostí z oboru dialektologie do strojového učení

dc.contributor.authorŠimečková, Marta
dc.contributor.authorStupňánek, Bronislav
dc.contributor.authorKarafiát, Martin
dc.contributor.authorVoženílek, Vít
dc.contributor.authorVondráková, Alena
dc.contributor.authorNétek, Rostislav
dc.date.accessioned2025-02-10T07:16:06Z
dc.date.available2025-02-10T07:16:06Z
dc.date.issued2025
dc.descriptionMinisterstvo kultury ČR, Odbor výzkumu a vývoje, Osvědčení č. 304cs
dc.description.abstractMetodika zpracovává problematiku přípravy a využití nářečních dat v dialektologii prostřednictvím moderních technologií strojového učení. Zaměřuje se na procesy konsolidace, standardizace a strukturování audiálních a textových materiálů, které tvoří základ pro vývoj automatických nástrojů pro transkripci řeči. Středobodem je představení postupů uplatnitelných při digitalizaci a normalizaci textových dat, obsahuje rovněž podrobný popis audiální dokumentace nářečí v terénu se zaměřením na různé explorační metody, a to včetně digitální archivace a katalogizace nahrávek. Metodika propojuje teoretické poznatky o sběru a zpracování nářečního materiálu s praktickými postupy, které zahrnují nasazení strojového učení. Důraz je kladen na interdisciplinární přístup, který kombinuje lingvistické znalosti s technologickými nástroji pro automatizaci práce. Součástí metodiky jsou také postupy vizualizace dialektologických dat pomocí tematické kartografie, vedoucí k tvorbě interaktivních zvukových map či webových atlasů. Dokument slouží nejen jako praktický průvodce pro přípravu specifického jazykového materiálu, ale i jako inspirace pro další výzkumné týmy, a to jak v oblasti dialektologie, tak v rámci širšího zapojení strojového učení do humanitních věd.cs
dc.description.abstractThe methodology addresses the preparation and utilization of dialect data in dialectology through modern Machine Learning technologies. It focuses on the processes of consolidating, standardizing, and structuring audial and textual materials, which form the foundation for developing automatic speech transcription tools. The core of the study presents procedures applicable to the digitization and normalization of textual data and it includes a detailed description of dialect documentation in the field, emphasizing various exploratory methods, including digital archiving and cataloging of recordings. The methodology connects theoretical knowledge on the collection and processing of dialect material with practical procedures that involve the deployment of Machine Learning. Emphasis is placed on an interdisciplinary approach that combines linguistic expertise with technological tools for workflow automation. The methodology also includes procedures for visualizing dialectological data using thematic cartography, leading to the creation of interactive sound dialect maps and web-based atlases. This document serves not only as a practical guide for preparing specific linguistic material but also as inspiration for other research teams, both in dialectology and in the broader integration of Machine Learning into the humanities.en
dc.formattext
dc.format.extent253
dc.format.mimetypeapplication/pdfen
dc.identifier.orcid0000-0001-6474-8366
dc.identifier.urihttps://hdl.handle.net/11012/250023
dc.language.isocscs
dc.rights.accessopenAccessen
dc.subjectdialektologiecs
dc.subjectlingvistikacs
dc.subjectnářečí českého jazykacs
dc.subjectdokumentace dialektůcs
dc.subjectnářeční výzkumcs
dc.subjectmetoda rozhovorucs
dc.subjectzvukový archivcs
dc.subjectkatalogizace nahrávekcs
dc.subjectarchivace nahrávekcs
dc.subjectaudiální datacs
dc.subjecttextová datacs
dc.subjectdialektologická transkripcecs
dc.subjectfolklorní transkripcecs
dc.subjectnormalizace textůcs
dc.subjectdigitalizacecs
dc.subjectautomatické rozpoznávání řečics
dc.subjectstrojové učenícs
dc.subjecttematická kartografiecs
dc.subjectzvuková mapacs
dc.subjectinterdisciplinární přístupcs
dc.subjectdialectologyen
dc.subjectlinguisticsen
dc.subjectCzech language dialectsen
dc.subjectdialect documentationen
dc.subjectdialect researchen
dc.subjectinterview methoden
dc.subjectsound archiveen
dc.subjectcataloging of recordingsen
dc.subjectrecording archivingen
dc.subjectaudial dataen
dc.subjecttextual dataen
dc.subjectdialectological transcriptionen
dc.subjectfolklore transcriptionen
dc.subjecttext normalizationen
dc.subjectdigitizationen
dc.subjectautomatic speech recognitionen
dc.subjectmachine learningen
dc.subjectthematic cartographyen
dc.subjectsound mapen
dc.subjectinterdisciplinary approachen
dc.titleMetodika pro převod strukturovaných znalostí z oboru dialektologie do strojového učenícs
dc.title.alternativeMethodology for Transferring Structured Knowledge from Dialectology into Machine Learningen
dc.typemetodikacs
dc.type.versionpublishedVersionen
eprints.grantNumberDH23P03OVV010cs
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Jamap_metodika.pdf
Size:
18.41 MB
Format:
Adobe Portable Document Format
Description: