Poloautomatická normalizace slov z matričních záznamů

but.committeedoc. Ing. František Zbořil, Ph.D. (předseda) doc. RNDr. Dana Hliněná, Ph.D. (místopředseda) doc. Ing. Lukáš Burget, Ph.D. (člen) Ing. František Grézl, Ph.D. (člen) Ing. Josef Strnadel, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Co je míněno shlukem, co jej tvoří, co vše jej určuje a jak se příslušnost ke shluku přesně určuje, neboli jaký konkrétní algoritmus byl pro roztřídění objektů do shluků použit? Jak provádíte tranzitivní uzavření? Jsou prvky shluku ekvivalentní? Podobnost berete jako fuzzy? Jak jste vyhodnocoval funkčnost aplikace?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorRozman, Jaroslavcs
dc.contributor.authorHříbek, Davidcs
dc.contributor.refereeZbořil, Františekcs
dc.date.created2019cs
dc.description.abstractV této práci je řešeno rozšíření webové aplikace DEMoS pro správu matričních záznamů o možnost normalizace (přiřazení normalizované podoby zápisu jednotlivým slovům) jmen, příjmení, povolání, obcí a dalších typů slov, která se vyskytují v matričních záznamech. V řešení byl použit proces detekce duplicitních záznamů, který umožnil roztřídění slov z matričních záznamů do shluků podobných slov. Díky vzniklým shlukům bylo následně možné sdílet normalizované varianty slov v rámci těchto shluků. Aplikace DEMoS tak pro uživatelem zadaná slova navrhuje normalizované varianty použité nejen u stejných slov, ale i u podobných slov. V rámci této práce bylo navrženo automatické testování úspěšnosti shlukování slov. Celkem bylo pro každý typ slov otestováno 640 různých kombinací parametrů shlukování. Následně byly pro každý typ slov vybrány nejlepší parametry shlukování. Díky normalizaci slov je v aplikaci DEMoS výrazně zvýšena efektivita vyhledávání matričních záznamů. Záznamy jsou také lépe čitelné.cs
dc.description.abstractThis work deals with the extension of DEMoS web application for the management of parish records by the possibility of normalization (assignment of a normalized form of writing to individual words) of names, surnames, occupations, domiciles and other types of words occurring in parish records. In the solution, a duplicate record detection process was used, which allowed sorting of the records from parish records into clusters of similar words. As a result of the clustering, it was possible to share normalized word variants within these clusters. Thus, DEMoS suggests normalized variants for words entered by users, used not only for the same words, but also for similar words. In this work, automatic testing of word clustering was proposed. In total, 640 different combinations of clustering parameters were tested for each word type. Subsequently, the best clustering parameters were selected for each word type. By normalizing words, DEMoS application significantly increases the efficiency of searching in parish records. Records are also easier to read.en
dc.description.markAcs
dc.identifier.citationHŘÍBEK, D. Poloautomatická normalizace slov z matričních záznamů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2019.cs
dc.identifier.other121995cs
dc.identifier.urihttp://hdl.handle.net/11012/180166
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectmatriční záznamycs
dc.subjectporovnání datcs
dc.subjectodstranění duplicitcs
dc.subjectnormalizacecs
dc.subjectdetekce duplicitcs
dc.subjectvyhledávánícs
dc.subjectDEMoScs
dc.subjectparish recordsen
dc.subjectdata-matchingen
dc.subjectdeduplicationen
dc.subjectnormalizationen
dc.subjectduplicate detectionen
dc.subjectsearchingen
dc.subjectDEMoSen
dc.titlePoloautomatická normalizace slov z matričních záznamůcs
dc.title.alternativeSemi-Automatic Word Normalization in Parish Recordsen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2019-06-13cs
dcterms.modified2019-07-08-13:31:22cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid121995en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 19:23:48en
sync.item.modts2025.01.17 10:11:53en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav inteligentních systémůcs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
3.43 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-21640_v.pdf
Size:
85.65 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-21640_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-21640_o.pdf
Size:
92.75 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-21640_o.pdf
Loading...
Thumbnail Image
Name:
review_121995.html
Size:
1.46 KB
Format:
Hypertext Markup Language
Description:
file review_121995.html
Collections