Web jako zdroj dat pro automatické vytváření morfologického slovníku
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Smrž, Pavel | cs |
dc.contributor.author | Bulka, Pavol | cs |
dc.contributor.referee | Matějka, Pavel | cs |
dc.date.created | cs | |
dc.description.abstract | Tvorba slov v přirozeném jazyce se zakládá na pravidlech, které jsou komplexní, často je nemožné je jednoznačně formálně definovat. Proto se při zpracování přirozeného jazyka využívají morfologické slovníky. Tato práce se zaobírá vytvářením morfologického slovníku z dat sesbíraných z webových stránek slovenské národní domény. Přičemž se zaměřuje nejen na tvorbu slovníku, ale i na získávání dat, jejich zpracování do použitelné podoby pro účely morfologické analýzy, ale i vhodnými datovými strukturami pro jejich uložení. Dále objasňuje základní principy a pojmy morfologické analýzy a tvorby slov při zpracování přirozeného jazyka počítačem. Vytvořený systém, který je popsaný v této práci, produkuje ze vstupních dat morfologický slovník, který může být použitý v různých aplikacích, například korektoru pravopisu, strojového překladu textu a podobně. | cs |
dc.description.abstract | Creation of natural language words is based on rules, which are generally complex. Often it is very difficult or even impossible to describe them precisely in a formal way. That is why we use a morphological dictionary to process natural language. In this paper we discuss the creation of morphological dictionary from Slovak's top level domain web. We talk about web crawling, data processing for morphological analysis and data structures too. This document makes basic principle and conception of morphological analysis clear. Final system, which is described in this thesis, produces morphological dictionary. This dictionary can be use in various application, for example spell checker, machine translation and so on. | en |
dc.description.mark | B | cs |
dc.identifier.citation | BULKA, P. Web jako zdroj dat pro automatické vytváření morfologického slovníku [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. . | cs |
dc.identifier.other | 25716 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/54761 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Heritrix | cs |
dc.subject | crawling | cs |
dc.subject | crawler | cs |
dc.subject | morfologická analýza | cs |
dc.subject | Slovenčina | cs |
dc.subject | slova | cs |
dc.subject | tvorba slov | cs |
dc.subject | morfologická značka | cs |
dc.subject | slovní vzor | cs |
dc.subject | lemma | cs |
dc.subject | tager | cs |
dc.subject | morfologický slovník | cs |
dc.subject | Heritrix | en |
dc.subject | crawling | en |
dc.subject | crawler | en |
dc.subject | morphological analysis | en |
dc.subject | Slovak language | en |
dc.subject | words | en |
dc.subject | word creation | en |
dc.subject | morphological description | en |
dc.subject | paradigm | en |
dc.subject | lemma | en |
dc.subject | tager | en |
dc.subject | morphological dictionary | en |
dc.title | Web jako zdroj dat pro automatické vytváření morfologického slovníku | cs |
dc.title.alternative | Web as a Source for Automatic Creation of Morphological Dictionary | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.modified | 2020-05-09-23:41:16 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 25716 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.19 16:54:38 | en |
sync.item.modts | 2025.01.17 10:17:10 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |