Web jako zdroj dat pro automatické vytváření morfologického slovníku

but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSmrž, Pavelcs
dc.contributor.authorBulka, Pavolcs
dc.contributor.refereeMatějka, Pavelcs
dc.date.createdcs
dc.description.abstractTvorba slov v přirozeném jazyce se zakládá na pravidlech, které jsou komplexní, často je nemožné je jednoznačně formálně definovat. Proto se při zpracování přirozeného jazyka využívají morfologické slovníky. Tato práce se zaobírá vytvářením morfologického slovníku z dat sesbíraných z webových stránek slovenské národní domény. Přičemž se zaměřuje nejen na tvorbu slovníku, ale i na získávání dat, jejich zpracování do použitelné podoby pro účely morfologické analýzy, ale i vhodnými datový­mi strukturami pro jejich uložení. Dále objasňuje základní principy a pojmy morfologické analýzy a tvorby slov při zpracování přirozeného jazyka počítačem. Vytvořený systém, který je popsaný v této práci, produkuje ze vstupních dat morfologický slovník, který může být použitý v různých aplikacích, například korektoru pravopisu, strojového překladu textu a podobně.cs
dc.description.abstractCreation of natural language words is based on rules, which are generally complex. Often it is very difficult or even impossible to describe them precisely in a formal way. That is why we use a morpho­logical dictionary to process natural language. In this paper we discuss the creation of morphological dictionary from Slovak's top level domain web. We talk about web crawling, data processing for mor­phological analysis and data structures too. This document makes basic principle and conception of morphological analysis clear. Final system, which is described in this thesis, produces morphological dictionary. This dictionary can be use in various application, for example spell checker, machine translation and so on.en
dc.description.markBcs
dc.identifier.citationBULKA, P. Web jako zdroj dat pro automatické vytváření morfologického slovníku [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. .cs
dc.identifier.other25716cs
dc.identifier.urihttp://hdl.handle.net/11012/54761
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectHeritrixcs
dc.subjectcrawlingcs
dc.subjectcrawlercs
dc.subjectmorfologická analýzacs
dc.subjectSlovenčinacs
dc.subjectslovacs
dc.subjecttvorba slovcs
dc.subjectmorfologická značkacs
dc.subjectslovní vzorcs
dc.subjectlemmacs
dc.subjecttagercs
dc.subjectmorfologický slovníkcs
dc.subjectHeritrixen
dc.subjectcrawlingen
dc.subjectcrawleren
dc.subjectmorphological analysisen
dc.subjectSlovak languageen
dc.subjectwordsen
dc.subjectword creationen
dc.subjectmorphological descriptionen
dc.subjectparadigmen
dc.subjectlemmaen
dc.subjecttageren
dc.subjectmorphological dictionaryen
dc.titleWeb jako zdroj dat pro automatické vytváření morfologického slovníkucs
dc.title.alternativeWeb as a Source for Automatic Creation of Morphological Dictionaryen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.modified2020-05-09-23:41:16cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid25716en
sync.item.dbtypeZPen
sync.item.insts2025.03.19 16:54:38en
sync.item.modts2025.01.17 10:17:10en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
582.47 KB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_25716.html
Size:
1.46 KB
Format:
Hypertext Markup Language
Description:
file review_25716.html
Collections