Určení základního tvaru slova

but.committeeprof. Ing. Zdeněk Smékal, CSc. (předseda) Ing. Robert Vích, DrSc. (místopředseda) doc. Ing. Otto Dostál, CSc. (člen) Ing. Jaromír Hrad, Ph.D. (člen) Ing. Jan Karásek, Ph.D. (člen) Ing. Hicham Atassi, Ph.D. (člen) Ing. Peter Stančík (člen)cs
but.defenceZ formálního pohledu je práce na vysoké úrovni. Vytknul bych ale používání anglictiny v cesky psaném textu („brute force“). V textu uvádíte, že použití hrubé síly je výkonnostne nárocné. Uvedte metody, kterými lze výpocetní cas redukovat. Jaká je casová závislost pro jednotlivé prístupy. Jaký je přínos práce z hlediska programování. - Optimalizace již existujícícho softwaru. Jak probíhá lematizace v případě slova "nejsem".cs
but.jazykčeština (Czech)
but.programElektrotechnika, elektronika, komunikační a řídicí technikacs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorKarásek, Jancs
dc.contributor.authorŠanda, Pavelcs
dc.contributor.refereeBurget, Radimcs
dc.date.created2011cs
dc.description.abstractLemmatizace je důležitou procedurou před dolováním v textu v mnoha aplikacích. Proces lemmatizace je podobný procesu stemmingu, s tím rozdílem, že neurčuje pouze kořen slova, ale snaží se slovo převést pomocí metod Brute Force a Suffix Stripping do jeho základního tvaru. Hlavním cílem této práce je prezentovat metody pro vylepšení algoritmů lemmatizace českého jazyka. Obsahem je vytvoření trénovací množiny dat, kterou lze libovolně použít pro studentské i vědecké práce zabývající se podobnou problematikou.cs
dc.description.abstractLemmatization is an important preprocessing step for many applications of text mining. Lemmatization process is similar to the stemming process, with the difference that determines not only the word stem, but it´s trying to determines the basic form of the word using the methods Brute Force and Suffix Stripping. The main aim of this paper is to present methods for algorithmic improvements Czech lemmatization. The created training set of data are content of this paper and can be freely used for student and academic works dealing with similar problematics.en
dc.description.markAcs
dc.identifier.citationŠANDA, P. Určení základního tvaru slova [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2011.cs
dc.identifier.other40048cs
dc.identifier.urihttp://hdl.handle.net/11012/6088
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectSTEMMINGcs
dc.subjectSTOP SLOVAcs
dc.subjectDOLOVÁNÍ V TEXTUcs
dc.subjectTEXT PROCESSINGcs
dc.subjectALGORITMUScs
dc.subjectLEMMATIZACEcs
dc.subjectLEMMAcs
dc.subjectSTEMMINGen
dc.subjectSTOP WORDSen
dc.subjectTEXT MININGen
dc.subjectTEXT PROCESSINGen
dc.subjectALGORITHMen
dc.subjectLEMMATIZATIONen
dc.subjectLEMMAen
dc.titleUrčení základního tvaru slovacs
dc.title.alternativeDetermination of basic form of wordsen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2011-06-08cs
dcterms.modified2011-07-15-10:45:35cs
eprints.affiliatedInstitution.facultyFakulta elektrotechniky a komunikačních technologiícs
sync.item.dbid40048en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 11:27:56en
sync.item.modts2025.01.16 00:17:59en
thesis.disciplineTelekomunikační a informační technikacs
thesis.grantorVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav telekomunikacícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
4.51 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_40048.html
Size:
7.02 KB
Format:
Hypertext Markup Language
Description:
file review_40048.html
License bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description:
Collections