Určení základního tvaru slova
but.committee | prof. Ing. Zdeněk Smékal, CSc. (předseda) Ing. Robert Vích, DrSc. (místopředseda) doc. Ing. Otto Dostál, CSc. (člen) Ing. Jaromír Hrad, Ph.D. (člen) Ing. Jan Karásek, Ph.D. (člen) Ing. Hicham Atassi, Ph.D. (člen) Ing. Peter Stančík (člen) | cs |
but.defence | Z formálního pohledu je práce na vysoké úrovni. Vytknul bych ale používání anglictiny v cesky psaném textu („brute force“). V textu uvádíte, že použití hrubé síly je výkonnostne nárocné. Uvedte metody, kterými lze výpocetní cas redukovat. Jaká je casová závislost pro jednotlivé prístupy. Jaký je přínos práce z hlediska programování. - Optimalizace již existujícícho softwaru. Jak probíhá lematizace v případě slova "nejsem". | cs |
but.jazyk | čeština (Czech) | |
but.program | Elektrotechnika, elektronika, komunikační a řídicí technika | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Karásek, Jan | cs |
dc.contributor.author | Šanda, Pavel | cs |
dc.contributor.referee | Burget, Radim | cs |
dc.date.created | 2011 | cs |
dc.description.abstract | Lemmatizace je důležitou procedurou před dolováním v textu v mnoha aplikacích. Proces lemmatizace je podobný procesu stemmingu, s tím rozdílem, že neurčuje pouze kořen slova, ale snaží se slovo převést pomocí metod Brute Force a Suffix Stripping do jeho základního tvaru. Hlavním cílem této práce je prezentovat metody pro vylepšení algoritmů lemmatizace českého jazyka. Obsahem je vytvoření trénovací množiny dat, kterou lze libovolně použít pro studentské i vědecké práce zabývající se podobnou problematikou. | cs |
dc.description.abstract | Lemmatization is an important preprocessing step for many applications of text mining. Lemmatization process is similar to the stemming process, with the difference that determines not only the word stem, but it´s trying to determines the basic form of the word using the methods Brute Force and Suffix Stripping. The main aim of this paper is to present methods for algorithmic improvements Czech lemmatization. The created training set of data are content of this paper and can be freely used for student and academic works dealing with similar problematics. | en |
dc.description.mark | A | cs |
dc.identifier.citation | ŠANDA, P. Určení základního tvaru slova [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2011. | cs |
dc.identifier.other | 40048 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/6088 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | STEMMING | cs |
dc.subject | STOP SLOVA | cs |
dc.subject | DOLOVÁNÍ V TEXTU | cs |
dc.subject | TEXT PROCESSING | cs |
dc.subject | ALGORITMUS | cs |
dc.subject | LEMMATIZACE | cs |
dc.subject | LEMMA | cs |
dc.subject | STEMMING | en |
dc.subject | STOP WORDS | en |
dc.subject | TEXT MINING | en |
dc.subject | TEXT PROCESSING | en |
dc.subject | ALGORITHM | en |
dc.subject | LEMMATIZATION | en |
dc.subject | LEMMA | en |
dc.title | Určení základního tvaru slova | cs |
dc.title.alternative | Determination of basic form of words | en |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2011-06-08 | cs |
dcterms.modified | 2011-07-15-10:45:35 | cs |
eprints.affiliatedInstitution.faculty | Fakulta elektrotechniky a komunikačních technologií | cs |
sync.item.dbid | 40048 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.26 11:27:56 | en |
sync.item.modts | 2025.01.16 00:17:59 | en |
thesis.discipline | Telekomunikační a informační technika | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav telekomunikací | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |
Files
License bundle
1 - 1 of 1
Loading...
- Name:
- license.txt
- Size:
- 1.71 KB
- Format:
- Item-specific license agreed upon to submission
- Description: