Metody strojového učení ve zpracování přirozeného jazyka
but.committee | prof. Ing. Jan M. Honzík, CSc. (předseda) prof. Ing. Tomáš Vojnar, Ph.D. (místopředseda) Ing. Jaroslav Ráb (člen) Ing. Josef Strnadel, Ph.D. (člen) doc. Ing. František Zbořil, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " C ". Otázky u obhajoby: Jaká je baseline pro experimenty (úspěšnost taggeru, který přiřadí každému slovu jeho nejčastější značku), při použití stejných pozic značky jako v experimentech? Je dosažená úspěšnost uváděna pro evaluční sadu určenou v PDT, nebo byla evaluační data vybrána jinak? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Otrusina, Lubomír | cs |
dc.contributor.author | Vantuch, Marek | cs |
dc.contributor.referee | Mrnuštík, Michal | cs |
dc.date.created | 2011 | cs |
dc.description.abstract | Práce se zabývá automatickým značkováním českého jazyka za pomocí existujících implementací, využívajících model Conditional Random Fields a algoritmy L-BFGS a SDG. Jsou popsány základní pravidla značkování a problémy, se kterými se tento obor potýká v případě zpracování českého jazyka. Čtenáři jsou vysvětleny principy použitých algoritmů a modelů, které jsou implementovány v programech CRF++ a CRFSuite. Práce se poté zaměřuje na vlastní testování úspěšnosti na českém korpusu a snaží se nalézt nejvhodnější hodnoty parametrů při využití všech rysů. Při nalezení rozumného kompromisu mezi časem a přesností se poté snaží tuto hodnotu ještě zpřesnit za pomoci analýzy přínosu jednotlivých rysů a možností jejich vynechání. | cs |
dc.description.abstract | Firstly, basic rules of tagging of the Czech language are described as well as problems connected to this field. Thereafter the focus of the thesis is put on the success rate of testing on the Czech corpus and at the same time trying to find the most suitable parameter values for using the features. After reaching a reasonable compromise between duration and accuracy, the value is then attempted to be improved using analysis of separate features and their eventual omission. | en |
dc.description.mark | C | cs |
dc.identifier.citation | VANTUCH, M. Metody strojového učení ve zpracování přirozeného jazyka [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2011. | cs |
dc.identifier.other | 42751 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/55836 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | strojové učení | cs |
dc.subject | značkování textu | cs |
dc.subject | Conditional Random Fields | cs |
dc.subject | L-BFGS | cs |
dc.subject | Machine Learning | en |
dc.subject | POS tagging | en |
dc.subject | Conditional Random Fields | en |
dc.subject | L-BFGS | en |
dc.title | Metody strojového učení ve zpracování přirozeného jazyka | cs |
dc.title.alternative | Machine-Learning Methods in Natural Language Processing | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2011-06-16 | cs |
dcterms.modified | 2020-05-09-23:42:52 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 42751 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 17:51:39 | en |
sync.item.modts | 2025.01.15 15:38:41 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |