Syntaktický analyzátor pro český jazyk
but.committee | prof. RNDr. Alexandr Meduna, CSc. (předseda) prof. Ing. Tomáš Hruška, CSc. (místopředseda) doc. Ing. Michal Bidlo, Ph.D. (člen) prof. Ing. Jan Holub, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen) doc. Ing. František Zbořil, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D Otázky u obhajoby: V práci nikde neuvádíte výslednou podobu Vámi navržené gramatiky. Můžete tuto gramatiku komisi představit. V rámci semestráního projektu jste navrhoval podobnou gramatiku. Jak se liší gramatika navržená v rámci semestránlího projektu od gramatiky vytvořené v rámci této práce? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Kouřil, Jan | cs |
dc.contributor.author | Beneš, Vojtěch | cs |
dc.contributor.referee | Otrusina, Lubomír | cs |
dc.date.created | 2014 | cs |
dc.description.abstract | Diplomová práce popisuje teoretický návrh a vytvoření syntaktického analyzátoru pro český jazyk pracujícího s frázovým přístupem ke stavbě věty. Využívaná frázová syntaxe je založena na slovních druzích, které jsou sdružovány do větších slovních celků - frází. Implementovaný program pracuje s manuálně sestaveným anotovaným vzorkem dat (korpusem češtiny), na základě kterého za běhu vytvoří pravděpodobnostní bezkontextovou gramatiku (strojové učení). Syntaktický analyzátor, jehož jádrem je rozšířený CKY algoritmus, poté pro zadanou českou větu rozhodne, zda-li patří do jazyka generovaného vytvořenou gramatikou, a v kladném případě vrátí nejpravděpodobnější derivační strom této věty. Tento výsledek je následně porovnán s očekávaným řešením, čímž je vyhodnocena úspěšnost syntaktické analýzy. | cs |
dc.description.abstract | Master’s thesis describes theoretical basics, solution design, and implementation of constituency (phrasal) parser for Czech language, which is based on a part of speech association into phrases. Created program works with manually built and annotated Czech sample corpus to generate probabilistic context free grammar within runtime machine learning. Parser implementation, based on extended CKY algorithm, then for the input Czech sentence decides if the sentence can be generated by the created grammar and for the positive cases constructs the most probable derivation tree. This result is then compared with the expected parse to evaluate constituency parser success rate. | en |
dc.description.mark | D | cs |
dc.identifier.citation | BENEŠ, V. Syntaktický analyzátor pro český jazyk [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2014. | cs |
dc.identifier.other | 79837 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/53265 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Zpracování přirozeného jazyka | cs |
dc.subject | pravděpodobnostní bezkontextová gramatika | cs |
dc.subject | PBKG | cs |
dc.subject | český jazyk | cs |
dc.subject | korpus | cs |
dc.subject | frázový syntax | cs |
dc.subject | rozšířený CKY algoritmus | cs |
dc.subject | syntaktický analyzátor | cs |
dc.subject | Natural language processing | en |
dc.subject | NLP | en |
dc.subject | probabilistic context free grammar | en |
dc.subject | PCFG | en |
dc.subject | Czech language | en |
dc.subject | corpus | en |
dc.subject | phrasal syntax | en |
dc.subject | extended CKY algorithm | en |
dc.subject | constituency parsing | en |
dc.subject | parser | en |
dc.title | Syntaktický analyzátor pro český jazyk | cs |
dc.title.alternative | Syntactic Analyzer for Czech Language | en |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2014-06-24 | cs |
dcterms.modified | 2020-05-10-16:11:40 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 79837 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.26 15:17:04 | en |
sync.item.modts | 2025.01.17 09:42:00 | en |
thesis.discipline | Informační systémy | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |