Automatické zařazování neznámých slov na základě derivačních vazeb
Journal Title
Journal ISSN
Volume Title
Vysoké učení technické v Brně. Fakulta informačních technologií
Tato diplomová práce se zabývá vytvořením systému pro automatické zařazování neznámých slov na základě derivačních vazeb. Pro tento účel byl systém navržen tak, aby z~elektronických slovníkových dat získával derivační vazby a jejich rozborem z nich vytvářel slovotvorné modely. Na základě těchto znalostí je poté možné začleňovat nezařazená slova do stávajících hnízd, utvořených ze získaných vazeb, a jejich modelů, případně vytvářet nové. Čtenář bude postupně seznámen s důvody, které vedou k neustálé proměně či rozšiřování slovní zásoby, budou vysvětleny způsoby, jakými se odvozují slova v českém jazyce, a jak lze získat informace o změnách slov, vzniklých během derivačního procesu. Tento systém navazuje a rozšiřuje výzkum oblasti derivační morfologie v projektu morfologický analyzátor Výzkumné skupiny znalostních technologií, působící na Fakultě informačních technologií Vysokého učení technického v Brně.
This master thesis deals with the construction of a system for automatic classification of~unknown words based on derivation bonds. For this purpose, the system was designed to~extract derivative links based on electronic dictionaries and to create word-forming models from them. Based on this knowledge, it is then possible to incorporate unclassified words into existing nests formed from the obtained bonds, and their models, or create new ones. The reader will be gradually acquainted with the reasons that lead to the continuous transformation or expansion of the lexicon, the ways in which the words in~the~Czech language are derived and how to obtain information about the changes caused by this derivation process. This system builds on and extends the research of the branch of morphology in~the~project of a morphological analyzer of the Research Group of Knowledge Technologies, working at the Faculty of Information Technology of the Brno University of~Technology.
This master thesis deals with the construction of a system for automatic classification of~unknown words based on derivation bonds. For this purpose, the system was designed to~extract derivative links based on electronic dictionaries and to create word-forming models from them. Based on this knowledge, it is then possible to incorporate unclassified words into existing nests formed from the obtained bonds, and their models, or create new ones. The reader will be gradually acquainted with the reasons that lead to the continuous transformation or expansion of the lexicon, the ways in which the words in~the~Czech language are derived and how to obtain information about the changes caused by this derivation process. This system builds on and extends the research of the branch of morphology in~the~project of a morphological analyzer of the Research Group of Knowledge Technologies, working at the Faculty of Information Technology of the Brno University of~Technology.
český jazyk, derivační morfologie, derivační vazby, derivace, lingvistika, slovotvorba, slovotvorný model, hnízdění, slovotvorná báze, formanty, czech language, derivative morphology, derivative bonds, derivation, linguistics, word formation, word-formation model, nesting, word-formation base, formants
FALTUSOVÁ, M. Automatické zařazování neznámých slov na základě derivačních vazeb [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2020.
Document type
Document version
Date of access to the full text
Language of document
Study field
Bioinformatika a biocomputing
prof. Ing. Lukáš Sekanina, Ph.D. (předseda)
doc. Ing. Jiří Jaroš, Ph.D. (místopředseda)
Ing. Michal Bidlo, Ph.D. (člen)
doc. RNDr. Milan Češka, Ph.D. (člen)
Ing. Lukáš Kekely, Ph.D. (člen)
Ing. Tomáš Martínek, Ph.D. (člen)
Date of acceptance
Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm velmi dobře. Otázky u obhajoby: Jaký byl proces vzniku skórovací matice? Bylo by možné tvorbu skórovací matice alespoň částečně automatizovat, případně co by tomu bránilo? Využíváte nějakým způsobem kontext? Umožňuje vámi navržený přístup i z pracování jiných jazyků než čestiny?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení