Multi-label klasifikace textových dokumentů

Loading...
Thumbnail Image
Date
Authors
Průša, Petr
ORCID
Mark
C
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Diplomová práce se zabývá automatickou klasifikací textových dokumentů. Jsou zde vysvětleny základní pojmy a problémy dolování z textu. Práce vysvětluje pojem shlukování a ukazuje několik základních algoritmů shlukování. Je zde ukázáno i několik metod klasifikace a podrobně je rozebrána vybraná metoda matrix regression. Dále byla navrhnuta a implementována aplikace používající ke klasifikaci matrix regression. Provedené experimenty byly zaměřeny na normalizaci a prahování.
The master's thesis deals with automatic classifi cation of text document. It explains basic terms and problems of text mining. The thesis explains term clustering and shows some basic clustering algoritms. The thesis also shows some methods of classi fication and deals with matrix regression closely. Application using matrix regression for classifi cation was designed and developed. Experiments were focused on normalization and thresholding.
Description
Citation
PRŮŠA, P. Multi-label klasifikace textových dokumentů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2012.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační systémy
Comittee
prof. Ing. Tomáš Hruška, CSc. (předseda) doc. Dr. Ing. Petr Hanáček (místopředseda) doc. RNDr. Jitka Kreslíková, CSc. (člen) Ing. Zbyněk Křivka, Ph.D. (člen) Prof. Ing. Pavol Návrat, Ph.D. (člen) doc. Ing. František Zbořil, Ph.D. (člen)
Date of acceptance
2012-06-18
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm dobře. Otázky u obhajoby: Jaký formát vstupních dat je podporován Vaší aplikací? Proč jste si zvolil zrovna tento formát dat? Je možné Vaši aplikaci použít i na klasifikaci textových dokumentů v jiném jazyce než jste testoval (např. v češtině)?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO