Metody stemmingu používané při dolování textu

but.committeeprof. Ing. Tomáš Hruška, CSc. (předseda) doc. Ing. Vladimír Janoušek, Ph.D. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) Doc. Ing. Jiří Douša, CSc. (člen) doc. Ing. Přemysl Kršek, Ph.D. (člen) doc. Ing. František Zbořil, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: Vzhledem k tomu, že jste reimplementoval řadu existujících metod, zhodnoťte jejich přínos oproti existujícím implementacím.cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorBartík, Vladimírcs
dc.contributor.authorAdámek, Tomášcs
dc.contributor.refereeChmelař, Petrcs
dc.date.created2010cs
dc.description.abstractTématem této diplomové práce je problematika jednotlivých metod pro dolování z anglických textových dokumentů. Hlavní část této práce se zabývá analýzou metod pro předzpracování textu, konkrétně stemmingem. Jsou zde rozebrány jednotlivé algoritmy stemmingu (Lovinsův, Porterův a Paice/Husk), které z jednotlivých slov textového dokumentu získávají jejich základní tvar (kořen), za použití speciálních lexikografických pravidel anglického jazyka. Tyto kořeny slov jsou následně uloženy do strukturované podoby pro další zpracování. Další část práce se zabývá návrhem aplikace, která tyto algoritmy využívá pro svoji činnost. Aplikace je postavena na platformě Java s využitím grafické knihovny Swing a architektury MVC. Další kapitola popisuje implementaci navržené aplikace a stemovacích algoritmů v jazyce Java. Poslední kapitola je zaměřena na experimenty s jednotlivými algoritmy a jejich srovnání z hlediska vlivu na výsledky klasifikace textu.cs
dc.description.abstractThe main theme of this master's thesis is a description of text mining. This document is specialized to English texts and their automatic data preprocessing. The main part of this thesis analyses various stemming algorithms (Lovins, Porter and Paice/Husk). Stemming is a procedure for automatic conflating semantically related terms together via the use of rule sets. Next part of this thesis describes design of an application for various types of stemming algorithms. Application is based on the Java platform with using of graphic library Swing and MVC architecture. Next chapter contains description of implementation of the application and stemming algorithms. In the last part of this master's thesis experiments with stemming algorithms and comparing the algorithm from viewpoint to the results of classification the text are described.en
dc.description.markBcs
dc.identifier.citationADÁMEK, T. Metody stemmingu používané při dolování textu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2010.cs
dc.identifier.other34956cs
dc.identifier.urihttp://hdl.handle.net/11012/52789
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectStemmingcs
dc.subjectdolování v textucs
dc.subjectvyhledávání informací v textucs
dc.subjectklasifikacecs
dc.subjectJavacs
dc.subjectSwingcs
dc.subjectpředzpracování textucs
dc.subjectMVC architekturacs
dc.subjectRapidMinercs
dc.subjectWeka.cs
dc.subjectStemmingen
dc.subjecttext miningen
dc.subjectinformation retrievalen
dc.subjectclassificationen
dc.subjectJavaen
dc.subjectSwingen
dc.subjecttext preprocessingen
dc.subjectMVC architectureen
dc.subjectRapidMineren
dc.subjectWeka.en
dc.titleMetody stemmingu používané při dolování textucs
dc.title.alternativeStemming Methods Used in Text Miningen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2010-06-18cs
dcterms.modified2020-05-09-23:42:14cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid34956en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 14:47:41en
sync.item.modts2025.01.17 09:58:48en
thesis.disciplineInformační systémycs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémůcs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
5.8 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_34956.html
Size:
1.45 KB
Format:
Hypertext Markup Language
Description:
file review_34956.html
Collections