Metody dolování dat pro analýzu textů

but.committeedoc. Ing. Bohumil Klíma, Ph.D. (předseda) prof. Ing. Pavel Václavek, Ph.D. (místopředseda) doc. Ing. Petr Beneš, Ph.D. (člen) Ing. Martin Čala, Ph.D. (člen) Ing. Tomáš Jílek, Ph.D. (člen) Ing. Petr Petyovský, Ph.D. (člen) Ing. Radek Štohl, Ph.D. (člen)cs
but.defenceStudent provedl obhajbu bakalářské práce a popsal svoje dosažené výsledky. Byly přečteny posudky a student odpovědel na otázku oponenta: Co vyplýva z obrázků 1.1 a 5.12? Proběhla diskuze a student odpovědel na dotazy komise: Celkový přínos a smysl využití výsledků této práce. Interpretace dat v obrázku 5.12. Student obhájil bakalářskou práci. Komise neměla žádné námitky k řešené práci. V průběhu odborné rozpravy odpověděl na dotazy.cs
but.jazykčeština (Czech)
but.programAutomatizační a měřicí technikacs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorDohnal, Přemyslcs
dc.contributor.authorKozák, Ondřejcs
dc.contributor.refereeMarcoň, Petrcs
dc.date.accessioned2022-06-15T07:54:46Z
dc.date.available2022-06-15T07:54:46Z
dc.date.created2022cs
dc.description.abstractTato bakalářská práce se zabývá prozkoumáním aktuální metodiky a možností textového dolování a následné aplikace některých metod. V rámci práce byly popsány metody pro předzpracování, metody pro převedení textu do vektorového prostoru a metody pro analýzu textu a diskutováno jejich možné použití. Na text byly použity jednotlivé metody pro předzpracování a následně bylo demonstrováno převedení do vektorového prostoru jednoduchými metodami jako jsou BOW, Bag of n-grams, TF-IDF nebo metodami se strojovým učením které jsou FastText a GloVe. Na získané vektory byly použity metody LSA, LDA, TextRank, kosinová podobnost, pro získání informací z textu.cs
dc.description.abstractThis bachelor thesis explores the current methodology and possibilities of text mining and the subsequent application of some methods. The thesis described methods for preprocessing, methods for converting text to vector space and methods for text analysis and discusses their possible applications. The different preprocessing methods were applied to the text and then the conversion to vector space was demonstrated using simple methods such as BOW, Bag of n-grams, TF-IDF or with machine learning methods which are FastText and GloVe. LSA, LDA, TextRank and cosine similarity methods were applied to the extracted vectors to extract information from the text.en
dc.description.markBcs
dc.identifier.citationKOZÁK, O. Metody dolování dat pro analýzu textů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2022.cs
dc.identifier.other141631cs
dc.identifier.urihttp://hdl.handle.net/11012/205585
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectTextové dolovánícs
dc.subjectTF-IDFcs
dc.subjectBOWcs
dc.subjectLSAcs
dc.subjectLDAcs
dc.subjectFastTextcs
dc.subjectGloVecs
dc.subjectTextRankcs
dc.subjectkosinová podobnostcs
dc.subjectText miningen
dc.subjectTF-IDFen
dc.subjectBOWen
dc.subjectLSAen
dc.subjectLDAen
dc.subjectFastTexten
dc.subjectGloVeen
dc.subjectTextRanken
dc.subjectcosine similarityen
dc.titleMetody dolování dat pro analýzu textůcs
dc.title.alternativeData Mining Methods for Text Analysisen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2022-06-14cs
dcterms.modified2022-06-14-14:11:49cs
eprints.affiliatedInstitution.facultyFakulta elektrotechniky a komunikačních technologiícs
sync.item.dbid141631en
sync.item.dbtypeZPen
sync.item.insts2022.06.15 09:54:46en
sync.item.modts2022.06.15 08:18:04en
thesis.disciplinebez specializacecs
thesis.grantorVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav automatizace a měřicí technikycs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
3.84 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
appendix-1.zip
Size:
11.55 MB
Format:
zip
Description:
appendix-1.zip
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-Posudek Ondrej Kozak 1.pdf
Size:
121.16 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-Posudek Ondrej Kozak 1.pdf
Loading...
Thumbnail Image
Name:
review_141631.html
Size:
6.52 KB
Format:
Hypertext Markup Language
Description:
review_141631.html
Collections