Metody dolování dat pro analýzu textů
but.committee | doc. Ing. Bohumil Klíma, Ph.D. (předseda) prof. Ing. Pavel Václavek, Ph.D. (místopředseda) doc. Ing. Petr Beneš, Ph.D. (člen) Ing. Martin Čala, Ph.D. (člen) Ing. Tomáš Jílek, Ph.D. (člen) Ing. Petr Petyovský, Ph.D. (člen) Ing. Radek Štohl, Ph.D. (člen) | cs |
but.defence | Student provedl obhajbu bakalářské práce a popsal svoje dosažené výsledky. Byly přečteny posudky a student odpovědel na otázku oponenta: Co vyplýva z obrázků 1.1 a 5.12? Proběhla diskuze a student odpovědel na dotazy komise: Celkový přínos a smysl využití výsledků této práce. Interpretace dat v obrázku 5.12. Student obhájil bakalářskou práci. Komise neměla žádné námitky k řešené práci. V průběhu odborné rozpravy odpověděl na dotazy. | cs |
but.jazyk | čeština (Czech) | |
but.program | Automatizační a měřicí technika | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Dohnal, Přemysl | cs |
dc.contributor.author | Kozák, Ondřej | cs |
dc.contributor.referee | Marcoň, Petr | cs |
dc.date.accessioned | 2022-06-15T07:54:46Z | |
dc.date.available | 2022-06-15T07:54:46Z | |
dc.date.created | 2022 | cs |
dc.description.abstract | Tato bakalářská práce se zabývá prozkoumáním aktuální metodiky a možností textového dolování a následné aplikace některých metod. V rámci práce byly popsány metody pro předzpracování, metody pro převedení textu do vektorového prostoru a metody pro analýzu textu a diskutováno jejich možné použití. Na text byly použity jednotlivé metody pro předzpracování a následně bylo demonstrováno převedení do vektorového prostoru jednoduchými metodami jako jsou BOW, Bag of n-grams, TF-IDF nebo metodami se strojovým učením které jsou FastText a GloVe. Na získané vektory byly použity metody LSA, LDA, TextRank, kosinová podobnost, pro získání informací z textu. | cs |
dc.description.abstract | This bachelor thesis explores the current methodology and possibilities of text mining and the subsequent application of some methods. The thesis described methods for preprocessing, methods for converting text to vector space and methods for text analysis and discusses their possible applications. The different preprocessing methods were applied to the text and then the conversion to vector space was demonstrated using simple methods such as BOW, Bag of n-grams, TF-IDF or with machine learning methods which are FastText and GloVe. LSA, LDA, TextRank and cosine similarity methods were applied to the extracted vectors to extract information from the text. | en |
dc.description.mark | B | cs |
dc.identifier.citation | KOZÁK, O. Metody dolování dat pro analýzu textů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2022. | cs |
dc.identifier.other | 141631 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/205585 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Textové dolování | cs |
dc.subject | TF-IDF | cs |
dc.subject | BOW | cs |
dc.subject | LSA | cs |
dc.subject | LDA | cs |
dc.subject | FastText | cs |
dc.subject | GloVe | cs |
dc.subject | TextRank | cs |
dc.subject | kosinová podobnost | cs |
dc.subject | Text mining | en |
dc.subject | TF-IDF | en |
dc.subject | BOW | en |
dc.subject | LSA | en |
dc.subject | LDA | en |
dc.subject | FastText | en |
dc.subject | GloVe | en |
dc.subject | TextRank | en |
dc.subject | cosine similarity | en |
dc.title | Metody dolování dat pro analýzu textů | cs |
dc.title.alternative | Data Mining Methods for Text Analysis | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2022-06-14 | cs |
dcterms.modified | 2022-06-14-14:11:49 | cs |
eprints.affiliatedInstitution.faculty | Fakulta elektrotechniky a komunikačních technologií | cs |
sync.item.dbid | 141631 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2022.06.15 09:54:46 | en |
sync.item.modts | 2022.06.15 08:18:04 | en |
thesis.discipline | bez specializace | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav automatizace a měřicí techniky | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 3.84 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-Posudek Ondrej Kozak 1.pdf
- Size:
- 121.16 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-Posudek Ondrej Kozak 1.pdf
Loading...
- Name:
- review_141631.html
- Size:
- 6.52 KB
- Format:
- Hypertext Markup Language
- Description:
- review_141631.html