Analýza recenzí výrobků
but.committee | doc. Mgr. Adam Rogalewicz, Ph.D. (předseda) doc. Ing. Peter Chudý, Ph.D., MBA (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) Dr. Ing. Petr Peringer (člen) RNDr. Marek Rychlý, Ph.D. (člen) Ing. Vladimír Veselý, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: V technické zprávě píšete (pod napisem "Predspracovanie dát" na str. 27-28): """ Síce aktuálne riešenia mapovania sekvencií do vektorového priestoru využívajú vlastné tokenizery, ako napríklad kúsky slov, je vhodné tieto dáta tokenizovať, lemantizovať, poprípade previesť do kmeňového tvaru (stem), odstrániť stop slová, pre ďalšie spracovanie. """, ale už nepíšete, proč je vhodné data tokenizovat vlastním způsobem. Mohl byste toto objasnit? Na str. 29 zmiňujete pojmy "pretrénovanie" a "pred-trénovanie" v tom samém významu, což považuji za chybu (tato chyba se vyskytuje vícekrát, domnívám se tedy, že se nejedná o překlep). Mohl byste vysvětlit pojmy "přetrénování" (over-training) a "předtrénování" (pre-training) v kontextu neuronových sítí? Jak dlouho vám trvalo vytvořit dataset? Zkoušel jste web Heureka.cz kontaktovat? | cs |
but.jazyk | slovenština (Slovak) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Smrž, Pavel | sk |
dc.contributor.author | Klocok, Andrej | sk |
dc.contributor.referee | Doležal, Jan | sk |
dc.date.created | 2020 | cs |
dc.description.abstract | Zákazníci internetových obchodov generujú obrovské množstvo informácii o službách a produktoch pomocou recenzií, ktoré sú dôležitým zdrojom spätnej väzby. Táto diplomová práca sa zaoberá vytvorením systému pre analýzu recenzií výrobkov a obchodov v českom jazyku. Popisuje doterajšie spôsoby analýzy sentimentu a naväzuje na aktuálne riešenia. Výsledný systém implementuje automatické sťahovanie dát a ich indexáciu, následne analýzu sentimentu spolu so sumarizáciou textu v podobe zhlukovania podobných viet na základe vektorovej reprezentácie textu. Súčasťou je aj grafické užívateľské rozhranie vo forme webovej stránky. Počas semestra bol vytvorený dataset recenzií s celkovým počtom prevyšujúci šesť miliónov recenzií spolu s rozhraním na jednoduchý export dát. | sk |
dc.description.abstract | Online store customers generate vast amounts of product and service information through reviews, which are an important source of feedback. This thesis deals with the creation of a system for the analysis of product and shop reviews in the czech language. It describes the current methods of sentiment analysis and builds on current solutions. The resulting system implements automatic data download and their indexing, subsequently sentiment analysis together with text summary in the form of clustering of similar sentences based on vector representation of the text. A graphical user interface in the form of a web page is also included. A review data set with a total of more than six million reviews was created during the semester along with an interface for easy data export. | en |
dc.description.mark | C | cs |
dc.identifier.citation | KLOCOK, A. Analýza recenzí výrobků [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2020. | cs |
dc.identifier.other | 129278 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/192460 | |
dc.language.iso | sk | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | spracovanie prirodzeného jazyka | sk |
dc.subject | recenzia | sk |
dc.subject | analýza sentimentu | sk |
dc.subject | klasifikácia | sk |
dc.subject | extrakcia dát z webu | sk |
dc.subject | strojové učenie | sk |
dc.subject | reprezentácia textu | sk |
dc.subject | natural language processing | en |
dc.subject | review | en |
dc.subject | sentiment analysis | en |
dc.subject | clasification | en |
dc.subject | web scrapping | en |
dc.subject | machine learning | en |
dc.subject | text representation | en |
dc.title | Analýza recenzí výrobků | sk |
dc.title.alternative | Analysis of Product Reviews | en |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2020-07-17 | cs |
dcterms.modified | 2020-07-17-14:44:57 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 129278 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.26 15:31:08 | en |
sync.item.modts | 2025.01.15 16:29:36 | en |
thesis.discipline | Informační systémy | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 2.45 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-22451_v.pdf
- Size:
- 86.03 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-22451_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-22451_o.pdf
- Size:
- 130.01 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-22451_o.pdf
Loading...
- Name:
- review_129278.html
- Size:
- 1.42 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_129278.html