Zlepšení předpovědi sociálních značek využitím Data Mining

but.committeeprof. Ing. Oldřich Rejnuš, CSc. (předseda) doc. RNDr. Bedřich Půža, CSc. (místopředseda) Ing. Lenka Širáňová, Ph.D. (člen) Ing. Jiří Kříž, Ph.D. (člen) Ing. Karel Doubravský, Ph.D. (člen)cs
but.defenceOtázky vedoucího práce - odpovězeno. Otázky oponenta práce - odpovězeno. Ing. Doubravský Lze návrhy použít i u dalších typů souborů? Odpovězeno doc. Půža Byly návrhy aplikovány i v jiných oblastech např. na klíčová slova? Odpovězeno Ing. Smolíková Jaké jsou klíčové faktory ovlivňující datamining? Odpovězenocs
but.jazykslovenština (Slovak)
but.programSystémové inženýrství a informatikacs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorKříž, Jiřísk
dc.contributor.authorHarár, Pavolsk
dc.contributor.refereeGaláž, Zoltánsk
dc.date.created2015cs
dc.description.abstractDiplomová práca sa zaoberá využitím Text miningu ako metódy na predikovanie značiek článkov. Práca popisuje iteratívny spôsob narábania s veľkými súbormi dát, ich rozbor, čistenie a výpočet skóre TF-IDF pre výrazy vyskytujúce sa v článku. Detailne popisuje priebeh programu naprogramovaného v jazyku Python 3.4.3. Výsledkom spracovania viac ako 1 milióna článkov databázy webovej encyklopédie Wikipédia je slovník výrazov anglického jazyka, pomocou ktorej je možné určiť n najdôležitejších výrazov vlastných článku z korpusu článkov. Relevantnosť výsledných značiek dokazuje vhodnosť použitej metódy.sk
dc.description.abstractThis master’s thesis deals with using Text mining as a method to predict tags of articles. It describes the iterative way of handling big data files, parsing the data, cleaning the data and scoring of terms in article using TF-IDF. It describes in detail the flow of program written in programming language Python 3.4.3. The result of processing more than 1 million articles from Wikipedia database is a dictionary of English terms. By using this dictionary one is capable of determining the most important terms from article in corpus of articles. Relevancy of consequent tags proves the method used in this case.en
dc.description.markCcs
dc.identifier.citationHARÁR, P. Zlepšení předpovědi sociálních značek využitím Data Mining [online]. Brno: Vysoké učení technické v Brně. Fakulta podnikatelská. 2015.cs
dc.identifier.other76739cs
dc.identifier.urihttp://hdl.handle.net/11012/39521
dc.language.isoskcs
dc.publisherVysoké učení technické v Brně. Fakulta podnikatelskács
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectText miningsk
dc.subjectData miningsk
dc.subjectTF-IDFsk
dc.subjectiteratívny rozborsk
dc.subjectskóringsk
dc.subjectznačkysk
dc.subjectPythonsk
dc.subjectText miningen
dc.subjectData miningen
dc.subjectTF-IDFen
dc.subjectiterative parsingen
dc.subjectscoringen
dc.subjecttagsen
dc.subjectPythonen
dc.titleZlepšení předpovědi sociálních značek využitím Data Miningsk
dc.title.alternativeImproved Prediction of Social Tags Using Data Miningen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2015-06-12cs
dcterms.modified2015-06-17-08:31:57cs
eprints.affiliatedInstitution.facultyFakulta podnikatelskács
sync.item.dbid76739en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 16:53:25en
sync.item.modts2025.01.17 13:26:24en
thesis.disciplineInformační managementcs
thesis.grantorVysoké učení technické v Brně. Fakulta podnikatelská. Ústav informatikycs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
1.58 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_76739.html
Size:
6.45 KB
Format:
Hypertext Markup Language
Description:
file review_76739.html
Collections