Crowdsourcingová tvorba datové sady pro rozpoznání struktury vyprávění

but.committeedoc. Ing. Ondřej Ryšavý, Ph.D. (předseda) doc. Dr. Ing. Otto Fučík (místopředseda) doc. Ing. Michal Bidlo, Ph.D. (člen) Ing. Ondřej Lengál, Ph.D. (člen) Ing. Igor Szőke, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D. Otázky u obhajoby: V práci uvádíte, že jste uživatele odměňoval vyšší bodovou odměnou v případech, kdy označil věty, které SentenceBERT nevyhodnotil jako přínosné pro porovnání filmů. Zvažoval jste, jaké negativní důsledky na anotace to mohlo mít? Proč jste v tabulkách na obrázcích 8.4 a 8.5 nezařadil žádné trénovací vzorky do Vaší datové sady? Jaké jiné jazyky jste zvažoval? Je nějaký problém přepnout jazyk řešení do jiného jazyka? Jaká jsou praktická uplatnění? Dalo by se řešení aplikovat i na psanou literaturu? Jak velkou roli hraje struktura vyprávění? Mohl by být systém využit k hledání plagiátů?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSmrž, Pavelcs
dc.contributor.authorIgnác, Igorcs
dc.contributor.refereeDočekal, Martincs
dc.date.created2020cs
dc.description.abstractCieľom tejto práce je vytvorenie rozsiahlej dátovej sady pre rozpoznanie štruktúry rozprávania metódou crowdsourcingu. Pre tento účel bolo nutné vytvoriť webové rozhranie umožňujúce anotáciu dátovej sady filmov užívateľmi. Anotovanie dát získaných z filmovej databázy IMDb v aplikácii je založené na troch odlišných typoch anotácie. Užívatelia validujú výpočet podobností obsahov filmov modelom Sentence-BERT, extrakciu kľúčových slov z obsahov filmov modelom RAKE a predpočítané podobnosti filmov na základe ich kľúčových slov. Gamifikácia užívateľov je postavená na priradzovaní bodov a s nimi spojenými odznakmi, úspechoch a rebríčku najúspešnejších užívateľov.cs
dc.description.abstractGoal of this work is creation of extensive dataset for recognition of narrative structure by crowdsourcing method. For this purpose, it was necessary to create a web interface which offers dataset of films for user annotation. The annotation of data gained from IMDb database is established on three different types of annotation. Users validate similarity of movies based on computation done by Sentence-BERT, extraction of keywords from movie plots done by RAKE and precomputed similarity between movies based on their keywords. User's gamification is based on points assignment, which are related with badges, achievements accomplishment and leader board of most successful users.en
dc.description.markDcs
dc.identifier.citationIGNÁC, I. Crowdsourcingová tvorba datové sady pro rozpoznání struktury vyprávění [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2020.cs
dc.identifier.other129064cs
dc.identifier.urihttp://hdl.handle.net/11012/191462
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectCrowdsourcingcs
dc.subjectgamifikáciacs
dc.subjectwebová aplikáciacs
dc.subjectpodobnosť príbehovcs
dc.subjectextrakcia kľúčových slovcs
dc.subjectSentence-BERTcs
dc.subjectRAKEcs
dc.subjectAngularcs
dc.subjectCrowdsourcingen
dc.subjectgamificationen
dc.subjectweb applicationen
dc.subjectnarrative similarityen
dc.subjectkeyword extractionen
dc.subjectSentence-BERTen
dc.subjectRAKEen
dc.subjectAngularen
dc.titleCrowdsourcingová tvorba datové sady pro rozpoznání struktury vyprávěnícs
dc.title.alternativeCreating Dataset for Narrative Structure Recognition by Crowdsourcingen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2020-07-08cs
dcterms.modified2020-07-13-23:41:07cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid129064en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 19:29:04en
sync.item.modts2025.01.17 11:36:40en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
3.04 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-22792_v.pdf
Size:
86.13 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-22792_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-22792_o.pdf
Size:
89.81 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-22792_o.pdf
Loading...
Thumbnail Image
Name:
review_129064.html
Size:
1.47 KB
Format:
Hypertext Markup Language
Description:
file review_129064.html
Collections