Vyhledávání duplicitních textů

but.committeeprof. RNDr. Alexandr Meduna, CSc. (předseda) doc. Ing. Vladimír Drábek, CSc. (místopředseda) doc. Ing. Vítězslav Beran, Ph.D. (člen) Ing. Bohuslav Křena, Ph.D. (člen) Mgr. Ing. Pavel Očenášek, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D. Otázky u obhajoby: Čím si ve vašem řešení vysvětlujete nemonotónní počet výsledných n-gramů v závislosti na jejich délce?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSmrž, Pavelcs
dc.contributor.authorPekař, Tomášcs
dc.contributor.refereeKouřil, Jancs
dc.date.created2015cs
dc.description.abstractCílem této práce je navrhnout a implementovat systém pro vyhledávání duplicitních textů. Výsledná aplikace by měla umět dokumenty indexovat a také je v indexu vyhledávat. V naší práci se zabýváme předzpracováním dokumentů, jejich fragmentací a indexací. Dále rozebíráme metody vyhledávání duplicit, s čímž je spojena také strategie selekce podřetězců. Práce obsahuje i popis základních datových struktur, které lze použít pro indexaci n-gramů.cs
dc.description.abstractThe aim of this work is to design and implement a system for duplicate text identification. The application should be able to index documents and also searching documents at index. In our work we deal with preprocessing documents, their fragmentation and indexing. Furthermore we analyze methods for duplicate text identification, that are also linked with strategies for selecting substrings. The thesis includes a description of the basic data structures that can be used to index n-grams.en
dc.description.markDcs
dc.identifier.citationPEKAŘ, T. Vyhledávání duplicitních textů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2015.cs
dc.identifier.other88355cs
dc.identifier.urihttp://hdl.handle.net/11012/52511
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectvyhledávánícs
dc.subjecthašcs
dc.subjectduplikátycs
dc.subjectindexacecs
dc.subjectn-gramcs
dc.subjectinvertovaný indexcs
dc.subjectdatové strukturycs
dc.subjectsearchingen
dc.subjecthashen
dc.subjectducplicatesen
dc.subjectindexingen
dc.subjectn-gramen
dc.subjectinverted indexen
dc.subjectdata structuresen
dc.titleVyhledávání duplicitních textůcs
dc.title.alternativeDuplicate Text Identificationen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2015-06-16cs
dcterms.modified2020-05-09-23:41:27cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid88355en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 18:51:42en
sync.item.modts2025.01.15 23:34:32en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
1018.88 KB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-9668_v.pdf
Size:
85.29 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-9668_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-9668_o.pdf
Size:
87.35 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-9668_o.pdf
Loading...
Thumbnail Image
Name:
review_88355.html
Size:
1.42 KB
Format:
Hypertext Markup Language
Description:
file review_88355.html
Collections