Vyhledávání duplicitních textů
but.committee | prof. RNDr. Alexandr Meduna, CSc. (předseda) doc. Ing. Vladimír Drábek, CSc. (místopředseda) doc. Ing. Vítězslav Beran, Ph.D. (člen) Ing. Bohuslav Křena, Ph.D. (člen) Mgr. Ing. Pavel Očenášek, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D. Otázky u obhajoby: Čím si ve vašem řešení vysvětlujete nemonotónní počet výsledných n-gramů v závislosti na jejich délce? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Smrž, Pavel | cs |
dc.contributor.author | Pekař, Tomáš | cs |
dc.contributor.referee | Kouřil, Jan | cs |
dc.date.created | 2015 | cs |
dc.description.abstract | Cílem této práce je navrhnout a implementovat systém pro vyhledávání duplicitních textů. Výsledná aplikace by měla umět dokumenty indexovat a také je v indexu vyhledávat. V naší práci se zabýváme předzpracováním dokumentů, jejich fragmentací a indexací. Dále rozebíráme metody vyhledávání duplicit, s čímž je spojena také strategie selekce podřetězců. Práce obsahuje i popis základních datových struktur, které lze použít pro indexaci n-gramů. | cs |
dc.description.abstract | The aim of this work is to design and implement a system for duplicate text identification. The application should be able to index documents and also searching documents at index. In our work we deal with preprocessing documents, their fragmentation and indexing. Furthermore we analyze methods for duplicate text identification, that are also linked with strategies for selecting substrings. The thesis includes a description of the basic data structures that can be used to index n-grams. | en |
dc.description.mark | D | cs |
dc.identifier.citation | PEKAŘ, T. Vyhledávání duplicitních textů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2015. | cs |
dc.identifier.other | 88355 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/52511 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | vyhledávání | cs |
dc.subject | haš | cs |
dc.subject | duplikáty | cs |
dc.subject | indexace | cs |
dc.subject | n-gram | cs |
dc.subject | invertovaný index | cs |
dc.subject | datové struktury | cs |
dc.subject | searching | en |
dc.subject | hash | en |
dc.subject | ducplicates | en |
dc.subject | indexing | en |
dc.subject | n-gram | en |
dc.subject | inverted index | en |
dc.subject | data structures | en |
dc.title | Vyhledávání duplicitních textů | cs |
dc.title.alternative | Duplicate Text Identification | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2015-06-16 | cs |
dcterms.modified | 2020-05-09-23:41:27 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 88355 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 18:51:42 | en |
sync.item.modts | 2025.01.15 23:34:32 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 1018.88 KB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-9668_v.pdf
- Size:
- 85.29 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-9668_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-9668_o.pdf
- Size:
- 87.35 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-9668_o.pdf
Loading...
- Name:
- review_88355.html
- Size:
- 1.42 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_88355.html