Vyhledávání nejčastějších n-tic slov

but.committeecs
but.defencecs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSmrž, Pavelcs
dc.contributor.authorHolec, Matúšcs
dc.contributor.refereeSzőke, Igorcs
dc.date.accessioned2019-04-03T22:44:45Z
dc.date.available2019-04-03T22:44:45Z
dc.date.created2009cs
dc.description.abstractTato práce se zabývá návrhem a implementací efektivního systému vyhledávání n-tic slov v textu. Systém je založen na principu dávkového zpracování, což umožňuje zpracování rozsáhlých textů. V první části práce jsou shrnuty principy stávajících metod sloužících pro extrakci n-gramů. V další části je popsán implementovaný systém a následně i jeho urychlení pomocí paralelizace dávkového zpracování. V závěru je uvedeno srovnání výkonnosti dostupných implementací s navrženým systémem, jakož i porovnání časové náročnosti sekvenčního přístupu s paralelním.cs
dc.description.abstractThis thesis deals with design and implementation of effective system for word n-grams extraction from texts. System is based on batch processing therefore it is able to process large text corpuses. The first part contains principles of existing methods for an n-gram extraction. The next part includes description of the implemented system as well as the approach of acceleration system by paralelizing the batch processing. The last part contains efficiency comparison between available implementations and designed system and time complexity comparison between sequential and paralelized approach.en
dc.description.markBcs
dc.identifier.citationHOLEC, M. Vyhledávání nejčastějších n-tic slov [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2009.cs
dc.identifier.other25621cs
dc.identifier.urihttp://hdl.handle.net/11012/54698
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectzpracování přirozeného jazykacs
dc.subjectextrakce n-gramůcs
dc.subjectdávkové zpracovánícs
dc.subjectrozsáhlé textové korpusycs
dc.subjectnatural language processingen
dc.subjectn-gram extractionen
dc.subjectbatch processingen
dc.subjecttext corpuses of large sizeen
dc.titleVyhledávání nejčastějších n-tic slovcs
dc.title.alternativeThe Most Frequent Word n-Gramsen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2009-06-16cs
dcterms.modified2020-05-09-23:41:03cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid25621en
sync.item.dbtypeZPen
sync.item.insts2020.05.10 01:05:10en
sync.item.modts2020.05.10 00:44:21en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
706.02 KB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_25621.html
Size:
1.43 KB
Format:
Hypertext Markup Language
Description:
review_25621.html
Collections