Aplikace pro sumarizaci textu
but.committee | prof. Ing. Tomáš Hruška, CSc. (předseda) doc. RNDr. Jitka Kreslíková, CSc. (místopředseda) doc. Ing. Michal Bidlo, Ph.D. (člen) doc. RNDr. Milan Češka, Ph.D. (člen) Ing. Igor Szőke, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Provedené experimenty byly zaměřeny odděleně na varianty používající algoritmus TextRank a algoritmus LSA. Můžete je na základě dosažených výsledků porovnat vzájemně? Jaký je stav v oblasti sumarizace pro texty v češtině? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Bartík, Vladimír | cs |
dc.contributor.author | Mička, Jakub | cs |
dc.contributor.referee | Zendulka, Jaroslav | cs |
dc.date.created | 2019 | cs |
dc.description.abstract | V této práci jsem se zaměřil na implementaci webové aplikace, která slouží jako prostředek pro automatickou tvorbu souhrnů v anglickém jazyce. Automatická tvorba souhrnů je v řešení prováděna pomocí metody TextRank a Latentní sémantické analýzy. Obě tyto metody jsou vylepšeny o rozpoznávání pojmenovaných entit. Přínosem této práce je zjištění, že využití rozpoznávání pojmenovaných entit u Latentní sémantické analýzy a především u metody TextRank, vede k vytváření kvalitnějších souhrnů. Tato kvalita souhrnů byla ověřena pomocí metrik ROUGE. | cs |
dc.description.abstract | This work is focused on an implementation a web application, which is a tool for automatic English text summarization. In result, automatic text summarization is made by TextRank and Latent semantic analysis method. Both of these methods are improved by named entity recognition. The main benefit of this work is proving that using the named entity recognition with Latent semantic analysis and especially with TextRank method leads to creation of higher quality summaries. This quality of the summaries was verified by ROUGE metrics. | en |
dc.description.mark | A | cs |
dc.identifier.citation | MIČKA, J. Aplikace pro sumarizaci textu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2019. | cs |
dc.identifier.other | 122002 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/180168 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | sumarizace textu | cs |
dc.subject | zpracování přirozeného jazyka | cs |
dc.subject | ROUGE | cs |
dc.subject | Python | cs |
dc.subject | TextRank | cs |
dc.subject | Latentní sémantická analýza | cs |
dc.subject | lematizace | cs |
dc.subject | stematizace | cs |
dc.subject | pojmenované entity | cs |
dc.subject | stop slova | cs |
dc.subject | tokenizace | cs |
dc.subject | text summarization | en |
dc.subject | natural language processing | en |
dc.subject | ROUGE | en |
dc.subject | Python | en |
dc.subject | TextRank | en |
dc.subject | Latent semantic analysis | en |
dc.subject | lemmatization | en |
dc.subject | stemmatization | en |
dc.subject | named entities | en |
dc.subject | stop words | en |
dc.subject | tokenization | en |
dc.title | Aplikace pro sumarizaci textu | cs |
dc.title.alternative | Application for Text Summarization | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2019-06-12 | cs |
dcterms.modified | 2019-07-08-13:31:22 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 122002 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 19:23:51 | en |
sync.item.modts | 2025.01.17 12:40:28 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémů | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |