Metody sumarizace dokumentů na webu

but.committeedoc. Ing. František Zbořil, CSc. (předseda) doc. Dr. Ing. Dušan Kolář (místopředseda) prof. RNDr. Milan Češka, CSc. (člen) Mgr. Ing. Pavel Očenášek, Ph.D. (člen) Dr. Ing. Petr Peringer (člen) doc. Ing. Stanislav Racek, CSc. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B Otázky u obhajoby: Která sumarizační metoda je nevhodnější pro použití na sémanticky značkované jazyky? Co jsou to anaforické vztahy a jak s nimi v práci pracujete?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorBartík, Vladimírcs
dc.contributor.authorBelica, Michalcs
dc.contributor.refereeOčenášek, Pavelcs
dc.date.accessioned2019-04-03T22:25:57Z
dc.date.available2019-04-03T22:25:57Z
dc.date.created2013cs
dc.description.abstractPráce se zabývá sumarizací dokumentů ve formátu HTML. Jako jazyk webových dokumentů byla zvolena čeština. Práce je zaměřená na algoritmy sumarizace textů. Součástí práce je však i předzpracování sumarizovaného dokumentu a převod textu na reprezentaci vhodnou pro sumarizační algoritmy. Práce krátce pojednává o všeobecném dolování textů a později se zaměřuje na sumarizaci. Představené jsou dva jednoduché sumarizační algoritmy, přičemž práce se zaměřuje na pokročilý algoritmus využívající latentní sémantické analýzy. Výsledkem práce je návrh a implementace sumarizačního modulu pro jazyk Python. Souhrny generované implementovanými sumarizačními metodami jsou v závěrečné kapitole porovnány pomocí evaluačních metod i z pohledu subjektivního hodnocení autora práce.cs
dc.description.abstractThe work deals with automatic summarization of documents in HTML format. As a language of web documents, Czech language has been chosen. The project is focused on algorithms of text summarization. The work also includes document preprocessing for summarization and conversion of text into representation suitable for summarization algorithms. General text mining is also briefly discussed but the project is mainly focused on the automatic document summarization. Two simple summarization algorithms are introduced. Then, the main attention is paid to an advanced algorithm that uses latent semantic analysis. Result of the work is a design and implementation of summarization module for Python language. Final part of the work contains evaluation of summaries generated by implemented summarization methods and their subjective comparison of the author.en
dc.description.markBcs
dc.identifier.citationBELICA, M. Metody sumarizace dokumentů na webu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2013.cs
dc.identifier.other79364cs
dc.identifier.urihttp://hdl.handle.net/11012/53529
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectdolování z datcs
dc.subjectsumarizace textůcs
dc.subjectredukce datcs
dc.subjectextrakce dat z webucs
dc.subjectPythoncs
dc.subjectNLPcs
dc.subjectzpracovávání přirozeného jazykacs
dc.subjectlatentní sémantická analýzacs
dc.subjectLSAcs
dc.subjectsingulární dekompozicecs
dc.subjectSVDcs
dc.subjectdata miningen
dc.subjecttext summarizationen
dc.subjectdata reductionen
dc.subjectweb-data extractionen
dc.subjectPythonen
dc.subjectNLPen
dc.subjectnatural language processingen
dc.subjectlatent semantic analysisen
dc.subjectLSAen
dc.subjectsingular value decompositionen
dc.subjectSVDen
dc.titleMetody sumarizace dokumentů na webucs
dc.title.alternativeMethods of Document Summarization on the Weben
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2013-06-14cs
dcterms.modified2020-05-10-16:11:13cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid79364en
sync.item.dbtypeZPen
sync.item.insts2021.11.12 19:12:38en
sync.item.modts2021.11.12 18:34:40en
thesis.disciplineInteligentní systémycs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémůcs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
646.73 KB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_79364.html
Size:
1.44 KB
Format:
Hypertext Markup Language
Description:
review_79364.html
Collections