Metody klasifikace textu v kontextu webových stránek

but.committeedoc. Ing. Radek Burget, Ph.D. (předseda) doc. Ing. Petr Matoušek, Ph.D., M.A. (člen) prof. RNDr. Alexandr Meduna, CSc. (člen) RNDr. Marek Rychlý, Ph.D. (člen) Ing. Vladimír Bartík, Ph.D. (člen) Ing. Šárka Květoňová, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.cs
but.jazykčeština (Czech)
but.programInformační technologie a umělá inteligencecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorBurget, Radekcs
dc.contributor.authorTrstenský, Patrikcs
dc.contributor.refereeBartík, Vladimírcs
dc.date.created2023cs
dc.description.abstractTato práce se zabývá problematikou klasifikací textu v kontextu webových stránek. Zkoumá dostupné metody klasifikace a jejich přesnost nad čistým textem z webové stránky. Zabývá se sestrojením datasetu pro trénování těchto metod pro konkrétní doménu. Data pro vytvoření datasetu získáváme z veřejně dostupných stránek, které využívají RDF dokumentů zadefinovaných v HTML kódu. Závěr práce sestává z vytvoření dvou datasetů pro dvě různé domény, dále z využití těchto datasetů na trénování modelů a následného testování jejich přesnosti.cs
dc.description.abstractThis work deals with the issue of text classification in the context of websites. It examines available classification methods and their accuracy over web page plain text. It deals with constructing a dataset for training these methods for a specific domain. We obtain data for creating the dataset from publicly available websites that utilize RDF documents defined in HTML code. The conclusion of the work consists of the creation of two datasets for two different domains. Furthermore, the use of these datasets for training models and testing of their accuracy.en
dc.description.markCcs
dc.identifier.citationTRSTENSKÝ, P. Metody klasifikace textu v kontextu webových stránek [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.cs
dc.identifier.other147036cs
dc.identifier.urihttp://hdl.handle.net/11012/213210
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectklasifikace textucs
dc.subjectrozpoznávání pojmenovaných entitcs
dc.subjectdolování informací z webucs
dc.subjectPythoncs
dc.subjectSémantický webcs
dc.subjectJSON-LDcs
dc.subjectRDFcs
dc.subjectDBPediacs
dc.subjecttext clasificationen
dc.subjectnamed entity recognitionen
dc.subjectweb miningen
dc.subjectSemantic weben
dc.subjectPythonen
dc.subjectJSON-LDen
dc.subjectRDFen
dc.subjectDBPediaen
dc.titleMetody klasifikace textu v kontextu webových stránekcs
dc.title.alternativeText Classification Methods in the Context of Web Pagesen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2023-06-21cs
dcterms.modified2023-08-24-13:02:44cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid147036en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 15:37:32en
sync.item.modts2025.01.15 22:58:40en
thesis.disciplineInformační systémy a databázecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémůcs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
3.35 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_147036.html
Size:
10.11 KB
Format:
Hypertext Markup Language
Description:
file review_147036.html
Collections