Zpracování vědeckých článků ve formátu PDF

but.committeedoc. Dr. Ing. Dušan Kolář (předseda) doc. Ing. Vladimír Janoušek, Ph.D. (člen) Ing. Radek Hranický, Ph.D. (člen) doc. Ing. Jan Kořenek, Ph.D. (člen) Ing. Zdeněk Materna, Ph.D. (člen)cs
but.defenceStudentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm A.cs
but.jazykslovenština (Slovak)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorBartík, Vladimírsk
dc.contributor.authorAdamčíková, Tímeask
dc.contributor.refereeRychlý, Mareksk
dc.date.created2025cs
dc.description.abstractCieľom tejto práce je navrhnúť a implementovať spôsob spracovania vedeckých článkov vo formáte PDF a extrakcie ich názvov, autorov, kľúčových slov a bibliografických citácií. Vytvorená aplikácia umožňuje automatizovane extrahovať tieto informácie, uložiť ich v štruktúrovanej podobe do databázy a vykonať nad nimi analýzu pomocou vygenerovaných grafov, medzi ktoré patrí aj strom znázorňujúci citačné vzťahy medzi analyzovanými článkami. Aplikácia integruje veľký jazykový model Mistral pre alternatívnu identifikáciu bibliografických údajov z citácií. Implementovaný spôsob extrakcie bol porovnaný s existujúcimi riešeniami, otestovaný na vlastnej automaticky vygenerovanej dátovej sade a vyhodnotený na verejnej dátovej sade s takmer 10 000 vedeckými publikáciami.sk
dc.description.abstractThis work aims to design and implement a method for processing scientific articles in PDF format and extracting their titles, authors, keywords, and bibliographic citations. The developed application automatically extracts this information, stores it in a structured format in a database, and enables analysis using the generated graphs, including a tree visualising the citation relationships between the analysed articles. The application integrates the Mistral large language model for the alternative identification of bibliographic data from citations. The implemented extraction method is compared with existing solutions, tested on a custom automatically generated dataset, and evaluated on a public dataset containing nearly 10,000 scientific publications.en
dc.description.markAcs
dc.identifier.citationADAMČÍKOVÁ, T. Zpracování vědeckých článků ve formátu PDF [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.cs
dc.identifier.other162064cs
dc.identifier.urihttp://hdl.handle.net/11012/254342
dc.language.isoskcs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectformát PDFsk
dc.subjectvedecký článoksk
dc.subjectcitačný stromsk
dc.subjectbibliografická citáciask
dc.subjectbibliografické údajesk
dc.subjectextrakciask
dc.subjectextrakcia informáciísk
dc.subjectmetadátask
dc.subjectPDF formaten
dc.subjectscientific articleen
dc.subjectcitation treeen
dc.subjectbibliographic citationen
dc.subjectbibliographic dataen
dc.subjectextractionen
dc.subjectinformation extractionen
dc.subjectmetadataen
dc.titleZpracování vědeckých článků ve formátu PDFsk
dc.title.alternativeProcessing of Scientific Publication in the PDF Formaten
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2025-06-19cs
dcterms.modified2025-06-19-14:09:48cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid162064en
sync.item.dbtypeZPen
sync.item.insts2025.08.26 23:58:46en
sync.item.modts2025.08.26 20:15:29en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémůcs
thesis.levelBakalářskýcs
thesis.nameBc.cs

Files

Original bundle

Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
2.71 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_162064.html
Size:
9.23 KB
Format:
Hypertext Markup Language
Description:
file review_162064.html

Collections