Zpracování vědeckých článků ve formátu PDF
| but.committee | doc. Dr. Ing. Dušan Kolář (předseda) doc. Ing. Vladimír Janoušek, Ph.D. (člen) Ing. Radek Hranický, Ph.D. (člen) doc. Ing. Jan Kořenek, Ph.D. (člen) Ing. Zdeněk Materna, Ph.D. (člen) | cs |
| but.defence | Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm A. | cs |
| but.jazyk | slovenština (Slovak) | |
| but.program | Informační technologie | cs |
| but.result | práce byla úspěšně obhájena | cs |
| dc.contributor.advisor | Bartík, Vladimír | sk |
| dc.contributor.author | Adamčíková, Tímea | sk |
| dc.contributor.referee | Rychlý, Marek | sk |
| dc.date.created | 2025 | cs |
| dc.description.abstract | Cieľom tejto práce je navrhnúť a implementovať spôsob spracovania vedeckých článkov vo formáte PDF a extrakcie ich názvov, autorov, kľúčových slov a bibliografických citácií. Vytvorená aplikácia umožňuje automatizovane extrahovať tieto informácie, uložiť ich v štruktúrovanej podobe do databázy a vykonať nad nimi analýzu pomocou vygenerovaných grafov, medzi ktoré patrí aj strom znázorňujúci citačné vzťahy medzi analyzovanými článkami. Aplikácia integruje veľký jazykový model Mistral pre alternatívnu identifikáciu bibliografických údajov z citácií. Implementovaný spôsob extrakcie bol porovnaný s existujúcimi riešeniami, otestovaný na vlastnej automaticky vygenerovanej dátovej sade a vyhodnotený na verejnej dátovej sade s takmer 10 000 vedeckými publikáciami. | sk |
| dc.description.abstract | This work aims to design and implement a method for processing scientific articles in PDF format and extracting their titles, authors, keywords, and bibliographic citations. The developed application automatically extracts this information, stores it in a structured format in a database, and enables analysis using the generated graphs, including a tree visualising the citation relationships between the analysed articles. The application integrates the Mistral large language model for the alternative identification of bibliographic data from citations. The implemented extraction method is compared with existing solutions, tested on a custom automatically generated dataset, and evaluated on a public dataset containing nearly 10,000 scientific publications. | en |
| dc.description.mark | A | cs |
| dc.identifier.citation | ADAMČÍKOVÁ, T. Zpracování vědeckých článků ve formátu PDF [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025. | cs |
| dc.identifier.other | 162064 | cs |
| dc.identifier.uri | http://hdl.handle.net/11012/254342 | |
| dc.language.iso | sk | cs |
| dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
| dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
| dc.subject | formát PDF | sk |
| dc.subject | vedecký článok | sk |
| dc.subject | citačný strom | sk |
| dc.subject | bibliografická citácia | sk |
| dc.subject | bibliografické údaje | sk |
| dc.subject | extrakcia | sk |
| dc.subject | extrakcia informácií | sk |
| dc.subject | metadáta | sk |
| dc.subject | PDF format | en |
| dc.subject | scientific article | en |
| dc.subject | citation tree | en |
| dc.subject | bibliographic citation | en |
| dc.subject | bibliographic data | en |
| dc.subject | extraction | en |
| dc.subject | information extraction | en |
| dc.subject | metadata | en |
| dc.title | Zpracování vědeckých článků ve formátu PDF | sk |
| dc.title.alternative | Processing of Scientific Publication in the PDF Format | en |
| dc.type | Text | cs |
| dc.type.driver | bachelorThesis | en |
| dc.type.evskp | bakalářská práce | cs |
| dcterms.dateAccepted | 2025-06-19 | cs |
| dcterms.modified | 2025-06-19-14:09:48 | cs |
| eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
| sync.item.dbid | 162064 | en |
| sync.item.dbtype | ZP | en |
| sync.item.insts | 2025.08.26 23:58:46 | en |
| sync.item.modts | 2025.08.26 20:15:29 | en |
| thesis.discipline | Informační technologie | cs |
| thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémů | cs |
| thesis.level | Bakalářský | cs |
| thesis.name | Bc. | cs |
