Kdo je v novinách? Hledání lidí v historických novinách podle jména
| but.committee | doc. RNDr. Pavel Smrž, Ph.D. (předseda) Ing. Michal Hradiš, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen) Ing. Tomáš Goldmann, Ph.D. (člen) Ing. Martin Žádník, Ph.D. (člen) | cs |
| but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. | cs |
| but.jazyk | čeština (Czech) | |
| but.program | Informační technologie | cs |
| but.result | práce byla úspěšně obhájena | cs |
| dc.contributor.advisor | Vaško, Marek | cs |
| dc.contributor.author | Mrkva, Adam | cs |
| dc.contributor.referee | Herout, Adam | cs |
| dc.date.created | 2025 | cs |
| dc.description.abstract | Tato práce zkoumá využití velkých jazykových modelů k rozpoznávání pojmenovaných osob v českých historických textech. Na rozdíl od přístupů založených na klasifikaci tokenů vyžadujících velké množství trénovacích dat, tato práce zkoumá generativní přístup založený na metodě GPT-NER. Experimenty na různých datových sadách ukazují dobré výsledky. V rozpoznávání osob modely v českých textech dosahují F1 skóre přes 70% na moderních textech a až 50% na textech historických, což je u historických textů srovnatelné s referenč- ním modelem založeným na klasifikaci tokenů. Práce popisuje hlavní problémy při aplikaci na historické texty, zejména délku vět a nejednoznačnost hranic jmen, a navrhuje jejich ře- šení. Výsledky potvrzují potenciál generativního přístupu pro texty s omezeným množstvím trénovacích dat. | cs |
| dc.description.abstract | This work examines the use of large language models for named entity recognition of persons in Czech historical texts. Unlike token classification approaches requiring large amounts of training data, this work implements a generative approach based on the GPT-NER method. Experiments on various datasets show promising results. In person recognition, the models achieve F1 scores over 70% on modern Czech texts and up to 50% on historical texts, which for historical texts is comparable to the reference token classification-based model. The thesis identifies key problems in application to historical texts, particularly sentence length and ambiguity in name boundaries, and proposes solutions. Results confirm the potential of the generative approach for texts with limited training data. | en |
| dc.description.mark | B | cs |
| dc.identifier.citation | MRKVA, A. Kdo je v novinách? Hledání lidí v historických novinách podle jména [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025. | cs |
| dc.identifier.other | 164222 | cs |
| dc.identifier.uri | http://hdl.handle.net/11012/253200 | |
| dc.language.iso | cs | cs |
| dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
| dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
| dc.subject | Rozpoznávání pojmenovaných entit | cs |
| dc.subject | NER | cs |
| dc.subject | velké jazykové modely | cs |
| dc.subject | LLM | cs |
| dc.subject | historické texty | cs |
| dc.subject | český jazyk | cs |
| dc.subject | GPT-NER | cs |
| dc.subject | Named entity recognition | en |
| dc.subject | NER | en |
| dc.subject | large language model | en |
| dc.subject | LLM | en |
| dc.subject | historical texts | en |
| dc.subject | Czech language | en |
| dc.subject | GPT-NER | en |
| dc.title | Kdo je v novinách? Hledání lidí v historických novinách podle jména | cs |
| dc.type | Text | cs |
| dc.type.driver | bachelorThesis | en |
| dc.type.evskp | bakalářská práce | cs |
| dcterms.dateAccepted | 2025-06-17 | cs |
| dcterms.modified | 2025-06-17-16:08:46 | cs |
| eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
| sync.item.dbid | 164222 | en |
| sync.item.dbtype | ZP | en |
| sync.item.insts | 2025.08.26 23:05:40 | en |
| sync.item.modts | 2025.08.26 19:53:15 | en |
| thesis.discipline | Informační technologie | cs |
| thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
| thesis.level | Bakalářský | cs |
| thesis.name | Bc. | cs |
