Predikce demografického vývoje populace s využitím strojového učení
Loading...
Date
Authors
Ponechal, Adrián
Advisor
Referee
Mark
D
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
ORCID
Abstract
Populačný vývoj začína byť čím ďalej, tým viac skúmanou oblasťou. Narastajúci počet ľudí spôsobuje aj väčšiu spotrebu prírodných alebo štátnych zdrojov. Pri včasnom odhalení neočakávaných trendov je možné prijať opatrenia, ktoré týmto situáciam predídu. Aktuálny vývoj strojového učenia poskytol nástroje, ktoré dokážu takéto trendy odhaliť. V tejto práci boli preskúmané existujúce prístupy, ktoré sú používané na predikciu vývoja populácie, konkrétne štatistické metódy ARIMA a ARIMAX so strojovým učením (XGBoost, LightGBM, Random Forest, RNN, GRU, LSTM). Na základe dátovej sady, ktorá obsahuje dáta o viac ako 200 populáciách, boli navrhnuté a implementované dva hybridné modely: ARIMA + XGBoost a LSTM + XGBoost. Tieto modely vedia zachytiť trend vybranej populácie a predpovedať vývoj parametrov. V najlepších prípadoch modely predpovedali vývoj rozloženia pohlaví s chybou 0{,}005\% (podľa metriky RMSE) a vekových skupín s chybou 0{,}1\% (podľa metriky RMSE). Kombinácia modelov ARIMA + XGBoost je efektívna na presnejšie krátkodobé predikcie, zatiaľčo kombinácia LSTM + XGBoost vie generovať predpovede pre dlhší časový úsek, hoci s menšou presnosťou. Výsledné modely sú využívané na predikciu a úpravu demografických parametrov pri vytváraní populácií digitálnych respondentov, čím sa zaoberá firma Lakmoos AI, s.r.o.
Population development is becoming an increasingly studied area. The growing number of people also leads to greater consumption of natural or state resources. By detecting un\-expected trends early, it is possible to implement measures to prevent such situations. The recent development of machine learning has provided tools capable of identifying such trends. This work examined existing approaches used to predict population development, specifically the statistical methods ARIMA and ARIMAX with machine learning (XGBoost, LightGBM, Random Forest, RNN, GRU, LSTM). Based on a dataset containing information on more than 200 populations, two hybrid models combining ARIMA + XGBoost and LSTM + XGBoost were designed and implemented. These models can capture the trend of the selected population and predict the development of target parameters. In best cases, the models could predict gender distribution with an error of 0.005\% (based on RMSE metric) and development of age group distribution with an error of 0.1\% (based on RMSE metric). The ARIMA + XGBoost is effective for the short-term predictions, but the combination LSTM + XGBoost can generate longer predictions, although with less accuracy. The resulting models are used for predicting and adjusting demographic parameters in the creation of digital respondent populations, which is a focus area of the company Lakmoos AI, s.r.o.
Population development is becoming an increasingly studied area. The growing number of people also leads to greater consumption of natural or state resources. By detecting un\-expected trends early, it is possible to implement measures to prevent such situations. The recent development of machine learning has provided tools capable of identifying such trends. This work examined existing approaches used to predict population development, specifically the statistical methods ARIMA and ARIMAX with machine learning (XGBoost, LightGBM, Random Forest, RNN, GRU, LSTM). Based on a dataset containing information on more than 200 populations, two hybrid models combining ARIMA + XGBoost and LSTM + XGBoost were designed and implemented. These models can capture the trend of the selected population and predict the development of target parameters. In best cases, the models could predict gender distribution with an error of 0.005\% (based on RMSE metric) and development of age group distribution with an error of 0.1\% (based on RMSE metric). The ARIMA + XGBoost is effective for the short-term predictions, but the combination LSTM + XGBoost can generate longer predictions, although with less accuracy. The resulting models are used for predicting and adjusting demographic parameters in the creation of digital respondent populations, which is a focus area of the company Lakmoos AI, s.r.o.
Description
Keywords
Citation
PONECHAL, A. Predikce demografického vývoje populace s využitím strojového učení [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.
Document type
Document version
Date of access to the full text
Language of document
sk
Study field
Informační technologie
Comittee
doc. Ing. František Zbořil, Ph.D. (předseda)
RNDr. Marek Rychlý, Ph.D. (člen)
doc. Ing. Zdeněk Vašíček, Ph.D. (člen)
doc. Ing. Vítězslav Beran, Ph.D. (člen)
Ing. Ivana Burgetová, Ph.D. (člen)
Date of acceptance
2025-06-18
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D.
Result of defence
práce byla úspěšně obhájena
