Využití konvolučních neuronových sítí pro predikci finančního selhání podniků
Loading...
Date
Authors
ORCID
Advisor
Mark
P
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta podnikatelská
Abstract
Dizertační práce se zabývá využitím konvolučních neuronových sítí pro predikci finančního selhání podniků. Při zpracování literární rešerše byla použita bibliometrická analýza, která umožnila lepší orientaci ve vědeckých pracích zaměřených na metody a přístupy využívané v minulosti pro predikci finančního selhání podniků. Na základě získaných poznatků byl navržen model hlubokého učení s architekturou GoogLeNet, jehož vstupy tvoří finanční a makroekonomické ukazatele podniků. Modelování bylo založeno na metodě transfer learning (přenosové učení), při které je možné doladit parametry předem vytvořených sítí a urychlit tak proces učení konvoluční neuronové sítě. Výchozí soubor finančních a makroekonomických ukazatelů byl sestaven z proměnných, které byly ve vědeckých pracích nejčastěji používány v modelech predikce selhání podniků. Pro konkrétní výběr ukazatelů, z nichž je model sestaven, byly použity vhodné statistické metody. Vzhledem k tomu, že konvoluční neuronové sítě pracují nejlépe se zpracováním obrazu, byly kvantitativní hodnoty vstupní ukazatelů graficky interpretovány a zkoumáno, který typ grafického zpracování je nejvhodnější pro predikci selhání firem. Z důvodu existence nevyváženého datového souboru byl v práci analyzován vliv metody SMOTE na přesnost predikce modelu. Metoda byla použita pro navýšení počtu vzorků minoritní třídy podniků. Při modelování predikce finančního selhání bylo navrženo a testováno několik variant modelů, které se lišily podobou vstupních dat. Bylo testováno, jakým způsobem ovlivní přesnost predikce odstranění odlehlých hodnot z datového souboru, časový okamžik, ze kterého data pocházejí nebo metoda výběru prediktorů. Na výsledném modelu byly dále doladěny parametry tak, aby byl schopen klasifikovat podniky z nových reálných dat. Z provedeného výzkumu vyplynulo, že s použitím správného typu grafického zpracování vstupních dat, techniky SMOTE a vhodným nastavením parametrů, dokáží konvoluční neuronové sítě s vysokou přesností předpovídat finanční selhání podniků.
The doctoral thesis deals with the use of convolutional neural networks for predicting the financial failure of companies. A bibliometric analysis was used during the processing of the literature review, which enabled a better orientation in scientific works oriented to the methods and approaches used in the past to predict the financial failure of companies. On the basis of the obtained knowledge, a deep learning model based on the GoogLeNet architecture was proposed, with inputs consisting of financial and macroeconomic indicators of companies. The modeling was based on the transfer learning method, in which it is possible to fine-tune the parameters of the pre-established networks to accelerate the learning process of the convolutional neural network. The initial set of financial and macroeconomic indicators was compiled from the variables that were most often used in business failure prediction models in scientific papers. Appropriate statistical methods were used for the specific selection of indicators from which the model is built. Since convolutional neural networks work best with image processing, the quantitative values of the input indicators were graphically interpreted and it was investigated which type of graphical processing is most suitable for predicting the failure of companies. Due to the existence of an unbalanced data set, the effect of the SMOTE method on the accuracy of the model's prediction was analyzed in the thesis. The method was used to increase the number of samples of the minority class of firms. To model the prediction of financial default, several variants of models were proposed, which differed in the form of input data. It was tested how the removal of outliers from the data set, the point in time from which the data come or the method of predictor selection will affect the accuracy of the prediction. The parameters of the resulting model were further fine-tuned so that it was able to classify businesses from new real data. The research conducted showed that using the right type of graphical processing of input data, SMOTE technique and appropriate parameter settings, convolutional neural networks can predict the financial failure of companies with high accuracy.
The doctoral thesis deals with the use of convolutional neural networks for predicting the financial failure of companies. A bibliometric analysis was used during the processing of the literature review, which enabled a better orientation in scientific works oriented to the methods and approaches used in the past to predict the financial failure of companies. On the basis of the obtained knowledge, a deep learning model based on the GoogLeNet architecture was proposed, with inputs consisting of financial and macroeconomic indicators of companies. The modeling was based on the transfer learning method, in which it is possible to fine-tune the parameters of the pre-established networks to accelerate the learning process of the convolutional neural network. The initial set of financial and macroeconomic indicators was compiled from the variables that were most often used in business failure prediction models in scientific papers. Appropriate statistical methods were used for the specific selection of indicators from which the model is built. Since convolutional neural networks work best with image processing, the quantitative values of the input indicators were graphically interpreted and it was investigated which type of graphical processing is most suitable for predicting the failure of companies. Due to the existence of an unbalanced data set, the effect of the SMOTE method on the accuracy of the model's prediction was analyzed in the thesis. The method was used to increase the number of samples of the minority class of firms. To model the prediction of financial default, several variants of models were proposed, which differed in the form of input data. It was tested how the removal of outliers from the data set, the point in time from which the data come or the method of predictor selection will affect the accuracy of the prediction. The parameters of the resulting model were further fine-tuned so that it was able to classify businesses from new real data. The research conducted showed that using the right type of graphical processing of input data, SMOTE technique and appropriate parameter settings, convolutional neural networks can predict the financial failure of companies with high accuracy.
Description
Citation
ŠEBESTOVÁ, M. Využití konvolučních neuronových sítí pro predikci finančního selhání podniků [online]. Brno: Vysoké učení technické v Brně. Fakulta podnikatelská. 2023.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Řízení a ekonomika podniku
Comittee
doc. Ing. Marie Pavláková Dočekalová, Ph.D. (předseda)
doc. Ing. Miloš Koch, CSc. (člen)
prof. Ing. Vojtěch Koráb, Dr., MBA (člen)
prof. Ing. et Ing. Stanislav Škapa, Ph.D. (člen)
doc. Ing. Bronislav Chramcov, Ph.D. (člen)
prof. Ing. Radim Lenort, Ph.D. (člen)
prof. Ing. Mária Režňáková, CSc. (člen)
Date of acceptance
2023-06-02
Defence
Doktorandka odpověděla na položené dotazy. Komise hodnotí vystoupení doktorandky kladně.
Odpověděla na otázky oponentů:
- V kapitole 5.1. provádíte test normality dat na základě Kolmogorova-Smirnova a Shapiro-Wilkova testu. Dovedla byste uvést další testy normality? Proč jste vybrala právě výše uvedené?Na základě testu normality dle výše uvedených metod jste se rozhodla v další části práce používat neparametrické statistické testy. Můžete stručně definovat rozdíl mezi parametrickým a neparametrickým testem? Uveďte příklady neparametrických testů, které jste použila ve vaší práci.
- V kapitole 5.4. testujete různé varianty modelů s různou grafickou podobou vstupních dat. Ve většině případů se ukázalo, že nejlepší celkové přesnosti dosahovaly modely s typem grafického zobrazení vstupních dat AREA nebo PLOT. Čím si vysvětlujete, že se mezi nejlepšími neobjevuje typ IMAGE?
- Jaké závěry lze učinit z detailních bibliometrických analýz typu geografického rozložení publikací, klíčových slov a kocitací dokumentů? Byly tyto výstupy použity v rámci řešení disertační práce?
- Jak byl stanoven výzkumný vzorek? V kapitole 3.5 autorka uvádí, že 520 podniků bylo vybráno náhodným výběrem. Z kapitoly 4.2 jsem nabyl dojmu, že byly vybrány všechny společnosti, které lze zařadit mezi mikro, malé a střední podniky a současně pro ně byly dostupné kompletní účetní výkazy.
- Podle mého názoru je v kapitole 2.6 rozpor při vymezení chyby I. a II. druhu ve srovnání s aplikací těchto chyb v kapitole 5.4.3 (definice jsou přehozeny). Je tomu tak?
- Vytvořený model je založen na datech malých a středních podniků stavebního průmyslu v ČR. Lze jej použít i pro posuzování finančního selhání velkých podniků v daném oboru?
- Bude uvedený model v praxi využíván? Jaké jsou hardwarové a softwarové požadavky na jeho provozování?
- V celé práci postrádám nevýhody použití zvoleného přístupu. Není žádný? Kdokoli a kdykoli může převzít Vámi vytvořený model a bezprostředně jej aplikovat na stavební podniky? celé práci postrádám nevýhody použití zvoleného přístupu. Není žádný? Kdokoli a kdykoli může převzít Vámi vytvořený model a bezprostředně jej aplikovat na stavební podniky?
- Jak probíhal výběr aktivních podniků? Jaká část podniku působících v zkoumaném oboru byla zařazena do výzkumu?
- V práci postrádám definici výpočtu ukazatelů minimálně v příloze. Jak byl kvantifikován výpočet cash flow v ukazatelích CF/S, CF/TA, CF/TL? Tento ukazatel bývá často aproximován prostřednictvím ukazatele EBITDA, autorka však uvádí i tento ukazatel v seznamu použitých ukazatelů.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení