Využití strojového učení pro predikci odchodu zákazníka

Abstract
Disertační práce se zaměřuje na predikci odchodu zákazníků v prostředí elektronického maloobchodu. Text představuje současný stav vědeckého bádání, analyzuje klíčové trendy a identifikuje příležitosti pro další výzkum. Literární rešerše je dílem realizována prostřednictvím metod pro zpracování přirozeného jazyka. Cílem práce je navrhnout, implementovat a zhodnotit systém strojového učení pro predikci odchodu zákazníků v elektronickém maloobchodě, který reflektuje perspektivy ekonomického dopadu navazujících retenčních aktivit a umožňuje bližší porozumění modelovanému jevu. Vlastní řešení je strukturováno do částí vymezení problému, porozumění a zpracování dat, modelování, vyhodnocení, interpretace a produkční nasazení systému. Nad rámec klasického pojetí odchodu zákazníka, jako absence transakce v budoucím období, je představeno nové pojetí inkrementálního ekonomického dopadu retenční kampaně. Přístupy jsou ověřeny na dvou datových souborech. V rámci modelování je uvažováno o GLM, SVM, ANN, rozhodovacích stromech a meta-algoritmech. Vnější parametry vlastního zpracování dat a konstrukce modelu jsou odhadnuty s pomocí Bayesovské optimalizace. Porozumění modelovaným jevům je podpořeno s pomocí SHAP nástrojů, které jsou rozšířeny v oblastech odhadu a vizuální prezentace. Z pohledu přirozených ukazatelů prediktivních schopností vyčnívají řešení využívající náhodné lesy nebo gradient boosting, v klasickém pojetí vynikají i ANN. Z hlediska ekonomického výsledku retenční aktivity vyčnívá nové pojetí úlohy, pozoruhodné jsou především systémy postavené na rozhodovacích stromech nebo meta-algoritmech. Jako klíčové nezávislé proměnné se podařilo identifikovat reprezentace stáří a frekvenci interakcí a transakcí, v novém pojetí vyčnívá i hodnota zákazníka. Určení a porozumění zákaznickým shlukům, na které je vhodné cílit, pak přímo podporuje související retenční aktivity. Disertační práce tak představuje ucelený přehled nových přístupů a nástrojů pro predikci odchodu zákazníka, využitelných jak pro další výzkum, tak v podnikové nebo pedagogické praxi.
The dissertation examines customer churn prediction in e-commerce retail settings, presenting the current research landscape, analyzing key trends, and pinpointing opportunities for further investigation. The literature review is conducted using language processing. The study aims to develop, implement, and evaluate a machine learning system for predicting customer churn in the e-commerce environment, considering the economic implications of retention efforts, and facilitating a deeper understanding of the modeled phenomenon. The solution is organized into sections covering problem definition, data comprehension and processing, model development, evaluation, interpretation, and deployment. The author extends the traditional concept of customer churn as the lack of a transaction in a future period with a novel idea of the incremental economic impact of a retention campaign. The notions are validated using two datasets. The modeling framework incorporates GLM, SVM, ANN, decision trees, and meta-algorithms. Bayesian optimization estimates external parameters related to data processing and model building. The understanding of the phenomena is enhanced using SHAP tools, which are improved in terms of computation and visual representation. From the perspective of natural prediction performance, random forests and gradient boosting dominate; in the original task, ANN also performs well. When considering the financial results of the retention campaign, the novel approach functions excellently, mainly when coupled with decision trees or meta-learning. Recency and frequency representations of interactions and transactions are identified as key features; the feature importance of customer value emerges in the novel approach. Identifying and comprehending customer segments to target directly supports subsequent retention initiatives. In summary, the thesis offers an extensive overview of novel methods and tools for predicting customer churn, which can be valuable for future research and practical applications in business or educational settings.
Description
Citation
FRIDRICH, M. Využití strojového učení pro predikci odchodu zákazníka [online]. Brno: Vysoké učení technické v Brně. Fakulta podnikatelská. 2023.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Řízení a ekonomika podniku
Comittee
prof. Ing. et Ing. Stanislav Škapa, Ph.D. (předseda) doc. Ing. Mgr. Karel Brychta, Ph.D. (člen) doc. Ing. Bronislav Chramcov, Ph.D. (člen) doc. Ing. Zdeňka Konečná, Ph.D. (člen) prof. Ing. Radim Lenort, Ph.D. (člen) doc. Mgr. Veronika Novotná, Ph.D. (člen) doc. Ing. Marie Pavláková Dočekalová, Ph.D. (člen) doc. PhDr. Iveta Šimberová, Ph.D. (člen)
Date of acceptance
2023-11-03
Defence
Otázky oponentů: - V kapitole „Explorace dat“ na str. 95 používáte některé nestandardní výrazy pro popisné charakteristiky. Předpokládám, že výrazem „zakřivení“ rozumíte spíše „špičatost“ nebo šikmost“. Co si mám představit pod vyjádřením „rozdělení pozitivně sešikmené s tlustým pravým chvostem“? - Na str. 116 uvádíte, že pozorování pro čtvrtý shluk ilustruje obrázek 37. Nicméně v obrázku 35 popisujte pouze 3 shluky. Můžete tento nesoulad vysvětlit? - Pokuste se zhodnotit náročnost (kvalitativní, časová) analýzy a přípravy reálných dat do podoby vstupující do modelu predikce. Co je předpokladem pro získání takových dat. - Můžete jednoznačně vymezit problematickou terminologii popisovanou v rámci posudku v části „Postup řešení problému a metody použité při vypracování disertační práce“? - Jak vysoké náklady jste musel vynaložit na realizovaný výzkum v souvislosti s využíváním analytické platformy Databricks a dalších podpůrných komponent a z jakých zdrojů jste je platil? - Můžete mi vysvětlit, jak jste postupoval při výběru metod užitých pro řešení práce, výzkumu, a jaké jsou klíčové důvody jejich výběru (např. uveďte praktické příklady užití logických metod – kde byly a pro jaké účely užité konkrétně – logické párové metody)? Doktorand odpověděl na položené dotazy. Komise hodnotí vystoupení doktoranda kladně.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO