Publikace: Two-stage consumer credit risk modelling using heterogeneous ensemble learning
ČlánekOmezený přístuppeer-reviewedpostprint| dc.contributor.author | Papoušková, Monika | cze |
| dc.contributor.author | Hájek, Petr | cze |
| dc.date.accessioned | 2020-03-19T12:59:30Z | |
| dc.date.available | 2020-03-19T12:59:30Z | |
| dc.date.issued | 2019 | eng |
| dc.description.abstract | Modelling consumer credit risk is a crucial task for banks and non-bank financial institutions to support decision-making on granting loans. To model the overall credit risk of a consumer loan in terms of expected loss (EL), three key credit risk parameters must be estimated: probability of default (PD), loss given default (LGD) and exposure at default (EAD). Research to date has tended to model these parameters separately. Moreover, a neglected area in the field of LGD/EAD modelling is the application of ensemble learning, which by benefitting from diverse base learners reduces the over-fitting problem and enables modelling diverse risk profiles of defaulted loans. To overcome these problems, this paper proposes a two-stage credit risk model that integrates (1) class-imbalanced ensemble learning for predicting PD (credit scoring), and (2) an EAD prediction using a regression ensemble. Furthermore, multi-objective evolutionary feature selection is used to minimize both the misclassification cost (root mean squared error) of the PD and EAD models and the number of attributes necessary for modelling. For this task, we propose a misclassification cost metric suitable for consumer loans with fixed exposure because it combines opportunity cost and LGD. We show that the proposed credit risk model is not only more effective than single-stage credit risk models but also outperforms state-of-the-art methods used to model credit risk in terms of prediction and economic performance. | eng |
| dc.description.abstract-translated | Modelování spotřebitelského úvěrového rizika je klíčovým úkolem bank a nebankovních finančních institucí na podporu rozhodování o poskytování úvěrů. Pro modelování celkového úvěrového rizika spotřebitelského úvěru z hlediska očekávané ztráty (EL) je třeba odhadnout tři klíčové parametry úvěrového rizika: pravděpodobnost selhání (PD), ztráta při selhání (LGD) a expozice při selhání (EAD). Dosavadní výzkum měl tendenci tyto parametry modelovat samostatně. Zanedbanou oblastí v modelování LGD / EAD je navíc aplikace meta-učení, které využíváním rozmanitých algoritmů strojového učení snižuje problém přeučení a umožňuje modelování různých rizikových profilů nesplácených úvěrů. K překonání těchto problémů navrhujeme v tomto článku dvoustupňový model úvěrového rizika, který integruje (1) nevyvážené meta-učení pro predikci PD (kreditního hodnocení) a (2) predikci EAD pomocí souboru regresorů. Kromě toho se používá víceúčelová evoluční selekce atributů k minimalizaci nákladů na nesprávnou klasifikaci (RMSE) u modelů PD a EAD a počtu atributů nezbytných pro modelování. Pro tento úkol navrhujeme metriku pro chybnou klasifikaci nákladů, která je vhodná pro spotřebitelské úvěry s fixní expozicí, protože kombinuje náklady příležitosti a LGD. Ukazujeme, že navrhovaný model úvěrového rizika je nejen efektivnější než jednostupňové modely úvěrového rizika, ale také překonává nejmodernější metody používané k modelování úvěrového rizika z hlediska predikce a ekonomické výkonnosti. | cze |
| dc.format | p. 33-45 | eng |
| dc.identifier.doi | 10.1016/j.dss.2019.01.002 | eng |
| dc.identifier.issn | 0167-9236 | eng |
| dc.identifier.obd | 39883370 | eng |
| dc.identifier.scopus | 2-s2.0-85059804281 | |
| dc.identifier.uri | https://hdl.handle.net/10195/74982 | |
| dc.identifier.wos | 000461535200004 | eng |
| dc.language.iso | eng | eng |
| dc.peerreviewed | yes | eng |
| dc.project.ID | GA16-19590S/Analýza témat a sentimentu vícenásobných textových zdrojů pro finanční rozhodování | eng |
| dc.publicationstatus | postprint | eng |
| dc.publisher | Elsevier Science BV | eng |
| dc.relation.ispartof | Decision Support Systems, volume 118, issue: March | eng |
| dc.relation.publisherversion | https://www.sciencedirect.com/science/article/pii/S0167923619300028 | eng |
| dc.rights | Text článku ve verzi postprint bude přístupný od 09.01.2021 | eng |
| dc.subject | Credit risk | eng |
| dc.subject | Ensemble learning | eng |
| dc.subject | Credit scoring | eng |
| dc.subject | Expected loss | eng |
| dc.subject | Exposure at default | eng |
| dc.subject | úvěrové riziko | cze |
| dc.subject | meta-učení | cze |
| dc.subject | úvěrové skórování | cze |
| dc.subject | očekávaná ztráta | cze |
| dc.subject | expozice při selhání | cze |
| dc.title | Two-stage consumer credit risk modelling using heterogeneous ensemble learning | eng |
| dc.title.alternative | Dvoufázové modelování spotřebitelského úvěrového rizika pomocí heterogenního meta-učení | cze |
| dc.type | Article | eng |
| dspace.entity.type | Publication |
Soubory
Původní svazek
1 - 1 z 1
Načítá se...
- Název:
- Manuscript-reduced-revised.pdf
- Velikost:
- 1.19 MB
- Formát:
- Adobe Portable Document Format
- Popis: