Combining weighted SMOTE with ensemble learning for the class-imbalanced prediction of small business credit risk

Show simple item record

dc.contributor.author Abedin, Mohammad Zoynul cze
dc.contributor.author Guotai, Chi cze
dc.contributor.author Hájek, Petr cze
dc.contributor.author Zhang, Tong cze
dc.date.accessioned 2024-08-24T07:25:39Z
dc.date.available 2024-08-24T07:25:39Z
dc.date.issued 2023 eng
dc.identifier.issn 2199-4536 eng
dc.identifier.uri https://hdl.handle.net/10195/83773
dc.description.abstract In small business credit risk assessment, the default and nondefault classes are highly imbalanced. To overcome this problem, this study proposes an extended ensemble approach rooted in the weighted synthetic minority oversampling technique (WSMOTE), which is called WSMOTE-ensemble. The proposed ensemble classifier hybridizes WSMOTE and Bagging with sampling composite mixtures to guarantee the robustness and variability of the generated synthetic instances and, thus, minimize the small business class-skewed constraints linked to default and nondefault instances. The original small business dataset used in this study was taken from 3111 records from a Chinese commercial bank. By implementing a thorough experimental study of extensively skewed data-modeling scenarios, a multilevel experimental setting was established for a rare event domain. Based on the proper evaluation measures, this study proposes that the random forest classifier used in the WSMOTE-ensemble model provides a good trade-off between the performance on default class and that of nondefault class. The ensemble solution improved the accuracy of the minority class by 15.16% in comparison with its competitors. This study also shows that sampling methods outperform nonsampling algorithms. With these contributions, this study fills a noteworthy knowledge gap and adds several unique insights regarding the prediction of small business credit risk. eng
dc.format p. 3559-3579 eng
dc.language.iso eng eng
dc.publisher Springer eng
dc.relation.ispartof Complex & Intelligent Systems, volume 9, issue: 4 eng
dc.rights Práce není přístupná eng
dc.subject Small business eng
dc.subject Credit risk eng
dc.subject Imbalanced data eng
dc.subject Oversampling eng
dc.subject Weighted SMOTE eng
dc.subject Ensemble learning eng
dc.subject Malé podniky cze
dc.subject úvěrové riziko cze
dc.subject nevyvážená data cze
dc.subject převzorkování cze
dc.subject vážený SMOTE cze
dc.subject učení souboru cze
dc.title Combining weighted SMOTE with ensemble learning for the class-imbalanced prediction of small business credit risk eng
dc.title.alternative Kombinace váženého SMOTE se skupinovým učením pro třídně nevyváženou predikci úvěrového rizika malých podniků cze
dc.type article eng
dc.description.abstract-translated Při hodnocení úvěrového rizika malých podniků jsou třídy úvěrů v selhání a bez selhání značně nevyvážené. K překonání tohoto problému tato studie navrhuje rozšířený přístup založený na technice váženého syntetického menšinového převzorkování (WSMOTE), který se nazývá WSMOTE-ensemble. Navržený ansámblový klasifikátor hybridizuje WSMOTE a Bagging se vzorkováním kompozitních směsí, aby byla zaručena robustnost a variabilita generovaných syntetických instancí, a tím minimalizována malá omezení třídního zkreslení podniků spojená s instancemi v selhání a bez selhání. Původní soubor údajů o malých podnicích použitý v této studii byl převzat z 3111 záznamů z čínské komerční banky. Realizací důkladné experimentální studie rozsáhle zkreslených scénářů modelování dat bylo vytvořeno víceúrovňové experimentální prostředí pro doménu vzácných událostí. Na základě vhodných hodnotících měřítek tato studie navrhuje, že klasifikátor náhodného lesa použitý v modelu WSMOTE-ensemble poskytuje dobrý kompromis mezi výkonem na třídě selhání a třídě neselhání. Ansámblové řešení zlepšilo přesnost menšinové třídy o 15,16 % ve srovnání s konkurenčními modely. Tato studie také ukazuje, že metody s výběrem vzorků překonávají algoritmy bez výběru vzorků. Díky těmto příspěvkům tato studie vyplňuje pozoruhodnou mezeru ve znalostech a přidává několik jedinečných poznatků týkajících se predikce úvěrového rizika malých podniků. cze
dc.peerreviewed yes eng
dc.publicationstatus postprint eng
dc.identifier.doi 10.1007/s40747-021-00614-4 eng
dc.relation.publisherversion https://link.springer.com/article/10.1007/s40747-021-00614-4 eng
dc.project.ID GA19-15498S/Modelování emocí ve verbální a neverbální manažerské komunikaci pro predikci podnikových finančních rizik eng
dc.identifier.wos 000738565700010 eng
dc.identifier.scopus 2-s2.0-85133897266 eng
dc.identifier.obd 39889344 eng


This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account