Digitální knihovna UPCE přechází na novou verzi. Omluvte prosím případné komplikace. / The UPCE Digital Library is migrating to a new version. We apologize for any inconvenience.

Publikace:
Combining weighted SMOTE with ensemble learning for the class-imbalanced prediction of small business credit risk

Článekopen accesspeer-reviewedpublished
dc.contributor.authorAbedin, Mohammad Zoynul
dc.contributor.authorGuotai, Chi
dc.contributor.authorHájek, Petr
dc.contributor.authorZhang, Tong
dc.date.accessioned2024-08-24T07:25:39Z
dc.date.available2024-08-24T07:25:39Z
dc.date.issued2023
dc.description.abstractIn small business credit risk assessment, the default and nondefault classes are highly imbalanced. To overcome this problem, this study proposes an extended ensemble approach rooted in the weighted synthetic minority oversampling technique (WSMOTE), which is called WSMOTE-ensemble. The proposed ensemble classifier hybridizes WSMOTE and Bagging with sampling composite mixtures to guarantee the robustness and variability of the generated synthetic instances and, thus, minimize the small business class-skewed constraints linked to default and nondefault instances. The original small business dataset used in this study was taken from 3111 records from a Chinese commercial bank. By implementing a thorough experimental study of extensively skewed data-modeling scenarios, a multilevel experimental setting was established for a rare event domain. Based on the proper evaluation measures, this study proposes that the random forest classifier used in the WSMOTE-ensemble model provides a good trade-off between the performance on default class and that of nondefault class. The ensemble solution improved the accuracy of the minority class by 15.16% in comparison with its competitors. This study also shows that sampling methods outperform nonsampling algorithms. With these contributions, this study fills a noteworthy knowledge gap and adds several unique insights regarding the prediction of small business credit risk.eng
dc.description.abstract-translatedPři hodnocení úvěrového rizika malých podniků jsou třídy úvěrů v selhání a bez selhání značně nevyvážené. K překonání tohoto problému tato studie navrhuje rozšířený přístup založený na technice váženého syntetického menšinového převzorkování (WSMOTE), který se nazývá WSMOTE-ensemble. Navržený ansámblový klasifikátor hybridizuje WSMOTE a Bagging se vzorkováním kompozitních směsí, aby byla zaručena robustnost a variabilita generovaných syntetických instancí, a tím minimalizována malá omezení třídního zkreslení podniků spojená s instancemi v selhání a bez selhání. Původní soubor údajů o malých podnicích použitý v této studii byl převzat z 3111 záznamů z čínské komerční banky. Realizací důkladné experimentální studie rozsáhle zkreslených scénářů modelování dat bylo vytvořeno víceúrovňové experimentální prostředí pro doménu vzácných událostí. Na základě vhodných hodnotících měřítek tato studie navrhuje, že klasifikátor náhodného lesa použitý v modelu WSMOTE-ensemble poskytuje dobrý kompromis mezi výkonem na třídě selhání a třídě neselhání. Ansámblové řešení zlepšilo přesnost menšinové třídy o 15,16 % ve srovnání s konkurenčními modely. Tato studie také ukazuje, že metody s výběrem vzorků překonávají algoritmy bez výběru vzorků. Díky těmto příspěvkům tato studie vyplňuje pozoruhodnou mezeru ve znalostech a přidává několik jedinečných poznatků týkajících se predikce úvěrového rizika malých podniků.cze
dc.formatp. 3559-3579eng
dc.identifier.doi10.1007/s40747-021-00614-4
dc.identifier.issn2199-4536
dc.identifier.obd39889344
dc.identifier.scopus2-s2.0-85133897266
dc.identifier.urihttps://hdl.handle.net/10195/83773
dc.identifier.wos000738565700010eng
dc.language.isoeng
dc.peerreviewedyeseng
dc.project.IDGA19-15498S/Modelování emocí ve verbální a neverbální manažerské komunikaci pro predikci podnikových finančních rizikcze
dc.publicationstatuspublishedeng
dc.publisherSpringereng
dc.relation.ispartofComplex & Intelligent Systems, volume 9, issue: 4eng
dc.relation.publisherversionhttps://link.springer.com/article/10.1007/s40747-021-00614-4
dc.rightsopen accesseng
dc.rights.licenceCC BY 4.0
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectSmall businesseng
dc.subjectCredit riskeng
dc.subjectImbalanced dataeng
dc.subjectOversamplingeng
dc.subjectWeighted SMOTEeng
dc.subjectEnsemble learningeng
dc.subjectMalé podnikycze
dc.subjectúvěrové rizikocze
dc.subjectnevyvážená datacze
dc.subjectpřevzorkovánícze
dc.subjectvážený SMOTEcze
dc.subjectučení souborucze
dc.titleCombining weighted SMOTE with ensemble learning for the class-imbalanced prediction of small business credit riskeng
dc.title.alternativeKombinace váženého SMOTE se skupinovým učením pro třídně nevyváženou predikci úvěrového rizika malých podnikůcze
dc.typeArticleeng
dspace.entity.typePublication

Soubory

Původní svazek

Nyní se zobrazuje 1 - 1 z 1
Načítá se...
Náhled
Název:
s40747-021-00614-4.pdf
Velikost:
1.23 MB
Formát:
Adobe Portable Document Format