Predicting regional credit ratings using ensemble classification with metacost

Show simple item record

dc.contributor.author Toseafa, Evelyn cze
dc.contributor.author Hájek, Petr cze
dc.date.accessioned 2020-03-19T13:06:46Z
dc.date.available 2020-03-19T13:06:46Z
dc.date.issued 2019 eng
dc.identifier.isbn 978-3-030-19809-1 eng
dc.identifier.issn 2194-5357 eng
dc.identifier.uri https://hdl.handle.net/10195/75039
dc.description.abstract Ensemble classifiers are learning algorithms that combine sets of base classifiers in order to increase their diversity and, thus, decrease variance and achieve better predictive performance compared to single classifiers. Previous research has shown that ensemble classifiers are more accurate than single classifiers in predicting credit ratings. Here we deal with highly imbalanced multi-class data of regional entities. To overcome these problems, we propose a novel hybrid model combining data oversampling and cost-sensitive ensemble classification. This paper demonstrates that the use of the SMOTE technique to balance the multi-class data solves the imbalance problem effectively. Different misclassification cost assigned in cost matrix solves the problem of ordered classes. This approach is combined with ensemble classification within the MetaCost framework. We show that more accurate prediction can be achieved using this approach in terms of average cost and area under ROC. This paper provides empirical evidence on the dataset of 451 regions classified into 8 rating classes, as obtained from the Moody’s rating agency. The results show that Random Forest combined with MetaCost outperforms the rest of the base classifiers, as well as other benchmark methods. eng
dc.format p. 332-342 eng
dc.language.iso eng eng
dc.publisher Springer Nature eng
dc.relation.ispartof Artificial Intelligence Methods in Intelligent Algorithms : Proceedings of 8th Computer Science On-line Conference 2019, Vol. 2 eng
dc.rights pouze v rámci univerzity cze
dc.subject MetaCost eng
dc.subject Random Forest eng
dc.subject Ensemble learning eng
dc.subject Regions eng
dc.subject Credit rating eng
dc.subject MetaCost cze
dc.subject náhodný strom cze
dc.subject souborové učení cze
dc.subject regiony cze
dc.subject úvěrový rating cze
dc.title Predicting regional credit ratings using ensemble classification with metacost eng
dc.title.alternative Predikce úvěrových ratingů regionů pomocí souboru klasifikátorů s metacost cze
dc.type ConferenceObject eng
dc.description.abstract-translated Soubory klasifikátory jsou učící se algoritmy, které kombinují soubory základních klasifikátorů, aby se zvýšila jejich rozmanitost, a tak snížil rozptyl a dosáhlo se lepšího prediktivního výkonu ve srovnání s jednotlivými klasifikátory. Předchozí výzkum ukázal, že soubory klasifikátory jsou při předpovídání ratingů přesnější než jednotlivé klasifikátory. Zde se zabýváme vysoce nevyváženými daty kategorizovanými do více tříd regionálních subjektů. K překonání těchto problémů navrhujeme nový hybridní model kombinující převzorkování dat a nákladově citlivou klasifikaci. Tento článek ukazuje, že použití techniky SMOTE k vyvážení více tříd dat účinně řeší problém jejich nevyváženosti. Různé náklady na nesprávnou klasifikaci přiřazené v matici nákladů řeší problém ordinálních tříd. Tento přístup je kombinován s klasifikací souboru v rámci MetaCost. Ukazujeme, že pomocí tohoto přístupu lze dosáhnout přesnější predikce z hlediska průměrných nákladů a plochy pod ROC křivkou. Tento článek poskytuje empirické důkazy o datovém souboru 451 regionů zařazených do 8 ratingových tříd, jak byly získány od ratingové agentury Moody's. Výsledky ukazují, že Random Forest v kombinaci s MetaCost překonává zbytek základních klasifikátorů i jiné srovnávané metody. cze
dc.event 8th Computer Science On-line Conference, CSOC 2019 (24.04.2019 - 27.04.2019, Praha) eng
dc.peerreviewed yes eng
dc.publicationstatus postprint eng
dc.identifier.doi 10.1007/978-3-030-19810-7_33 eng
dc.relation.publisherversion https://link.springer.com/chapter/10.1007/978-3-030-19810-7_33 eng
dc.identifier.obd 39883423 eng


This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account