Digitální knihovna UPCE přechází na novou verzi. Omluvte prosím případné komplikace. / The UPCE Digital Library is migrating to a new version. We apologize for any inconvenience.

Publikace:
Predicting regional credit ratings using ensemble classification with metacost

Konferenční objektOmezený přístuppeer-reviewedpostprint
dc.contributor.authorToseafa, Evelyncze
dc.contributor.authorHájek, Petrcze
dc.date.accessioned2020-03-19T13:06:46Z
dc.date.available2020-03-19T13:06:46Z
dc.date.issued2019eng
dc.description.abstractEnsemble classifiers are learning algorithms that combine sets of base classifiers in order to increase their diversity and, thus, decrease variance and achieve better predictive performance compared to single classifiers. Previous research has shown that ensemble classifiers are more accurate than single classifiers in predicting credit ratings. Here we deal with highly imbalanced multi-class data of regional entities. To overcome these problems, we propose a novel hybrid model combining data oversampling and cost-sensitive ensemble classification. This paper demonstrates that the use of the SMOTE technique to balance the multi-class data solves the imbalance problem effectively. Different misclassification cost assigned in cost matrix solves the problem of ordered classes. This approach is combined with ensemble classification within the MetaCost framework. We show that more accurate prediction can be achieved using this approach in terms of average cost and area under ROC. This paper provides empirical evidence on the dataset of 451 regions classified into 8 rating classes, as obtained from the Moody’s rating agency. The results show that Random Forest combined with MetaCost outperforms the rest of the base classifiers, as well as other benchmark methods.eng
dc.description.abstract-translatedSoubory klasifikátory jsou učící se algoritmy, které kombinují soubory základních klasifikátorů, aby se zvýšila jejich rozmanitost, a tak snížil rozptyl a dosáhlo se lepšího prediktivního výkonu ve srovnání s jednotlivými klasifikátory. Předchozí výzkum ukázal, že soubory klasifikátory jsou při předpovídání ratingů přesnější než jednotlivé klasifikátory. Zde se zabýváme vysoce nevyváženými daty kategorizovanými do více tříd regionálních subjektů. K překonání těchto problémů navrhujeme nový hybridní model kombinující převzorkování dat a nákladově citlivou klasifikaci. Tento článek ukazuje, že použití techniky SMOTE k vyvážení více tříd dat účinně řeší problém jejich nevyváženosti. Různé náklady na nesprávnou klasifikaci přiřazené v matici nákladů řeší problém ordinálních tříd. Tento přístup je kombinován s klasifikací souboru v rámci MetaCost. Ukazujeme, že pomocí tohoto přístupu lze dosáhnout přesnější predikce z hlediska průměrných nákladů a plochy pod ROC křivkou. Tento článek poskytuje empirické důkazy o datovém souboru 451 regionů zařazených do 8 ratingových tříd, jak byly získány od ratingové agentury Moody's. Výsledky ukazují, že Random Forest v kombinaci s MetaCost překonává zbytek základních klasifikátorů i jiné srovnávané metody.cze
dc.event8th Computer Science On-line Conference, CSOC 2019 (24.04.2019 - 27.04.2019, Praha)eng
dc.formatp. 332-342eng
dc.identifier.doi10.1007/978-3-030-19810-7_33eng
dc.identifier.isbn978-3-030-19809-1eng
dc.identifier.issn2194-5357eng
dc.identifier.obd39883423eng
dc.identifier.urihttps://hdl.handle.net/10195/75039
dc.language.isoengeng
dc.peerreviewedyeseng
dc.publicationstatuspostprinteng
dc.publisherSpringer Natureeng
dc.relation.ispartofArtificial Intelligence Methods in Intelligent Algorithms : Proceedings of 8th Computer Science On-line Conference 2019, Vol. 2eng
dc.relation.publisherversionhttps://link.springer.com/chapter/10.1007/978-3-030-19810-7_33eng
dc.rightspouze v rámci univerzitycze
dc.subjectMetaCosteng
dc.subjectRandom Foresteng
dc.subjectEnsemble learningeng
dc.subjectRegionseng
dc.subjectCredit ratingeng
dc.subjectMetaCostcze
dc.subjectnáhodný stromcze
dc.subjectsouborové učenícze
dc.subjectregionycze
dc.subjectúvěrový ratingcze
dc.titlePredicting regional credit ratings using ensemble classification with metacosteng
dc.title.alternativePredikce úvěrových ratingů regionů pomocí souboru klasifikátorů s metacostcze
dc.typeConferenceObjecteng
dspace.entity.typePublication

Soubory

Původní svazek

Nyní se zobrazuje 1 - 1 z 1
Načítá se...
Náhled
Název:
CSOC_final.pdf
Velikost:
580.41 KB
Formát:
Adobe Portable Document Format