Дослідження способів трансформації даних в контексті підвищення ефективності моделей кредитного скорингу

dc.contributor.authorКлебан, Юрій В.
dc.contributor.authorKleban, Yuriy
dc.contributor.authorКлебан, Юрий В.
dc.date.accessioned2020-10-08T10:31:12Z
dc.date.available2020-10-08T10:31:12Z
dc.date.issued2019
dc.description.abstractУ статті проведено дослідження з пошуку найефективнішого підходу до попередньої обробки характеристичних ознак позичальників з метою підвищення точності передбачення дефолтів за кредитними зобов’язаннями. Проаналізовано три основних способи подання даних на входи моделей кредитного скорингу: застосування початкових пояснюючих змінних без трансформації, переведення категоріальних характеристик у набір фіктивних змінних, біннінг показників із розрахунком вагомості ознаки (WOE) для кожної категорії. Для отримання висновків щодо систематичного впливу цих підходів було проведено по 10 повторюваних ітерацій з побудови нейромережевих моделей персептронного типу за кожним із цих трьох способів підготовки вхідних факторів. Кожна скорингова модель оцінювалась за широким набором показників інтегральної та точкової ефективності. Результати проведених експериментів засвідчили практично за всіма критеріями перевагу запропонованого автором методологічного підходу до попередньої обробки даних шляхом розбиття кількісних змінних на категорії із забезпеченням тренду їх показників вагомості ознаки та дотриманням обмежень на обсяг спостережень у кожній групі. The article highlights a study on the search for the most effective approach to pre-processing the characteristics of borrowers in order to improve the accuracy of predicting defaults on credit obligations. Three main ways of providing data to the inputs of credit scoring models are analyzed: the use of the initial explanatory variables without transformation, the conversion of categorical characteristics into a set of dummy variables, binning the indicators with the calculation of the weights of evidence (WOE) for each category. To obtain conclusions about the systematic impact of these approaches, 10 repeated iterations were carried out with the construction of perceptron-type neural network models based on each of these three methods of preparing input factors. All scoring models were evaluated by a wide range of indicators of integrated and point efficiency. The results of the experiments showed by almost all criteria the advantage of the methodological approach proposed by the author for preliminary data processing by dividing quantitative variables into categories, ensuring the trend in values of their weights of evidence and observing restrictions on the volume of observations in each group. В статье проведено исследование, посвященное поиску наиболее эффективного подхода к предварительной обработке характеристических признаков заемщиков с целью повышения точности предсказания дефолтов по кредитным обязательствам. Проанализированы три основных способа представления данных на входы моделей кредитного скоринга: применение исходных объясняющих переменных без трансформации, преобразование категориальных характеристик в набор фиктивных переменных, биннинг показателей с расчетом весомости признака (WOE) для каждой категории. Для получения выводов относительно систематического влияния данных подходов было проведено 10 повторяющихся итераций с построением нейросетевых моделей персептронного типа на основе каждого из этих трех способов подготовки входных факторов. Все скоринговые модели оценивались по широкому набору показателей интегральной и точечной эффективности. Результаты проведенных экспериментов продемонстрировали практически по всем критериям преимущество предложенного автором методологического подхода к предварительной обработке данных путем разбиения количественных переменных на категории с обеспечением тренда их показателей весомости признака и соблюдением ограничений по объему наблюдений в каждой группе.uk_UA
dc.identifier.citationКлебан Ю. В. Дослідження способів трансформації даних в контексті підвищення ефективності моделей кредитного скорингу / Ю. В. Клебан // Нейро-нечіткі технології моделювання в економіці : наук.-анал. журн. / М-во освіти і науки України, ДВНЗ «Київ. нац. екон. ун-т ім. Вадима Гетьмана» ; [редкол.: А. В. Матвійчук (голов. ред.) та ін.]. – Київ : КНЕУ, 2019. – № 8. – С. 94–123.uk_UA
dc.identifier.issn2306-3289
dc.identifier.urihttps://ir.kneu.edu.ua:443/handle/2010/34082
dc.language.isoukuk_UA
dc.publisherДВНЗ «Київський національний економічний університет імені Вадима Гетьмана»uk_UA
dc.subjectСкорингова модельuk_UA
dc.subjectнейронна мережаuk_UA
dc.subjectкредитоспроможністьuk_UA
dc.subjectбіннінгuk_UA
dc.subjectвагомість ознаки (WOE)uk_UA
dc.subjectінформаційна значущість (IV)uk_UA
dc.subjectкоефіцієнт Джиніuk_UA
dc.subjectScoring modeluk_UA
dc.subjectneural networkuk_UA
dc.subjectcreditworthinessuk_UA
dc.subjectbinninguk_UA
dc.subjectweight of evidence (WOE)uk_UA
dc.subjectinformational value (IV)uk_UA
dc.subjectGini coefficientuk_UA
dc.subjectСкоринговая модельuk_UA
dc.subjectнейронная сетьuk_UA
dc.subjectкредитоспособностьuk_UA
dc.subjectбиннингuk_UA
dc.subjectвесомость признака (WOE)uk_UA
dc.subjectинформационная значимость (IV)uk_UA
dc.subjectкоэффициент Джиниuk_UA
dc.subject.udc19.86+330.46uk_UA
dc.titleДослідження способів трансформації даних в контексті підвищення ефективності моделей кредитного скорингуuk_UA
dc.title.alternativeStudying the methods of data transformation in the context of increasing the effectiveness of credit scoring modelsuk_UA
dc.title.alternativeИсследование способов трансформации данных в контексте повышения эффективности моделей кредитного скорингаuk_UA
dc.typeArticleuk_UA
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Kleban_19_8.pdf
Size:
773.63 KB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description:
Collections