Дослідження ефекту перенавчання нейронних мереж на прикладі задачі аплікаційного скорингу

Abstract
У статті досліджено проблему перенавчання нейронних мереж. Розкрито теоретичне підґрунтя виникнення цього явища та висвітлені негативні наслідки його прояву. Проведено експериментальне дослідження ефекту перенавчання на прикладі задачі моделювання кредитних ризиків фізичних осіб. З цією метою побудовано низку логістичних регресій і нейромереж персептронного типу різних конфігурацій, перевірка адекватності яких здійснювалась як на навчальній, так і на тестовій вибірках. Результати порівняння показників точності класифікації позичальників за критерієм Джині для обох вибірок дозволили отримати деякі нові узагальнення щодо сутності ефекту перенавчання та рекомендації щодо його уникнення. Практичною цінністю проведеного дослідження є отримані нові знання щодо способів позбавлення скорингових моделей від ефекту перенавчання, що дозволить забезпечити їх стійкість і стабільність результатів моделювання кредитних ризиків у прикладній діяльності банківських установ, що сприятиме стабільності фінансової системи в цілому.
The article examines the problem of neural networks overfitting. The article describes theoretical basis of the occurrence of this effect and highlights the negative effects of its manifestation. The paper considers the experimental study of the effect of retraining on the problem of modeling the credit risk of individuals. For this purpose, a number of logistic regressions and perceptron type neural networks of various configurations were constructed, the adequacy check of which was carried out both on the training and on the test samples. The results of the comparison in terms of accuracy of classification of borrowers according to the Gini criterion for both samples gave the opportunity to obtain some new generalizations about the nature of overfitting and recommendations for its prevention. The practical value of the research is new knowledge about the ways of deliverance scoring models from overfitting, which will ensure the sustainability and stability of modeling results of credit risks in the application of the banking institutions that will contribute to the stability of the financial system as a whole.
В статье исследуется проблема переобучения нейронных сетей. Раскрыты теоретические основы возникновения этого эффекта и освещены негативные последствия его проявления. Проведено экспериментальное исследование эффекта переобучения на примере задачи моделирования кредитных рисков физических лиц. С этой целью построен ряд логистических регрессий и нейросетей персептронного типа различных конфигураций, проверка адекватности которых осуществлялась как на учебной, так и на тестовой выборках. Результаты сравнения показателей точности классификации заемщиков по критерию Джини для обеих выборок дали возможность получить некоторые новые обобщения относительно сущности эффекта переобучения и рекомендации по его предотвращению. Практической ценностью проведенного исследования являются полученные новые знания о способах избавления скоринговых моделей от эффекта переобучения, что позволит обеспечить их устойчивость и стабильность результатов моделирования кредитных рисков в прикладной деятельности банковских учреждений, что будет способствовать стабильности финансовой системы в целом.
Description
Keywords
перенавчання, нейронна мережа, аплікаційний скоринг, адекватність моделі, overfitting, neural network, application scoring, adequacy of the model, переобучение, нейронная сеть, аппликационный скоринг, адекватность модели
Citation
Великоіваненко Г. І. Дослідження ефекту перенавчання нейронних мереж на прикладі задачі аплікаційного скорингу / Г. І. Великоіваненко, В. В. Корчинський, В. В. Чернишова // Нейро-нечіткі технології моделювання в економіці : наук.-анал. журн. / М-во освіти і науки України, ДВНЗ «Київ. нац. екон. ун-т ім. Вадима Гетьмана» ; редкол.: А. В. Матвійчук (голов. ред.) [та ін.]. – Київ : КНЕУ, 2016. – № 5. – С. 3–23.