№ 9

Permanent URI for this collection

https://ir.kneu.edu.ua/handle/2010/43371

Browse

Now showing 1 - 7 of 7

Прогнозування вилову риби і морепродуктів у глобальній економіці
(ДВНЗ «Київський національний економічний університет імені Вадима Гетьмана», 2020) Чужиков, Віктор Іванович; Chuzhykov, Viktor; Мірошниченко, Ігор Вікторович; Miroshnychenko, Ihor; Лук’яненко, Олександр Д.; Lukianenko, Oleksandr
В статті запропоновано новий науковий підхід до прогнозування вилову риби та морепродуктів, що ґрунтується на застосуванні математичного апарату нейронних мереж (а саме, карт самоорганізації Кохонена) та економетричних моделей (авторегресійних функцій). Карти самоорганізації надали можливість здійснити кластеризацію країн світу за показниками вилову риби та морепродуктів, що дозволило визначити групи країн та територій, стан та розвиток рибного сектору яких є подібними між собою. Зважаючи на надто різнорідний стан цієї галузі за різними країнами процедуру кластеризації довелось здійснити повторно ще в рамках окремих груп країн. Після отримання однорідної вибірки для вирішення задачі прогнозування обсягів вилову риби та морепродуктів запропоновано застосувати моделі регресії часових рядів. В ході ряду експериментів було визначено найкращу прогностичну модель з порядком авторегресії AR(5). Отриманий прогноз та показники якості моделі вказують на доцільність застосування запропонованого кількарівневого підходу до побудови прогнозних моделей, що ґрунтується на кластеризації країн світу та формуванні однорідних навчальних вибірок. Подібний підхід може бути використаний у широкому спектрі економічних та управлінських задач. The article proposes a new scientific approach to forecasting the catch of fish and seafood, based on the use of the mathematical apparatus of neural networks (namely, Kohonen self-organizing maps) and econometric models (autoregressive functions). Self-organizing maps provided an opportunity to cluster the countries of the world according to the indicators of fish and seafood catch, which made it possible to identify countries and areas whose state and development of the fisheries sector are similar to each other. Due to the too heterogeneous state of this industry in different countries, the clustering procedure had to be repeated even within certain groups of countries. After obtaining a homogeneous sampling to solve the problem of predicting the volume of fish and seafood catches, it is proposed to apply time series regression models. Through a series of experiments, fifth-order autoregression AR(5) was determined as the best predictive model. The forecast obtained and model quality indicators approve the feasibility of applying the proposed multi-level approach to building predictive models, which is based on the clustering of countries of the world and the formation of homogeneous training samples. A similar approach can be used in a wide range of economic and managerial tasks.
Research of the dependence of the efficiency of modeling the creditworthiness of borrowers on the method of forming a control subset
(ДВНЗ «Київський національний економічний університет імені Вадима Гетьмана», 2020) Pyrohov, Viacheslav; Пирогов, В’ячеслав І.; Turchenko, Stanislav; Турченко, Станіслав В.
In the article has been conducted a research aiming increase of classification result stability of commercial bank’s debtor creditworthiness with usage of boosted decision trees and neural network algorithms due to the use of stratified sampling. It is proposed to improve the classical procedure of stratified sampling by taking into account not only the target variable, but also the most significant predictors of the model when forming the control subset. Experimental calculations to test the proposed hypotheses were carried out using the program packages LGBM and H2O on the data of international consumer finance provider Home Credit. In the article checked and confirmed that the use of stratified sampling in the process of forming a control subset during training of machine learning models makes possible to increase their stability and accuracy of forecasts on new data sets. As per the achieved results, the authors’ approach of stratified sampling during forming a control dataset by target variable and the most significant characteristics of a model demonstrates a higher average accuracy for boosted decision trees on the test subset compared to the standard stratified sampling algorithm and random selection. У статті проведено дослідження з підвищення стійкості результатів класифікації кредитоспроможності боржників комерційного банку з використанням бустингових дерев рішень та нейромережевих алгоритмів за рахунок застосування стратифікованого семплінгу. Запропоновано удосконалення класичної процедури стратифікованого семплінгу шляхом врахування при формуванні контрольної вибірки не тільки цільової змінної, але й найбільш значущих предикторів моделі. Експериментальні розрахунки для перевірки висунутих гіпотез проведено з використанням програмних пакетів LGBM і H2O на даних міжнародного провайдера споживчого кредитування Home Credit. У статті перевірено та підтверджено, що використання стратифікованого семплінгу в процесі формування контрольної вибірки під час навчання моделей машинного навчання дозволяє підвищити їх стабільність і точність прогнозів на нових наборах даних. Відповідно до отриманих результатів, авторський підхід до стратифікованого семплінгу при формуванні контрольного набору даних за цільовою змінною та найбільш значущими характеристиками моделі демонструє вищу середню точність для бустингових дерев рішень на тестовій вибірці в порівнянні зі стандартним стратифікованим алгоритмом семплінгу та випадковим відбором.
Виявлення шахрайства в автострахуванні: проблема незбалансованої вибірки
(ДВНЗ «Київський національний економічний університет імені Вадима Гетьмана», 2020) Кононова, Катерина Ю.; Kononova, Kateryna; Гавриленко, Анна С.; Havrylenko, Anna
Вирішуючи завдання класифікації методами машинного навчання, фахівці з аналізу даних часто стикаються з проблемою незбалансованих даних. Наявність дисбалансу класів характерна для даних фінансового сектору, зокрема для задач з виявлення шахрайства в автострахуванні. Навчання моделей на незбалансованих даних може призвести до неправильної класифікації та великої кількості помилкових визначень через схильність класифікатора відносити випадки до класу більшості. Дана робота присвячена дослідженню способів вирішення проблеми дисбалансу класів у задачі класифікації страхових випадків. Для вирішення поставленого завдання було використано базу даних у сфері автострахування, в якій міститься інформація щодо наявності чи відсутності шахрайства за позовами клієнтів. Клас шахрайських випадків, який цікавить нас найбільше, представлений у базі втричі меншою кількістю записів за правомірні позови. Задля уникнення проблем моделювання на незбалансованих даних були застосовані методи передискретизації, зокрема випадковий оверсемплінг та SMOTE. Оцінка результатів, отриманих на різних вибірках, показує, що методи балансування дозволяють суттєво покращити якість класифікації. У ході дослідження на отриманих наборах даних були побудовані класифікатори на основі логістичної регресії, методу опорних векторів, алгоритму k-найближчих сусідів, Байєсівського класифікатора, дерева рішень, випадкового лісу та нейронної мережі персептронного типу. Порівняльний аналіз показників якості побудованих класифікаторів допоміг визначити найкращі методи для виявлення шахрайських претензій. Для обох наборів даних такими методами були визнані логістична регресія та нейронна мережа, які мають високий рівень виявлення шахрайських випадків у поєднанні з належною загальною прогностичною силою моделі. Solving classification problems using machine learning methods, data scientists often face the problem of data imbalances. Class imbalance is common in financial sector, in particular for the task of fraud detection in car insurance. Training models on unbalanced data can lead to misclassifications and large numbers of false positives due to the tendency of the model to classify observed cases as the majority class. This paper deals with the study of ways to solve the problem of class imbalance in the task of insurance claims classifying. To solve this problem, a database in the field of auto insurance was used, which provide information about the presence or absence of fraudulent customer claims. The class of fraudulent cases that interests us the most is represented in the database by three times fewer records than for legitimate claims. Oversampling techniques including random oversampling and SMOTE were applied to avoid modeling problems on unbalanced data. Evaluation of the results obtained on different samples indicates that balancing methods can significantly improve the quality of the classification. Logistic regression, support vector machine, k-nearest neighbors classifier, Bayesian classifier, decision tree, random forest and perceptron type neural network were built on the obtained datasets. A comparative analysis of the models’ qualities allowed to determine the best methods for detecting fraudulent claims. For both datasets, logistic regression and neural network were recognized as such methods, having a high level of fraud detection combined with a good predictive power of the model.
Machine learning approach of analysis of emotional polarity of electronic social media
(ДВНЗ «Київський національний економічний університет імені Вадима Гетьмана», 2020) Derbentsev, Vasyl; Дербенцев, Василь Джоржович; Дербенцев, Василий Джорджевич; Bezkorovainyi, Vitalii; Безкоровайний, Віталій Сергійович; Бескоровайный, Виталий Сергеевич; Akhmedov, Renat; Ахмедов, Ренат Рамазанович
This paper proposes a new approach to evaluating the emotional polarity (or Sentiment Analysis) of electronic social media texts. For this purpose both conventional Machine Learning (Logistic Regression and Support Vector Machine), and Deep Neural Networks approaches (Fully Connected and Convolutional Neural Networks) were used. As vector representations of words, we used both the frequency-based and pretrained words embeddings Word2vec and GloVe (with embedding dimensions of size 100 and 300). For the selected English-language IMDb Movie Reviews dataset the classification accuracy using the Logistic Regression model was 87%, the Support Vector Machine – 87.5%, the Fully Connected Neural Network – 88%, and the Convolutional Network – 90%. The accuracy of the proposed models is a quite acceptable for practical use-cases and is not inferior to cutting-edge Natural Language Processing solutions in the field of Sentiment Analysis, which opens up good prospects for further research. У статті пропонується новий підхід до оцінки емоційної полярності (або аналізу настроїв) електронних текстів у соціальних мережах. Для цього використовувалися як класичні методи машинного навчання (логістична регресія та метод опорних векторів), так і інструментарій глибоких нейронних мереж (повнозв’язні та згорткові нейромережі). Векторне представлення ґрунтувалось на частотних та попередньо навчених вкладеннях слів Word2vec і GloVe (з розмірами вкладення 100 і 300). Для вибраного англомовного набору даних IMDb Movie Reviews точність класифікації за допомогою моделі логістичної регресії становила 87%, машини опорних векторів – 87,5%, повнозв’язної нейронної мережі – 88% і згорткової мережі – 90%. Точність запропонованих моделей є цілком прийнятною для практичних ситуацій і не поступається передовим рішенням у сфері обробки природньої мови за напрямом аналізу настроїв, що відкриває обнадійливі перспективи для подальших досліджень.
Штучна нейроподібна мережа як основа формування логічного висновку в системах виключної складності
(ДВНЗ «Київський національний економічний університет імені Вадима Гетьмана», 2020) Граняк, Валерій Ф.; Hraniak, Valerii; Мазур, Віктор А.; Mazur, Viktor; Матвійчук, Віктор; Matviichuk, Viktor
У роботі сконструйовано структуру штучної нейронної мережі, як ключового елементу формування логічного висновку в системі виключної складності. Запропоновано здійснювати аналіз систем типу «чорна скринька» з розподіленими параметрами шляхом незалежної інтегральної обробки інформації на локалізованих ділянках з подальшим її загальним аналізом у нейронному шарі верхнього рівня. Показано, що зазначений підхід дає змогу вилучити вплив неінформативних чинників, які за структурою своєї дії є подібними до інформативного впливу, проте носять локальний характер. Запропоновано алгоритм формування високоінформативного числового критерію на прикладі оцінки впливу дебалансу ротора обертової електричної машини, як важливої практичної задачі передбачення відмов у роботі виробничого обладнання та попередження можливих економічних збитків. В основу методики розрахунку запропонованого критерію покладено дискретне вейвлет перетворення часової реалізації вібросигналу з подальшим розрахунком середньо-квадратичного значення вибраних частотних смуг. Доведено, що для виявлення дебалансу ротора найбільш інформативними є частотні смуги, які включають у себе роторну частоту та її другу та третю гармонічні складові. Продемонстровано, що зазначений критерій має понижену чутливість до впливу неінформативних одиничних збурень, що можуть виникати в процесі роботи устаткування. Показано, що запропоноване рішення може розглядатися як окремо узятий унікальний випадок, що має значну практичну цінність, оскільки може бути адаптованим для вирішення задач широкого класу. In the paper, the structure of an artificial neural network is constructed as a key element of forming a logical conclusion in a system of exceptional complexity. It is proposed to analyze the “black box” systems with distributed parameters by means of independent integrated processing of information in localized areas with its subsequent general analysis in the neural layer of the upper level. It is shown that this approach makes it possible to eliminate the influence of non-informative factors, which in the structure of their action are similar to the informative influence, but are of a local nature. A possible algorithm for the formation of a highly informative numerical criterion is proposed on the example of assessing the impact of the imbalance of the rotor of a rotating electric machine, as an important practical problem of predicting failures in the operation of production equipment and preventing possible economic losses. It is demonstrated that this criterion has a reduced sensitivity to the effect of single uninformative disturbances that occurs during the operation of the equipment. It is shown that the proposed solution can be considered as a unique case that has significant practical value, as it can be adapted to solve problems of a wide class.
Застосування динамічного нечіткого space-аналізу для формування стратегій підприємства
(ДВНЗ «Київський національний економічний університет імені Вадима Гетьмана», 2020) Балан, Валерій Г.; Balan, Valerii
У статті розроблена методика формування стратегій підприємства (його підрозділів – стратегічних бізнес-одиниць (СБО)) за допомогою динамічного SPACE-аналізу із застосуванням теорії нечітких множин, зокрема методів нечіткого багатокритеріального аналізу. Методичний інструментарій стратегічного планування вдосконалено шляхом урахування нечіткості інформації щодо вхідних даних, одержаних від експертів як на етапі визначення вагових коефіцієнтів критеріїв оцінювання, так і при отриманні оцінок за критеріями для поточного та прогнозованого станів підприємства. Зазначено, що для оптимізації системи часткових критеріїв за кожним із узагальнених критеріїв оцінювання стратегічних бізнес-одиниць є доцільним застосування Fuzzy DEMATEL-методу. Для визначення нечітких значень вагових коефіцієнтів часткових критеріїв розроблені три розрахункові схеми: з використанням алгоритмів Fuzzy SMART-методу, нечіткого методу аналізу ієрархій (FAHP) та Fuzzy DEMATEL-методу. Для обчислення нечітких значень рівня кожної СБО за узагальненими критеріями застосовується метод нечіткого простого адитивного зважування (Fuzzy SAW). У випадку суттєвого розходження експертних оцінок для їх узгодження пропонується використовувати Fuzzy Delphі-метод. Для наочного представлення стратегічної позиції кожної СБО в поточному та прогнозованому станах побудовані відповідні вектори стратегій. Уточнення стратегічних позицій бізнес-одиниць підприємства здійснюється за допомогою α-перерізів. На основі аналізу одержаних траєкторій (S-векторів) та суперпозиції базових траєкторій «руху» для кожної стратегічної бізнес-одиниці сформовані відповідні стратегічні рекомендації. З метою практичного застосування запропонованого алгоритму розроблено фреймворк, який здійснює трансформацію лінгвістичних експертних оцінок у нечіткі числа, реалізує повною мірою розрахункову схему і дає змогу провести імітаційне моделювання залежно від коригувань міркувань експертів. Проведено апробацію розробленої методики для вітчизняного підприємства енергетичної галузі. Дана методика може бути використана у стратегічному плануванні діяльності підприємства як інструмент портфельного аналізу в якості основного чи комплементарного підходу. The article develops a method of forming strategies for the enterprise (its divisions – strategic business units (SBU)) using dynamic SPACEanalysis based on fuzzy set theory, in particular, methods of fuzzy multicriteria analysis. The methodological tools of strategic planning have been improved by considering the vagueness of information related to the input data obtained from experts both at the stage of determining the weights of evaluation criteria and in getting estimates of criteria of the current and predicted state of the enterprise. It is noted that to optimize the system of partial criteria for each of the generalized evaluation criteria of strategic business units, it is advisable to use the Fuzzy DEMATEL method. To determine the fuzzy values of the weights of partial criteria, three calculation schemes have been developed: using the algorithms of the Fuzzy SMART method, the Fuzzy Analytic Hierarchy Process method (FAHP) and the Fuzzy DEMATEL method. The Fuzzy SAW method is used to calculate the fuzzy values of the state of each SBU according to generalized criteria. The Fuzzy Delphi method is proposed to be used in case of significant differences in expert evaluation to concordance them. Strategy vectors have been constructed to visualize the strategic position of each SBU in the current and predicted states. Clarification of the strategic positions of the enterprise’s business units is carried out using α-cuts. Strategic recommendations are formed on the basis of the analysis of the received trajectories (S-vectors) and superposition of basic trajectories of “movement” for each strategic business unit. For the purpose of practical application of the proposed algorithm, a framework has been developed that transforms linguistic expert evaluations into fuzzy numbers, fully implements the calculation scheme, and allows realizing simulation modeling depending on the adjustments of expert opinions. Approbation of the developed methodology was carried out at the Ukrainian enterprise of the energy branch. This technique can be used in the enterprise’s strategic planning as a tool of portfolio analysis as a primary or complementary approach.
Neuro-fuzzy modelling of economic specialties students’ speech-communicative professional competence
(ДВНЗ «Київський національний економічний університет імені Вадима Гетьмана», 2020) Azarova, Anzhelika; Азарова, Анжеліка О.; Radomska, Liudmyla; Радомська, Людмила А.; Azarova, Larysa; Азарова, Лариса Є.
In the article, the new methodological approach and the corresponding mathematical apparatus based on neural networks and fuzzy logic methods for assessing the student’s speech-communicative professional competence level are proposed. It was proposed for the first time: the mathematical model for estimating the level of speech-communicative professional competence of economic specialties students and its formalization method based on the mathematical apparatus of fuzzy logic and the Hopfield neural network. It allows precisely and adequately with less losing time to map the set of input parameters to the set of resulting solutions, taking into account the wide range of both quantitative and qualitative factors of influence consider the complexity and dynamism of such a process. To carry out calculations of such a weakly formalized characteristic as speechcommunicative professional competence, the authors of the article propose the use of aggregation functions which allow assessing the levels of: psychophysical qualities of the student; personal qualities of the student; language competence of the economic specialties student; student’s speech competence; ability to ensure the quality of the student’s speech; skills to increase the effectiveness of the communicative process of student’s speech. The calculations performed have demonstrated the applicability and effectiveness of the proposed approach and the developed complex of models for solving problems with many subjective variables and significant uncertainty. У статті запропоновано новий методологічний підхід та відповідний математичний апарат на основі методів нейронних мереж та нечіткої логіки для оцінювання рівня мовно-комунікативної професійної компетентності студента. Вперше запропоновано математичну модель для оцінки рівня мовно-комунікативної професійної компетентності студентів економічних спеціальностей та метод її формалізації на основі математичного апарату нечіткої логіки та нейронної мережі Хопфілда. Це дозволяє точно й адекватно з меншими втратами часу відобразити набір вхідних параметрів до набору результуючих рішень, беручи до уваги широкий діапазон як кількісних, так і якісних факторів впливу для врахування складності та динамічності такого процесу. Для проведення розрахунків такої слабоформалізованої характеристики, як мовно-комунікативна професійна компетентність, автори статті пропонують використовувати агрегуючі функції, які дозволяють оцінити рівні: психофізичних якостей студента; особистісні якості; мовну компетентність студента економічних спеціальностей; мовленнєву компетентність; уміння забезпечити якість мовлення студента; уміння підвищувати ефективність комунікативного процесу мовлення студента. Проведені розрахунки продемонстрували валідність та ефективність запропонованого підходу та розробленого комплексу моделей для розв’язання задач із багатьма суб’єктивними змінними в умовах суттєвоїневизначеності.

Browse

Recent Submissions