Browsing by Author "Matviichuk, Andrii"
Now showing 1 - 9 of 9
Results Per Page
Sort Options
Item A comparative study of deep learning models for sentiment analysis of social media texts(CEUR Workshop Proceedings, 2022-11) Derbentsev, Vasyl; Дербенцев, Василь Джоржович; Безкоровайний, Віталій Сергійович; Безкоровайный, Виталий Сергеевич; Matviichuk, Andrii; Матвійчук, Андрій Вікторович; Матвийчук, Андрей Викторович; Pomazun, Oksana; Помазун, Оксана Миколаївна; Помазун, Оксана Николаевна; Hrabariev, Andrii; Грабарєв, Андрій Володимирович; Грабарев, Андрей Владимирович; Hostryk, OleksiiSentiment analysis is a challenging task in natural language processing, especially for social media texts, which are often informal, short, and noisy. In this paper, we present a comparative study of deep learning models for sentiment analysis of social media texts. We develop three models based on deep neural networks (DNNs): a convolutional neural network (CNN), a CNN with long short-term memory (LSTM) layers (CNN-LSTM), and a bidirectional LSTM with CNN layers (BiLSTM-CNN). We use GloVe and Word2vec word embeddings as vector representations of words. We evaluate the performance of the models on two datasets: IMDb Movie Reviews and Twitter Sentiment 140. We also compare the results with a logistic regression classifier as a baseline. The experimental results show that the CNN model achieves the best accuracy of 90.1% on the IMDb dataset, while the BiLSTM-CNN model achieves the best accuracy of 82.1% on the Sentiment 140 dataset. The proposed models are comparable to state-of-the-art models and suitable for practical use in sentiment analysis of social media texts.Item Irreversibility of financial time series: a case of crisis(CEUR Workshop Proceedings, 2021-05) Bielinskyi, Andrii; Hushko, Serhii; Matviichuk, Andrii; Матвійчук, Андрій Вікторович; Матвийчук, Андрей Викторович; Serdiuk, Oleksandr; Semerikov, Serhii; Soloviov, VolodymyrThe focus of this study to measure the varying irreversibility of stock markets. A fundamental idea of this study is that financial systems are complex and nonlinear systems that are presented to be non-Gaussian fractal and chaotic. Their complexity and different aspects of nonlinear properties, such as time irreversibility, vary over time and for a long-range of scales. Therefore, our work presents approaches to measure the complexity and irreversibility of the time series. To the presented methods we include Guzik’s index, Porta’s index, Costa’s index, based on complex networks measures, Multiscale time irreversibility index and based on permutation patterns measures. Our study presents that the corresponding measures can be used as indicators or indicator-precursors of crisis states in stock markets.Item Machine learning approaches for financial time series forecasting(CEUR Workshop Proceedings, 2021) Derbentsev, Vasyl; Дербенцев, Василь Джоржович; Дербенцев, Василий Джорджевич; Matviichuk, Andrii; Матвійчук, Андрій Вікторович; Матвийчук, Андрей Викторович; Datsenko, Nataliia; Даценко, Наталія Володимирівна; Даценко, Наталья Владимировна; Bezkorovainyi, Vitalii; Безкоровайний, Віталій Сергійович; Безкоровайный, Виталий Сергеевич; Azaryan, AlbertThis paper is discusses the problems of the short-term forecasting of financial time series using supervised machine learning (ML) approach. For this goal, we applied several the most powerful methods including Support Vector Machine (SVM), Multilayer Perceptron (MLP), Random Forests (RF) and Stochastic Gradient Boosting Machine (SGBM). As dataset were selected the daily close prices of two stock index: SP 500 and NASDAQ, two the most capitalized cryptocurrencies: Bitcoin (BTC), Ethereum (ETH), and exchange rate of EUR-USD. As features we used only the past price information. To check the efficiency of these models we made out-of-sample forecast for selected time series by using one step ahead technique. The accuracy rates of the forecasted prices by using ML models were calculated. The results verify the applicability of the ML approach for the forecasting of financial time series. The best out of sample accuracy of short-term prediction daily close prices for selected time series obtained by SGBM and MLP in terms of Mean Absolute Percentage Error (MAPE) was within 0.46-3.71 %. Our results are comparable with accuracy obtained by Deep learning approaches.Item Sentiment Analysis of Electronic Social Media Based on Deep Learning(CEUR Workshop Proceedings, 2022-11) Derbentsev, Vasyl; Дербенцев, Василь Джоржович; Дербенцев, Василий Джорджевич; Bezkorovainyi, Vitalii; Безкоровайний, Віталій Сергійович; Безкоровайный, Виталий Сергеевич; Matviichuk, Andrii; Матвійчук, Андрій Вікторович; Матвийчук, Андрей Викторович; Pomazun, Oksana; Помазун, Оксана Миколаївна; Помазун, Оксана Николаевна; Hrabariev, Andrii; Грабарєв, Андрій Володимирович; Грабарев, Андрей Владимирович; Hostryk, OleksiiThis paper describes Deep Learning approach of sentiment analyses which is an active research subject in the domain of Natural Language Processing. For this purpose we have developed three models based on Deep Neural Networks (DNNs): Convolutional Neural Network (CNN), and two models that combine convolutional and recurrent layers based on Long-Short-Term Memory (LSTM), such as CNN-LSTM and Bi-Directional LSTM-CNN (BiLSTM-CNN). As vector representations of words were used GloVe and Word2vec word embeddings. To evaluate the performance of the models, were used IMDb Movie Reviews and Twitter Sentiment 140 datasets, and as a baseline classifier was used Logistic Regression. The best result for IMDb dataset was obtained using CNN model (accuracy 90.1%), and for Sentiment 140 the model based on BiLSTM-CNN showed the highest accuracy (82.1%) correspondinly. The accuracy of the proposed models is a quite acceptable for practical use and comparable to state of the art models.Item Аналіз крос-кореляційного зв’язку між біткоїном та фондовим ринком(Черкаський державний технологічний університет, 2022-06) Соловйов, Володимир; Soloviov, Volodymyr; Соловйова, В.; Soloviova, V.; Матвійчук, Андрій Вікторович; Matviichuk, Andrii; Матвийчук, Андрей Викторович; Семеріков, С.; Semerikov, S.; Бєлінський, А.; Bielinskyi, A.У роботі ми досліджуємо крос-кореляційні зв’язки між фондовими і криптовалютними ринками. Показники складності, які можуть служити індикаторами (індикаторами-передвісниками) кризових явищ на обох ринках, отримуються із застосуванням кроскореляційного аналізу детрендованих флуктуацій. На прикладі фондових індексів S&P 500 і HSI та криптовалюти біткоїн, яка переважно і визначає існування крипторинку, ми оцінюємо динаміку кроскореляцій на обох ринках. Використовуючи підхід ковзного вікна, ми локалізуємо їх динаміку в часі і визначаємо високий ступінь нелінійності з домінуючою антиперсистентністю в періоди крахів для кожного індексу. Існування індикаторів, що здатні ідентифікувати періоди з високим і низьким ступенем крос-кореляцій для фондового і крипторинків становить перспективи для надійної торгівлі із кількома парами активів та ефективної диверсифікації потенційних ризиків. In this study, we examine cross-correlation relationships between stock and cryptocurrency markets. The measures of complexity, which can serve as indicators (indicators-precursors) in both markets are retrieved from Detrended Cross-Correlations Analysis (DCCA). On the example of the S&P 500 and HSI stock indices and the Bitcoin cryptocurrency, which mostly determines the existence of the crypto market, we assess the variation of cross-correlations in both markets. Using the sliding window approach, we localize their dynamics across time and indicate a high degree of non-linearity with dominant antipersistency during crash periods for each index. The existence of indicators that are able to detect the periods of high and low cross-correlations for stock and crypto markets provides prospects for reliable trading with several pairs of assets and effective diversification of their risks.Item Генеративний штучний інтелект як чинник нових викликів та можливостей в освітній діяльності(Київський національний економічний університет імені Вадима Гетьмана, 2024-04) Великоіваненко, Галина Іванівна; Velykoivanenko, Halyna; Великоиваненко, Галина Ивановна; Матвійчук, Андрій Вікторович; Matviichuk, Andrii; Матвийчук, Андрей Викторович; Скіцько, Володимир Іванович; Skitsko, Volodymyr; Скицко, Владимир ИвановичItem Кластерне моделювання зайнятості трудових ресурсів в умовах глобалізації(Київський національний економічний університет імені Вадима Гетьмана, 2023) Іващенко, Катерина Русланівна; Ivashchenko, Kateryna; Матвійчук, Андрій Вікторович; Matviichuk, AndriiУ статті досліджено сутність явища, стан та динаміку розвитку безробіття у структурі сучасної економіки, проаналізовано літературні джерела щодо прогнозування зайнятості трудових ресурсів. Запропоновано новий підхід до вирішення задачі аналізу та прогнозування розвитку ринку праці та показників зайнятості трудових ресурсів із використанням інструментарію самоорганізаційних карт Кохонена. Підґрунтям даного підходу є обмеженість рядів даних за окремими країнами для отримання значущих висновків чи прогнозів. Тож для підвищення точності моделювання доцільно розширити інформаційну базу відповідними даними по інших країнах. Але, враховуючи суттєві відмінності між різними країнами, виникає потреба у виокремленні груп країн, подібних між собою за станом і розвитком ринку праці. З цією метою якраз і стає у нагоді застосування кластеризаційних методів. У ході дослідження було відібрано понад 40 первинних показників, що визначають рівень безробіття, зайнятості, стан ринку праці, демографічні та макроекономічні характеристики 203 країн світу за 12-річний період з 2010 по 2021 рр. В результаті проведеної фільтрації даних залишилось 173 країни, на основі яких проводиться подальший аналіз та кластеризація. При заповненні пропусків за цими країнами було взято середні значення за відповідним показником по групам країн з одним рівнем людського розвитку. Також було аргументовано доцільність застосування при кластеризації показників, що мають відносну форму, для забезпечення можливості порівняння різних за масштабом країн. Відповідно, до остаточного переліку факторів був відібраний ряд відносних показників із первинного переліку, а на основі інших було сконструйовано низку нових відносних предикторів. Загалом 30 індикаторів використовувалися для побудови самоорганізаційної карти Кохонена, яка дозволила сегментувати країни за їхнім рівнем соціальноекономічного розвитку та потенціалом трудових ресурсів. У результаті численних експериментів було виявлено, що найбільш ефективний розподіл, при якому показники країн зберігають найбільшу схожість у групах, спостерігається при розбитті країн світу на 12 кластерів. При такому розподілі Україна потрапляє у кластер з такими країнами: Греція, Польща, Словенія, Угорщина, Хорватія, Чехія та ін. Положення України на самоорганізаційній карті свідчить про високий рівень розвитку ринку праці. Причому у 2018 році Україна змінила своє положення в межах одного кластера, наблизившись до групи більш розвинених країн. The article examines the essence of the phenomenon, the state and dynamics of unemployment in the structure of the modern economy, analyses the literature on forecasting the employment of labour resources. A new approach to solving the problem of analysing and forecasting the development of the labour market and indicators of labour force employment using the Kohonen self-organising maps is proposed. The basis of this approach is the limited data series for individual countries to obtain meaningful conclusions or forecasts. Therefore, to improve the accuracy of the modelling, it is advisable to expand the information base with relevant data for other countries. However, given the significant differences between different countries, there is a need to identify groups of countries that are similar in terms of the state and development of the labour market. This is where clustering methods come in handy. The study selected more than 40 primary indicators that determine the level of unemployment, employment, labour market conditions, demographic and macroeconomic characteristics of 203 countries over the 12-year period from 2010 to 2021. As a result of the data filtering, 173 countries remained, on the basis of which further analysis and clustering are carried out. When filling in the gaps for these countries, the average values for the corresponding indicator for groups of countries with the same level of human development were taken. The authors also argued for the expediency of using relative indicators in clustering to enable comparison of countries of different sizes. Accordingly, a number of relative indicators from the original list were selected for the final list of factors, and a number of new relative predictors were constructed on the basis of others. A total of 30 indicators were used to build the Kohonen self-organising map, which allowed segmenting countries by their level of socio-economic development and labour force potential. As a result of numerous experiments, it was found that the most effective distribution, in which the indicators of countries retain the greatest similarity in groups, is observed when dividing the worldʼs countries into 12 clusters. In this case, Ukraine falls into a cluster with the following countries: Croatia, Czech Republic, Greece, Hungary, Poland, Slovenia, etc. Ukraineʼs position on the self-organising map indicates a high level of labour market development. Moreover, in 2018, Ukraine changed its position within the same cluster, moving closer to the group of more developed countries.Item Моделювання та аналіз економічних систем на підґрунті теорії нечіткої логіки(ДВНЗ «Київський національний економічний університет імені Вадима Гетьмана», 2007-12-17) Матвійчук, Андрій Вікторович; Matviichuk, Andrii; Матвийчук, Андрей Викторович; Вітлінський, Вальдемар ВолодимировичУ дисертації розроблено теоретико-методологічні положення моделювання економічних систем і процесів на підґрунті інструментарію нечіткої логіки. Зокрема, у відповідності до запропонованої концепції побудовано економіко-математичні моделі прогнозування фінансових показників із урахуванням встановленого набору правил з теорії хвиль Елліотта, які є ефективними для отримання як довгострокових, так і короткострокових прогнозів, та характеризуються можливістю адаптації у відповідності до реальних даних. У межах розробленої концепції побудовано економіко-математичну модель відтворення рейтингів цінних паперів та проведення скорингу акцій, яка є своєрідною перехідною ланкою між моделями прогнозування та, власне, моделями аналізу фінансового стану емітента. На базі синтезу методів нечіткої логіки та нейронних мереж розроблено багаторівневу ієрархічну систему оцінювання конкурентоспроможності підприємства. Побудовано моделі діагностики банкрутства підприємства (установи) на основі методів багатофакторного дискримінантного аналізу та з реалізацією механізму нечіткого логічного висновку. Також запропоновано концептуальний підхід до оцінювання ризику ухиляння від сплати податків суб’єктами господарювання для їх розподілу за категоріями уваги з боку податкових органів та на його основі розроблено методику формування плану-графіка податкових перевірок. Результати проведених експериментів підтверджують обґрунтованість викладених теоретичних положень та доцільність застосування методів нечіткої логіки для моделювання економічних систем. There are developed in the dissertation the methodological-theoretic statements of modeling of economic systems and processes based on fuzzy logic tools. In particular, in compliance with proposed conception there are constructed the economic and mathematical models of financial indexes forecasting taking into account the adjusted set of rules from Elliott wave theory, which are effective as for long-term as for short-term forecasting, and characterized by possibility of adaptation in accordance with real data. In the context of developed conception it's constructed the economic and mathematical model of securities rating reproducing and stocks scoring, that is in its own way the transition link between forecasting models and models of issuer's financial state assessment. On basis of synthesis of methods of fuzzy logic and neural networks it's developed the multilevel hierarchical system of enterprise's competitiveness assessment. There are developed the models of diagnosing of bankruptcy of enterprise (establishment) on the basis of methods of multifactor discriminant analysis and with realization of mechanism of fuzzy logic conclusion. Also it's proposed the conceptual approach to assessment of risk of tax non-payment by subjects of economical activity for distribution of taxpayers between the attention categories on the part of state tax service and on this basis it's developed the methods of forming of planned schedule for tax audit. The results of carried out experiments corroborate the validity of stated theoretical statements and the expediency of usage of fuzzy logic tools for economic systems modeling. Диссертация посвящена формированию концептуальных основ и методологических принципов анализа и прогнозирования развития финансово-экономических систем с целью повышения эффективности функционирования этих систем в условиях существенной неопределенности и нестационарности процессов, происходящих в экономике переходного периода. В работе разработана и теоретически обоснована концепция и в соответствии с ней построены экономико-математические модели прогнозирования финансовых показателей с учетом набора правил развития экономических систем из теории волн Эллиотта, заданного с использованием инструментария нечеткой логики. Предложенный подход эффективен как для долгосрочного, так и краткосрочного прогнозирования, а также предоставляет возможность настройки параметров модели на реальных данных финансовых временных рядов. Теоретическое осмысление результатов проведенных экспериментов позволило разработать рациональную структуру функций принадлежности для условий поставленной задачи.Item Оцінювання кредитних ризиків малих і середніх підприємств методами інтелектуального аналізу даних(Національний університет «Острозька академія», 2022) Матвійчук, Андрій Вікторович; Matviichuk, Andrii; Матвийчук, Андрей Викторович; Артюх, Ольга Миколаївна; Artiukh, OlhaСтаття присвячена вирішенню науково-практичного завдання моделювання кредитних ризиків позичальників комерційних банків – малих і середніх підприємств із застосуванням методів інтелектуального аналізу даних, а саме: нейромереж персептронного типу, logit-регресій та дерев прийняття рішень. У статті здійснюється порівняльний аналіз ефективності зазначеного інструментарію при вирішенні поставленої задачі. Проведені експериментальні розрахунки продемонстрували найбільшу придатність для оцінювання ризиків кредитування підприємств методів штучного інтелекту, а саме нейромережі типу персептрон. Результатом дослідження є рекомендації щодо застосування побудованої скорингової моделі в банківській діяльності з метою зниження рівня ризиковості кредитних операцій для малого і середнього бізнесу. The article is devoted to solving the scientific and practical problem of modeling credit risks of borrowers of commercial banks – small and medium enterprises (SME). SME lending in Ukraine is characterized by high risk but the need for lending is increasing and essential, which is due to the socio-economic importance of SMEs. That is why there is a need to use methods and models of intelligent data analysis. Using data mining methods, that are perceptron-type neural networks, logistic regressions and decision trees, researched and analyzed in this paper. The database of bank borrowers was used for the research. In particular, 21 financial and economic indicators of enterprise activity were used for modeling. The article carries out a comparative effectiveness analysis of these tools in solving stated problem. During the research, the general population of data was randomly divided into a general and a test sample, and each of them kept the proportion of default units. The experimental calculations demonstrated the greatest suitability for assessing the risks of lending of enterprises the AI methods, namely neural nets of perceptron type. To compare the results of the models, the following values were used: common accuracy, AUC, GINI, specificity, sensitivity. The most significant parameters for the models are also indicated. The study results in recommendations for the application of the built scoring model in banking in order to reduce the level of SME credit operations riskiness.