Застосування методів машинного навчання до прогнозування часових рядів криптовалют

Abstract
Робота присвячена питанням прогнозування короткострокової динаміки часових рядів криптовалют за допомогою методів машинного навчання (ML). Проаналізовано методологічні засади, переваги та недоліки використання ML-алгоритмів при дослідженні фінансових часових рядів.Проведено прогнозні розрахунки динаміки трьох найбільш капіалізованих криптовалют (Bitcoin, Ethereum, Ripple) на 90-денний часовий горизонт як за допомогою запропонованого методу бінарного авторегресійного дерева (BART), так і звикористанням нейронних мереж (багатошарового персептрону, MLP) та ансамблю моделей дерев регресії та класифікації (випадковий ліс, RF). Перевагою побудованих моделей є те, що їх застосування не накладає жорстких обмежень на статистичні властивості досліджуваних часових рядів, при цьому в якості предикторів використовуються лише минулі значення цільової змінної. Проведено порівняльний аналіз прогностичних властивостей побудованих моделей, згідно з яким усі моделів цілому достатньо адекватно описують динаміку досліджуваних криптовалют, при цьому похибки прогнозу цін за середньою абсолютною процентною похибкою (MAPE) для моделей BART та MLP склали в середньому 3,5%, а для моделі RF—в межах 5%.Проведені комп’ютерні експерименти підтвердили доцільність застосування розглянутих ML моделей для задач короткострокового прогнозування фінансових часових рядів. Побудовані моделі та їх ансамблі можуть бути покладені в основу алгоритмів для автоматизованих торгових систем, призначених для інтернет-трейдінгу. This paper is devoted to the problems of the short-term forecasting cryptocurrencies time series using machine learning approach. The methodological principles, advantages and disadvantages of using ML-algorithms in the study offinancial time series are analyzed.The 90-day time horizon of the three most capitalized crypto-currencies (Bitcoin, Ethereum, Ripple) dynamics has been estimated both using the proposed Binary Autoregressive Tree model (BART), and Neural Networks(Multilayer Perceptron, MLP) and an ensemble of Classification and Regression Trees models (Random Forest, RF). The built models have such advantages as their application does not impose strict limitation on the statistical properties of the studied time series,with only past values of the target variable being used as predictors. Comparative performance of the predictive ability of the constructed models is carried out, according to which all the models adequately describe the dynamics of the cryptocurrencies. Price forecast errors calculated by the MAPE for the BART and MLP models were on average 3.5%, and for RF model—within 5%.Computer experiments have confirmed the feasibility of using proposedML-models for the short-term forecasting of financial time series. The constructed models and their ensembles can become the basis for the algorithms for automated trading systems for online trading. Работа посвящена вопросам прогнозирования краткосрочной динамики временных рядов криптовалют с помощью методов машинного обучения (ML). Проанализированы методологические основы, преимущества и недостатки использования ML-алгоритмов при исследовании финансовых временных рядов. Проведены прогнозные расчеты динамики трех наиболее капитализированных криптовалют (Bitcoin, Ethereum, Ripple) на 90-дневный временной горизонт как с помощью предложенного метода бинарного авторегрессионного дерева (BART), так и с использованием нейронных сетей (многослойного персептрона, MLP) и ансамбля моделей деревьев регрессии и классификации (случайный лес, RF). Преимуществом построенных моделей является то, что их применение не накладывает жестких ограничений на статистические свойства изучаемых временных рядов, причем в качестве предикторов используются только предыду-щие значения целевой переменной.Проведен сравнительный анализ прогностических свойств построенных моделей, согласно которому все модели в целом достаточно адекватно описывают динамику исследуемых криптовалют, при этом ошибки прогноза цен, рассчитанные по средней абсолютной процентной погрешности (MAPE), для моделей BART и MLP составили в среднем 3,5%, а для модели RF—в пределах 5%. Проведенные компьютерные эксперименты подтвердили целесообразность применения рассмотренных ML моделей для задач краткосрочного прогнозирования финансовых временных рядов. Построенные модели и их ансамбли могут быть положены в основу алгоритмов для автоматизированных торговых систем, предназначенных для интернет-трейдинга.
Description
Keywords
машинне навчання, модель бінарного авторегресійного дерева, випадковий ліс, нейронна мережа, короткострокове прогнозування, криптовалюта, фінансовий часовий ряд, machine learning, binary autoregressive tree model, regression and classification tree ensemble, neural network, short-term forecasting, cryptocurrency, financial time series, машинное обучение, модель бинарного авторегрессионного дерева, случайный лес, нейронная сеть, краткосрочное прогнозирование, криптовалюта, финансовый временной ряд
Citation
Дербенцев В. Д. Застосування методів машинного навчання до прогнозування часових рядів криптовалют / В. Д. Дербенцев, Г. І. Великоіваненко, Н. В. Даценко // Нейро-нечіткі технології моделювання в економіці : наук.-анал. журн. / М-во освіти і науки України, ДВНЗ «Київ. нац. екон. ун-т ім. Вадима Гетьмана» ; редкол.: А. В. Матвійчук (голов. ред.) [та ін.]. – Київ : КНЕУ, 2019. – № 8. – С. 65–93.