Застосування дерев класифікації та регресії до прогнозування часових рядів фінансових інструментів

Loading...
Thumbnail Image
Date
2018
Journal Title
Journal ISSN
Volume Title
Publisher
ДВНЗ «Київський національний економічний університет імені Вадима Гетьмана»
Abstract
Робота присвячена задачам прогнозування часових рядів фінансових інструментів з використанням методів і моделей машинного навчання. Запропоновано алгоритм бінарного авторегресійного дерева (BART), який є більш придатним для аналізу скалярних часових рядів. Алгоритм BART поєднує класичний алгоритм методу дерев класифікації та регресії C&RT і стандартні авторегресійні моделі ARIMA. Особливістю даного алгоритму є критерій обрання кращого розщеплення (або критерій інформативності) на основі показника ентропії, оскільки він надає перевагу варіантам дерев із меншою складністю. Для вихідного часового ряду у запропонованому алгоритмі застосовується метод «віконного» перетворення даних. Результатом цього перетворення є розділення простору вхідних змінних на сегменти, що дозволяє побудувати для кожного з них власну (локальну) модель. Оскільки кінцевою метою запропонованого алгоритму є прогнозування, то на вузлах-листях будується стандартна авторегресійна модель класу ARIMA, яка є традиційним інструментом прогнозування фінансових часових рядів. Окрім цього, застосування ітераційного методу в BART дозволяє глибоко контролювати процес побудови дерева, і тим самим, забезпечує більш «м’який» контроль процесу його побудови за рахунок: визначення довільного порядку розщеплення вузлів; впровадження правил ранньої зупинки, які аналізують як окремі вузли, так і усе дерево регресії в цілому; зупинки побудови дерева авторегресії в будь-який час. Для тестування прогностичних властивостей алгоритму BART було проведено розрахунки динаміки двох найбільш капіталізованих криптовалют (Bitcoin, Ethereum) на період від 5 до 30 днів за допомогою запропонованого методу і з використанням класичних моделей часових рядів сімейства ARIMA-ARFIMA. Згідно з одержаними результатами, алгоритм BART має кращі прогностичні властивості, ніж моделі часових рядів як для періодів повільної, так і складної динаміки. This paper is devoted to the problem of forecasting financial time series using machine learning approach. The binary autoregressive tree algorithm (BART), which is more suitable for scalar time series analysis, is proposed. The BART algorithm combines the classic classification and regression tree algorithm (C&RT ) with standard ARIMA autoregressive models. One of the main features of BART is the criterion for choosing a better splitting (or informative criterion) based on the entropy index, because it prefers the trees with less complexity. For the original time series, the proposed algorithm used the window data- transformation technique. The result of this transformation is fragmentation the space of the input variables into segments, which allows us to build own (local) model for each of them. Since the final goal of the proposed algorithm is forecasting, a standard autoregressive models ARIMA are built on the leaf nodes, which is the conventional financial time series forecasting tool. In addition, using of an iterative method in BART allows us to deeply control the process of building a tree, and thus provides more «soft» control of the process of its construction by: determining the arbitrary order of splitting nodes; implementing early stop rules that analyze both individual nodes and the whole regression tree; stop building an autoregressive tree at any time. To test the prognostic properties of the BART algorithm, we calculated the dynamics of the two most capitalized cryptocurrencies (Bitcoin, Ethereum) for a period of 5 to 30 days using the proposed method and classical ARIMA-ARFIMA time series models. According to the obtained results, the BART algorithm has better predictive properties than the time series models for both slow and complex dynamics.
Description
Keywords
машинне навчання, дерева класифікацій та регресій, прогнозування, фінансові часові ряди, криптовалюти, machine learning, classification and regression trees, forecasting, financial time series, cryptocurrencies
Citation
Даценко Н. В. Застосування дерев класифікації та регресії до прогнозування часових рядів фінансових інструментів / Даценко Наталія В. // Вчені записки : зб. наук. пр. / М-во освіти і науки України, ДВНЗ «Київ. нац. екон. ун-т ім. Вадима Гетьмана» ; [редкол.: О. Яценко (голов. ред.) та ін.]. – Київ : КНЕУ, 2018. – Вип. 19. – С. 195–206.