2021 рік
Permanent URI for this community
Browse
Browsing 2021 рік by Subject "519.868:339.92"
Now showing 1 - 2 of 2
Results Per Page
Sort Options
Item Моделювання та прогнозування товарних ринків на основі методу декомпозиції(ДВНЗ «Київський національний економічний університет імені Вадима Гетьмана», 2021) Юнькова, Олена Олександрівна; Yunkova, Olena; Кучер, Павло В.; Kucher, Pavlo; Кучер, Павел В.Прогнози становлять значну інформаційну базу для процесу прийняття управлінських рішень. У даній роботі розглянуто процес дослідження та економетричного моделювання продажів різних товарів: два набори даних, що представляють різні снеки, лікарський препарат від грипу та простуди, знеболююче (нестероїдний протизапальний препарат), гель, що застосовуються проти болю в ногах, а також вітамінний комплекс. Часові ряди щодо продажів снеків і гелю представлено місячними даними, а всі інші набори — тижневими даними. Графічний аналіз даних, а також інструментарій перших різниць та автокореляційна функція показали наявність трендової та сезонної складової в даних часових рядах. Метод декомпозиції, який дає змогу виявляти як довгострокові тенденції розвитку процесів, так і виділити сезонні зміни, застосовано для побудови моделей часових рядів. Для реалізації цього методу вибрано середовище R, в якому передбачено широкий спектр послуг, інструментів і пакетів для аналізу даних. У даній роботі проведено аналіз даних і виділено комбінацію трендової та сезонної складової даних часових рядів. Декомпозицію ряду реалізовано методом LOESS (Seasonal Transformation using LOESS — “STL”). Алгоритм STL реалізує основні засади методу декомпозиції, а саме згладжує часові ряди за допомогою LOESS у двох циклах. У внутрішньому циклі виконується згладжування сезонних коливань і згладжування тренду, а зовнішній цикл мінімізує вплив викидів. При цьому у внутрішньому циклі спершу обчислюється сезонна компонента, а після її видалення обчислюється трендова складова. Залишки обчислюються шляхом віднімання сезонного та трендового компононентів із часових рядів. Виділені залишки перевіряються на відповідність нормальному закону розподілу. Всі зазначені кроки автоматично виконуються за допомогою мови R. Результати економетричного моделювання дозволили виявити головні тенденції, а також здійснити прогноз у короткостроковій перспективі. У результаті дослідження розроблено адекватну модель прогнозування для часових рядів, які можуть виникати на різних товарних ринках. Верифікація моделі показала достатню точність і достовірність виконаних на її основі прогнозів, тому її можна застосовувати у подальших дослідженнях для аналізу продажів продуктів різних категорій і прогнозування їхніх майбутніх значень. Forecasts are a significant information base for the management decision-making process. This study examined the process of research and econometric modeling of sales of different products: two sets of data representing different snacks, a drug for flu and colds, painkillers (nonsteroidal antiinflammatory drug), a gel used for pain in legs, as well as a vitamin complex. The periodicity of the time series of snacks and gel was on a monthly basis, all other sets of data had a weekly seasonality. Data analysis was performed and a combination of trend and seasonal components of time series data were identified. Decomposition was performed by the LOESS method (Seasonal Transformation using LOESS — “STL”). The algorithm of STL will realize basic principles of method of decouplig, namely smooths out sentinels rows by means of LOESS in two cycles. Smoothing of seasonal vibrations and smoothing of trend is executed in the inner loop, and an outer loop minimizes influence of extrass. Thus in the inner loop a seasonal component is calculated at first, and after her moving away the constituent of trend is calculated. Bits and pieces are calculated by deduction of seasonal and trend components from sentinel rows. The distinguished bits and pieces are checked for accordance to the normal law of distribution. All these steps are automatically performed using the R language. In addition, the analysis of the allocated balances for compliance with the normal distribution law was performed. Prognostication of future values of indexes will carry out on the basis of the built model. For quality of prognosis control part of data (last periods) is excluded from an analysis, to have the opportunity to check adequacy of the got results when compared to the noticed values. The results of econometric modeling allowed to identify the main trends, as well as to make a forecast in the short term. As a result of the study using the described procedure developed an adequate forecasting model for time series of different product markets, the verification of which showed sufficient accuracy and reliability of forecasts based on it, so it can be used in further research or analysis of products of different categoriesItem Прогнозування популярності Інтернет-курсів методами машинного навчання(ДВНЗ «Київський національний економічний університет імені Вадима Гетьмана», 2021) Юнькова, Олена Олександрівна; Yunkova, Olena; Юнькова, Елена Александровна; Володько, Т. О.; Volodko, T. O.Масові відкриті онлайн-курси (МВОК) — приклад розвитку руху відкритого навчання, яке привернуло велику увагу як академічної, так і громадської сфери. МВОК не є самостійним явищем, ізольованим від інших розробок в області відкритого і дистанційного навчання або освітніх технологій. Навпаки, МВОК тісно пов’язані з іншими розробками в цій галузі, мають потенціал для підтримки навчання протягом усього життя, усунення перешкод у процесі навчання, забезпечення рівності можливостей в освіті і, що найголовніше, забезпечення лібералізації знань. У роботі визначено теоретичні засади формування ринку інтернет-курсів; проаналізовано сучасний стан і тенденції ринку інтернет-курсів України та світу; проведена класифікація інтернет-курсів залежно від їх рейтингової оцінки; прогнозується значення рейтингової оцінки для визначення популярності онлайн-курсів. Вирішення проблеми прогнозування популярності курсів у даному дослідженні досягається завдяки методам машинного навчання, які класифікують онлайн курси на основі параметру рейтингової оцінки. А саме, курси, які отримують максимальний рейтинговий бал, вважаються популярними. Розв’язування задач класифікації чи регресії засобами машинного навчання найчастіше досягається шляхом побудови ансамблевих моделей. В основу такого підходу покладено гіпотезу про об’єднання кількох моделей, яке може призвести до утворення потужнішої моделі. Спосіб об’єднання моделей має бути адаптованим до їхніх типів. Наразі існує кілька мета-алгоритмів, що застосовують для утворення об’єднаних моделей. В одному з них (метод беггінгу) однорідні початкові моделі навчаються паралельно та незалежно одна від одної, а потім об’єднуються згідно певного детермінованого правила усереднення. Одним з варіантів цього алгоритму є метод випадкового лісу. В іншому алгоритмі моделі навчаються послідовно в адаптивний спосіб. Найпопулярні з них — адаптивний і градієнтний бустинг. Перший оновлює вагу кожного з об’єктів навчального датасета, а другий — оновлює значення цих об’єктів. При цьому обидва методи намагаються розв’язати задачу оптимізації для пошуку найкращої моделі, представленої зваженою сумою початкових слабших моделей. У даній роботі для прогнозування популярності інтернет-курсів застосовано алгоритми градієнтного бустингу та випадкового лісу. Запропоновані моделі гарантують 65-ти відсоткову точність прогнозів. Серед факторів, що знижують точність прогнозу-вання, можна назвати атрибути, які не дуже корелюють із прогнозним значенням, а також диспропорція та значні викиди, які спостерігаються у даних. Розглянуті методи машинного навчання піддаються модифікаціям та тюнингу, що дає можливість покращити моделювання класифікатора. Mass open online courses (MОOС) are an example of the development of the open learning movement, which has attracted a lot of attention from both the academic and public spheres. IOC is not an independent phenomenon isolated from other developments in the field of open and distance learning or educational technologies. On the contrary, IOCs are closely linked to other developments in this field, have the potential to support lifelong learning, remove barriers to learning, ensure equal opportunities in education and, most importantly, liberalize knowledge. The theoretical bases of formation of the market of Internet courses are defined in the work; the current state and trends of the Internet courses market in Ukraine and the world are analyzed; the classification of Internet courses depending on their rating assessment is carried out; the rating value is predicted to determine the popularity of online courses. The solution to the problem of predicting the popularity of courses in this study is achieved through machine learning methods that classify online courses based on the rating parameter. Namely, the courses that receive the maximum rating score are considered popular. Solving problems of classification or regression by machine learning is most often achieved by building ensemble models. This approach is based on the hypothesis of combining several models, which could lead to the formation of a more powerful model. The method of combining models should be adapted to their types. Currently, there are several meta-algorithms used to form integrated models. In one of them (the method of bugging) homogeneous initial models are studied in parallel and independently of each other, and then combined according to a certain deterministic averaging rule. Currently, there are several meta-algorithms used to form integrated models. In one of them (the method of bugging) homogeneous initial models are studied in parallel and independently of each other, and then combined according to a certain determined averaging rule. One variant of this algorithm is the random forest method. In another algorithm, models are trained sequentially in an adaptive manner. The most popular of these are adaptive and gradient boosting. The first updates the weight of each of the training dataset objects, and the second updates the values of these objects. In doing so, both methods attempt to solve the optimization problem to find the best model represented by the weighted sum of the initial weaker models. In this paper, gradient boosting and random forest algorithms are used to predict the popularity of online courses. The proposed models guarantee 65 percent accuracy of forecasts. Factors that reduce the accuracy of the forecast include attributes that do not correlate much with the forecast value, as well as the disparity and significant emissions observed in the data. The considered methods of machine learning are subject to modifications and tuning, which makes it possible to improve the modeling of the classifier.