Застосування математичних моделей для голосової ідентифікації суб’єктів у сфері фінансової безпеки

Loading...
Thumbnail Image
Date
2017
Journal Title
Journal ISSN
Volume Title
Publisher
ДВНЗ «Київський національний економічний університет імені Вадима Гетьмана»
Abstract
У статті проведено дослідження з вибору найефективніших математичних методів та оптимальних комбінацій параметрів попередньої обробки даних у вирішенні завдань біометричної ідентифікації. Досліджено етапи підготовки даних, поданих у вигляді часових рядів, для завдань розпізнавання образів. Встановлено ознаки потоку даних, які можуть бути використані як вхідні параметри для побудови моделі класифікації. Проведено порівняльний аналіз точності моделей класифікації, побудованих з використанням штучних нейронних мереж, комітетів дерев прийняття рішень та алгоритму опорних векторів, а також порівняння показників витрат комп’ютерного часу на побудову таких моделей. Для зменшення витрат часу для пошуку гіперпараметрів запропоновано застосовувати двоетапний підхід зі скороченням розміру навчальної вибірки та залученням спрощених математичних методів на попередньому етапі пошуку. Проведена експериментальна перевірка підтвердила доцільність застосування такого підходу в процесі оптимізації параметрів підготовки даних і конфігурації нейронної мережі та засвідчила його ефективність з точки зору витрат комп’ютерного часу. Висновки з проведеного дослідження та побудовані моделі можуть бути використані банківськими структурами та іншими установами, зацікавленими в біометричній ідентифікації особи за голосом.
The article is devoted to choosing the most effective mathematical methods and optimal parameters combinations on data preparation and modeling in solving the problems of biometric identification. Stages of the time series data transformation into the form, applicable for pattern recognition tasks, are discovered. The components of the data flow that can be used as input parameters for building a classification model are developed. A comparative analysis of the accuracy of classification models built using artificial neural networks, decision trees committees and support vector algorithm is performed. It’s given the comparison of the cost of computer time to build such models. To reduce the computational cost of searching for hyperparameters there proposed to use two-phased approach on reducing the size of the training sample and simplifying mathematical methods in the preliminary step of search. Experimental testing confirmed the applicability of the approach to optimize the parameters of the data and configuration of the neural network and its efficiency in terms of cost of computer time. Findings from the research and the built models may be used by banking institutions and other organizations interested in biometric identification by voice.
В статье проведено исследование, посвященное выбору наиболее эффективных математических методов и поиску оптимальных комбинаций параметров предварительной обработки данных в решении задач биометрической идентификации. Исследованы этапы подготовки данных, представленных в виде временных рядов, для задач распознавания образов. Установлены признаки потока данных, которые могут быть использованы как входные параметры для построения модели классификации. Проведен сравнительный анализ точности моделей классификации, построенных с использованием искусственных нейронных сетей, комитетов деревьев принятия решений и алгоритма опорных векторов, а также сравнение показателей затрат компьютерного времени на построение таких моделей. Для уменьшения затрат времени для поиска гиперпараметров предложено применять двухэтапный подход с сокращением объема обучающей выборки и привлечением упрощенных математических методов на предварительном этапе поиска. Проведенная экспериментальная проверка подтвердила целесообразность применения такого подхода в процессе оптимизации параметров подготовки данных и конфигурации нейронной сети, а также показала его эффективность с точки зрения затрат компьютерного времени. Выводы из проведенного исследования и построенные модели могут быть использованы банковскими структурами и другими учреждениями, заинтересованными в биометрической идентификации личности по голосу.
Description
Keywords
Біометрична ідентифікація, нейромережа, комітети дерев прийняття рішень, оптимізація гіперпараметрів, витрати процесорного часу, Biometric identification, neural network, Random forest method, hyper-parameters optimization, computational costs, Биометрическая идентификация, нейросеть, комитеты деревьев принятия решений, оптимизация гиперпараметров, расходы процессорного времени
Citation
Щербаков Є. Ю. Застосування математичних моделей для голосової ідентифікації суб’єктів у сфері фінансової безпеки / Є. Ю. Щербаков // Нейро-нечіткі технології моделювання в економіці : наук.-анал. журн. / М-во освіти і науки України, ДВНЗ «Київ. нац. екон. ун-т ім. Вадима Гетьмана» ; редкол.: А. В. Матвійчук (голов. ред.) [та ін.]. – Київ : КНЕУ, 2017. – № 6. – С. 158–190.
Collections