Рассматривается применение нейронных сетей для моделирования и прогнозирования экономических процессов, представленных статистическими выборками. Произведено сравнение качества полученных моделей, а также анализ зависимости топологий выбранных нейронных сетей от типа исходных данных.
Construction of the models of behavior of the economicprocesses by neuronet technologies .pdf Задачами экономико-статистического моделирования и прогнозирования являются выявление перспективы ближайшего или более отдалённого будущего в исследуемой области на основе реальных результатов деятельности и выработка оптимальных тенденций и перспективных планов с учётом составленного прогноза и оценки принятого решения с позиций последствий в прогнозируемом периоде. Построение модели, наряду с информационными и экспертно-логическими системами, представляется в настоящее время неотъемлемым инструментом теоретической и практической экономики.Построение моделей экономических процессов осуществляется на основе рядов динамики [1]. Временной ряд, динамический ряд (РД) - это последовательность упорядоченных по времени показателей, характеризующих уровень развития изучаемого явления. В составе динамического ряда в принципе можно выделить четыре компоненты: 1) общую тенденцию развития, или тренд; 2) регулярные колебания относительно тренда (типа циклов); 3) сезонные колебания; 4) остаток, или случайную компоненту, отражающую влияние разнообразных факторов стохастического характера.Одной из важнейших задач исследования динамических рядов является установление общих закономерностей или тенденций развития. Для решения этой задачи используются разнообразные сглаживающие приёмы (сглаживающие фильтры), среди которых можно выделить два основных метода: сглаживание с помощью скользящей средней и аналитическое выравнивание. Аналитическое выравнивание динамического ряда - это метод выражения тенденций развития в виде функции изучаемого показателя от времени, называемой моделью тренда. Для сглаживания РД, включающих гармоническую компоненту, в основном применяется модель тригонометрического тренда - ряд Фурье [2] с разным числом гармоник, для идентификации параметров которого применяется классический метод наименьших квадратов (МНК) [3] и дискретный фильтр Калмана [4].Моделирование экономических процессов может осуществляться как с помощью традиционных математических методов, так и с применением современных методов, к которым относятся нейросетевые технологии [6, 8]. Нейронные сети позволяют решать задачи, с которыми не могут справиться традиционные методы, они способны решать задачи, опираясь на неполную, зашумлённую, искажённую информацию. Важным преимуществом использования нейронных сетей для обработки массивов данных являются значительное повышение быстродействия процесса по сравнению с традиционными математическими методами, возможность обучения нейронной сети по эталонным образцам, а также изменение топологии сети, исходя из требований решаемой задачи.Нейронная сеть - это система, состоящая из многих простых вычислительных элементов (нейронов), определённым образом связанных между собой. Наиболее распространёнными являются многослойные сети, в которых нейроны объединены в слои. Слой, в свою очередь, - это совокупность нейронов, на которые в каждый такт времени параллельно поступает информация от других нейронов сети, т. е. выходы нейронов соединяются с входами других нейронов, так сигнал от одного элемента передаётся другим. После того как определено количество слоёв и число элементов в каждом из них, сеть нужно обучить [7], т.е. определить значения для весов и порогов сети, которые минимизировали бы ошибку прогноза, выдаваемого сетью. Ошибка для конкретной конфигурации сети определяется путём прогона через сеть всех имеющихся наблюдений и сравнения реально выдаваемых выходных значений с желаемыми (целевыми) значениями. По сути процесс обучения представляет собой подгонку модели, которая реализуется сетью, к имеющимся обучающим данным.1. Моделирование экономических процессов с применением нейронных сетейПриступая к разработке нейросетевой модели, как правило, сталкиваются с проблемой выбора структуры нейронной сети. Задачи аппроксимации экспериментальных данных можно решать с помощью сетей следующих типов: многослойного персептрона, сетей с радиально-базисными функциями, обобщённо-регрессионных, линейных сетей [5, 8] и т.д., однако наличие разных типов сетей и алгоритмов их обучения для различных типов задач не гарантирует автоматически, что созданная сеть обеспечит требуемое качество модели.В предлагаемой работе рассматривается построение нейросетевой модели экономического процесса с применением радиально-базисной (radial basis neural network [5], RBNN) и каскадной (cascade-forward backpropagation neural network [5], CFNN) структур нейронных сетей. Эти сети были выбраны в результате сравнительного анализа качества полученных моделей с применением нейронных сетей различных структур, так как они наиболее просты и эффективны для аппроксимации данных.Для обучения нейронных сетей используют различные методы, в том числе алгоритм обратного распространения ошибки [5]. Функция ошибки, благодаря тому, что в нейронной сети используются нелинейные пороговые функции, представляет собой сложную «овражистую» поверхность с большим числом локальных минимумов. Для правильной настройки сети необходимо попасть в глобальный минимум. Существуют различные методы минимизации ошибки: «овражный» метод [5] (gradient descent with momentum, gdm); алгоритм Видроу - Хоффа (Widrow - Hoff, wh) [7]; метод сопряженного градиента (scaled conjugate gradient, scg) [5]; методы второго порядка (Quasi-Newton algorithms, bfg; Levenberg - Marquardt method, lm; one step secant, oss) [2]; метод смещений (conscience, con) [5].Одной из целей моделирования является выявление области топологий нейронной сети (подбор входных параметров, которые гарантируют получение модели наиболее высокой точности) непосредственно после первичного анализа графического представления исходных данных в зависимости от целей моделирования (т. е. будет ли процесс обработки РД завершен на этапе построенной модели, либо будет продолжен построением прогноза его будущего состояния).В предлагаемой работе область топологий используемых нейронных сетей, обеспечивающих требуемое качество моделей, выделена эмпирическим путем, когда рассматривается максимально возможное количество вариаций параметров сети с привязкой к определенному типу входных данных. Для радиально-базис-ной сети таким параметром является среднее допустимое отклонение начальных весовых коэффициентов о, а для CFNN - количество скрытых нейронов сети n1, количество эпох Е и метод минимизации ошибки.Для иллюстрации применения нейронных сетей при моделировании экономических процессов были взяты данные, отражающие состояние экономики России на 2006 год. Все выборочные данные представляют три основные группы: стационарные периодические (себестоимость произведённой продукции, тыс. руб., рис. 1), нестационарные непериодические (средневзвешенная доходность биржевых облигаций Томской области за 2006 г., % годовых, рис. 2) и нестационарные периодические (оборот розничной торговли, млрд руб., рис. 3).205 185 165 145 125 105 85Январь Июнь Декабрь Июнь Ноябрь Май Октябрь Апрель Октябрь Март2002 2002 2002 2003 2003 2004 2004 2005 2005 2006На рис. 1 - 3 представлены наилучшие результаты моделирования с использованием RBNN и CFNN в пакете Matlab. Точками изображены исходные данные, сплошной линией - аппроксимирующая функция.В качестве характеризующего фактора, определяющего степень предпочтительности той или иной нейронной сети, используем коэффициент детерминации [1]:R2 = 1 - Щ, ц = ±_!=1 2^2N-1X (zk - ц)k=1где z - исходная выборка объёма N; Z - оценка исходных данных объёма N.Результаты применения RBNNПолученные результаты приведены в табл. 1 и 2, где о - среднее допустимое отклонение начальных весовых коэффициентов, n1 - количество скрытых нейронов сети, m - метод минимизации ошибки.Радиально-базисная сеть справляется с задачей аппроксимации за незначительный временной промежуток (менее 5 с) и даёт коэффициент детерминации R2 (табл. 1), достаточный для того, чтобы называть результат хорошим. Максимальное приближение достигается также и CFNN, но за более длительный период времени (табл. 2).Сравнение построенных нейросетевых моделей по быстродействию для различных видов исходных данных имеет смысл проводить как на больших, так и на малых выборках, так как при кратном увеличении объемов РД происходит аналогичное увеличение по времени работы сети. Особенно явно данное свойство проявляется на непериодических нестационарных данных. При моделировании экономического процесса, представленного небольшим количеством исходных данных для завершения процесса с применением CFNN и радиально-базисной сети потребуется приблизительно равное время. Но при кратном увеличении объема данных время, затрачиваемое на построение модели с применением CFNN будет измеряться уже не в минутах, а стремиться к часу и более, в отличие от RBNN. Поэтому при большом объеме выборки для построения модели непериодического нестационарного экономического процесса предпочтительнее использовать ради-ально-базисную нейронную сеть. Качество моделирования при правильном выборе регулирующего параметра не ухудшится, а время сократится в разы.2. Прогнозирование поведения экономических процессов с применением нейронных сетейПосле проведения процедуры моделирования экономического процесса возможна его дальнейшая обработка, а именно построение прогнозной модели. Цель остается прежней: выбор области топологий нейронной сети для различных видов данных.Характеризующими факторами, определяющими степень предпочтительности того или иного метода для определённого вида данных, являются коэффициент детерминации R2 (1) и средняя ошибка аппроксимации на прогнозируемом участке [1]:1 N1Y =х XN1 - k г=Г+1(2)где z - оценка, построенная по соответствующему методу.Будем говорить о высокой точности прогноза, если у < 0,1, о хорошей точности, если 0,1 < у < 0,2, удовлетворительной точности, если 0,2 < у < 0,5, о неудовлетворительной точности, если у > 0,5.Для решения задачи прогнозирования применим метод проекции временного ряда. С помощью обученной нейронной сети можно решить задачу прогнозирования следующим образом. Предположим, что необходимо построить прогноз рыночной цены на определенный вид продукции. Количество построенных прогноз-ньгх значений называется горизонтом прогнозирования и обозначается символом q. Общий объем ряда динамики обозначается символом N. Выполним так называемую проекцию временного ряда. Вначале сеть обучается на выделенных примерах объема (N - q) с применением области топологий нейронной сети для построения оценочной модели. Затем выдается прогноз следующего значения ряда динамики (возможна смена метода минимизации ошибки), после чего полученный результат вместе с предыдущей обучающей выборкой снова подается на вход сети. Выдается очередное прогнозное значение. Такую проекцию можно повторять произвольное число раз, хотя в дальнейшем качество прогноза будет ухудшаться.При прогнозировании экономического процесса по методу проекции временного ряда в качестве обученной нейросети использовалась сеть, полученная с применением параметров из области топологий построения качественной модели экономического процесса с применением нейронных сетей на данных определенного типа. Возможность смены топологии сети в процессе обучения является характерным признаком любой нейронной сети. Модификация сети достигается для радиально-базисной сети сменой параметра сигма, а для каскадной нейронной сети - заменой метода минимизации ошибки. При определении области топологий нейронных сетей для построения прогнозных моделей производится анализ не только качества прогноза, но и его адекватности по коэффициенту детерминации (1) и средней ошибки аппроксимации (2) соответственно. Такие показатели, как R2 и у, являются равными по значимости, но разными по методу конечной оценки результата. Поэтому их необходимо использовать в комплексе, а общий вывод формировать по тому показателю, который демонстрирует худший результат. Кроме того, стоит учитывать тот факт, что средняя ошибка аппроксимации на прогнозируемом участке q может зависеть от величины разброса исходных данных и давать при этом не слишком высокую оценку прогнозам, не отображая при этом действительность.В нашем случае горизонт прогнозирования используется в двух вариантах: q = 3 и q = 10 . По результатам применения метода проекции временного рядадля каждого взятого экономического процесса была вычислена величина у (2), которая характеризует точность полученного прогноза, и значение коэффициента детерминации (1) для всей модели, включая прогноз.На рис. 4 - 6 представлены результаты построения прогнозирующих нейросе-тевых моделей. Точками изображены исходные данные, сплошной линией - аппроксимирующая функция. Прогноз выделен более светлым оттенком.Ноябрь 2003Февраль Май Август Декабрь Март Июнь Октябрь Январь2004 2004 2004 2004 2005 2005 2005 2006Ноябрь2003Февраль Май Август Декабрь Март Июнь Октябрь Январь2004 2004 2004 2004 2005 2005 2005 20061614 12108Февраль Май Август Декабрь Март Июнь Октябрь Январь2004 2004 2004 2004 2005 2005 2005 20066Ноябрь2003205 185 165 145 125 105 85Январь Июнь Декабрь Июнь Ноябрь Май Октябрь Апрель Октябрь Март 2002 2002 2002 2003 2003 2004 2004 2005 2005 2006205 185 165 145 125 10585Январь Июнь Декабрь Июнь Ноябрь Май Октябрь Апрель Октябрь Март2002 2002 2002 2003 2003 2004 2004 2005 2005 2006 205 185 165 145 125 105Декабрь Июнь Ноябрь Май Октябрь Апрель Октябрь Март 2002 2003 2003 2004 2004 2005 2005 200685Январь Июнь2002 2002 205 185 165 145 125 10585Январь Июнь2002 2002ЗаключениеВ табл. 3 и 4 приведены значения коэффициента детерминации R, вычисленного по формуле (1), у - по формуле (2), Т - времени работы модели в секундах, где m - метод минимизации ошибки.На основании данных таблиц можно сделать вывод, что в большинстве случаев радиально-базисная сеть справляется с задачей прогнозирования за более длительный временной промежуток, чем каскадная сеть. Прогноз, построенный с применением CFNN, является более адекватным и качественным, что видно по величине у, даже если при этом коэффициент детерминации R2 радиально-базисной сети незначительно превышает аналогичный показатель каскадной сети(табл. 3, 4).Таким образом, видно, что применение CFNN для построения прогнозирующей модели экономического процесса более обоснованно. При этом недостатком данного алгоритма можно считать сильную зависимость результатов для конкретного экономического процесса от выбранного метода обучения сети.Сравнительный анализ результатов моделирования для конкретных числовых примеров подтверждает применимость нейронных сетей и высокое качество аппроксимации РД и прогнозирования поведения экономической системы. Использование нейросетевых моделей хозяйствующими субъектами может обеспечить получение значительного экономического эффекта, так как позволяет быстро и надёжно заблаговременно просчитать возможное развитие событий.
Мкртчян С.О. Нейроны и нейронные сети. М.: Энергия, 1971. 230 с.
Новиков В.А., Калацкая Л.В., Садов В.С. Организация и обучение искусственных нейронных сетей: Экспериментальное учеб. пособие. Минск: Изд-во БГУ, 2003. 72 с.
Тютерев В.В., Новосельцев В.Б. Теория нейронных сетей: Учебное пособие. Томск: Изд-во Том. ун-та, 2001. 69 с.
Галушкин А.И. Теория нейронных сетей. Кн.1: Учебное пособие для вузов. М.: Издательское предприятие редакции журнала «Радиотехника», 2000. 415 с.
Алберт А. Регрессия, псевдоинверсия и рекуррентное оценивание. М.: Наука, 1997. 223 с.
Браммер К.,Зиффлинг Г. Фильтр Калмана Бьюси. М.: Наука, 1982. 199 с.
Статистика: Учебник / Под ред. проф. И.И. Елисеевой. М.: Финансы и статистика, 2002. 479 с.
Кендэл М. Временные ряды. М.: Финансы и статистика, 1981. 198 с.