НЕЙРОСЕТЕВЫЕ И ГЕНЕТИЧЕСКИЕ МОДЕЛИ И МЕТОДЫ АНАЛИЗА ДАННЫХ

Георгий И. Францкевич, Алексей А. Букарев,
Валерий П. Костюк,

Саратов, СГТУ

e-mail bull_q@inbox.ru

В работе описываются подходы к разработке методологических и инструментальных средств анализа статистической информации о работе производственного предприятия для поддержки принятия решений в управлении объектами на основе нейронных сетей и генетических алгоритмов.

1. Введение

В настоящее время для различных отечественных предприятий наиболее актуальной является проблема выживания и развития в условиях рыночной экономики. В процессе деятельности каждого предприятия появляется достаточно большое количество статистических данных, отражающих предысторию и состояние предприятия на текущий момент. В большинстве своем эти данные по различным причинам либо не используется, либо используется не в полном объеме. Для анализа таких данных существует достаточное количество инструментальных средств, но большинство из них обладает рядом недостатков. Некоторые из них привязаны к конкретной бухгалтерской программе, другие – ориентированы на западную экономику, третьи – претендуют на универсальность, тем самым ограничивая свои возможности. Реально и наиболее полно анализировать данные о работе предприятия возможно только инструментарием, разработанным с учетом конкретной специфики функционирования объекта. Описанию такой системы и посвящена данная статья.

2. Описание целей разработок

Целью разработки явились выбор, и, при необходимости, модификация и создание моделей и методов для исследования финансовой деятельности предприятия и оптимизации параметров этой деятельности для повышения его рентабельности.

Цель построения математической модели предприятия заключается в анализе функционирования предприятия и построении такой математической модели, посредством которой можно было бы производить оптимизационный прогноз. Под оптимизационным прогнозом в данном случае понимается выработка управленческих решений на стадии прогнозирования. Цель этого этапа разработки заключается в нахождении управленческих решений на каждом шагу прогноза и учет изменений, связанных принятием этих решений в дальнейшем прогнозе. Тем самым две необходимые стадии – прогнозирования и оптимизации объединяются в одну, позволяя настраивать Объект как - бы «изнутри», сокращая количество необходимых для достижения результата машинного времени и вычислительных мощностей.


 

2. Описание поставленных задач

В качестве поставленной задачи было получение и оптимизация функции выработки управленческих решений на производственном предприятии.

                                                             (1)

где R   -           функция генерации управленческих решений,

Q  -           данные о работе предприятия,

Q -           алгоритмы предобработки данных о работе предприятия,

O -           алгоритмы анализа предобработанных данных,

T   -           временной диапазон, на котором производится анализ,

T -           временной диапазон, для которого генерируются управленческие решения.

Нахождение оптимума функции, как и построение самой функции возможно лишь при выполнении условия, что данные о работе предприятия Q существуют на временном диапазоне, на котором производится анализ T.

Эта функция имеет следующую структуру:

a) Оптимизация использования сырья Vs

1)        Объем используемого сухого цельного молока – летом – никакой, зимой – минимальный;

2)        Объем используемого сухого обезжиренного молока – летом – никакой, зимой – минимальный;

3)        Объем используемого натурального цельного молока – летом – полный, зимой – максимальный;

b) Оптимизация производства продукции Vp

1)        Объем производства оптимизируется в соответствии с прогнозом о его реализуемости;

2)        Если себестоимость ниже цены реализации – цена оптимизируется;

3)        Если себестоимость выше цены реализации – производится попытка оптимизировать использование сырья, заменяя его более дешевым, в случае невозможности - цена увеличивается, а объем производства сокращается.

c) Оптимизация по сбыту продукции клиентам Vk

1)        Объемы отпуска продукции каждому конкретному клиенту оптимизируются на основе статистки об их платежеспособности и заказываемых объемах продукции, а также имеющейся на складе продукции.

Существует принципиальное различие в подходах к оптимизации в пунктах b) и c): в первом случае оптимизируется объем выпускаемой продукции с целью ее дальнейшей максимальной реализации, а во втором – объем отпускаемой продукции с целью получения максимальной прибыли, причем желательно в кратчайшие сроки.

 

Итак, для выполнения задачи были поставлены следующие подзадачи:

a)                  подзадача предобработки входной информации об объекте – нахождение функции f1 для преобразования исходных данных (2.0) к виду, доступному для анализа:                                                                                                                                                                                                                                                   (1a);

b)                  подзадача создания математической модели функционирования объекта на основе имеющейся статистики – нахождение функции M, описывающей поведение объекта на основе имеющейся предобработанной статистики:                                                                                                            (1b)                                                                                                                        Эта подзадача разбивается на следующие подподзадачи:

1)      выбор степени и элементов детализации создаваемой модели (Элементов);

2)      выбор принципиальной структуры создаваемой модели(S);

3)      создание математических моделей выбранных Элементов детализации Объекта(Mi, iÎ[1:I], где I – общее количество Элементов детализации);

4)      связывание созданных математических моделей элементов в единую модель M;

c)                  подзадача прогноза функционирования Объекта на основе исследования его созданной модели с достаточной степенью достоверности                                                                 (1c)                                                                                                                   Эта подзадача разбивается на следующие подподзадачи:

1)      выбор принципиального способа осуществления прогноза;

2)      прогноз функционирования каждого элемента Объекта Mi=Mi(Mi);

3)      связывание прогнозов функционирования элементов в единый прогноз функционирования Объекта M;

d)                  подзадача оптимизации параметров функционирования Объекта на основе имеющейся статистики, созданной математической модели и осуществленного прогноза – анализ прогнозируемой деятельности с целью ее оптимизации                                                                                      (1d)                                                                                                                  Эта подзадача разбивается на следующие подподзадачи:

1)      выбор принципиального способа осуществления оптимизации;

2)      определение настраиваемых параметров оптимизации и их допустимых значений;

3)      построение целевой функции оптимизации;

4)      непосредственное проведение оптимизации M’’ с учетом всех параметров, построенного прогноза M, а также условий Vs, Vp, Vk, изложенных в пунктах a)-c) части 2 настоящей статьи;

e)                  подзадача осуществления помощи в принятии управленческих решений на основе осуществленных прогноза и оптимизации – создание функции f2, представляющей предлагаемую оптимизацию на естественном языке                                                                                                              (1e)                                                                                                                  Эта подзадача разбивается на следующие подподзадачи:

1)      создание алгоритма перевода оптимизационных действий в описание управленческих решений на естественном языке;

2)      ввод и учет набора условий и приоритетов, связанных со сложившейся спецификой взаимодействия Объекта с окружающей средой; фактически эта система условий и приоритетов является описанием воздействия окружающей среды на Объект.

3)      встраивание созданного алгоритма в процесс оптимизации

В результате проведенной декомпозиции поставленную задачу достижения цели можно представить в следующем виде:

                                            (2)

2. Описание анализируемого объекта

В качестве Объекта было выбрано производственное предприятие, занимающееся также и реализацией своей продукции. В качестве данных, описывающих производственную и торговую деятельность предприятия, была выбрана статистика по поставкам сырья, выработке и реализации продукции. Эту статистику можно представить в приведенном ниже виде.

Множество операций по приходу сырья, проводимых объектом за период  :

                                              (3)

здесь:

i     -           порядковый номер операции в БД.

n    -           идентификатор операции

t     -           время начала проведения операции

s    -           денежный эквивалент операции, 

k    -           конкретный поставщик из множества поставщиков K1

 

Множество операций по производству продукции, проводимых объектом за период

            (4)

здесь:

k    -           конкретный цех из множества цехов K2

k   -           конкретный вид продукции из производимых в цеху K2

 

Множество операций по заказам на отпуск продукции, проводимых поставщиками за период

                       (5)

здесь:

s    - денежный эквивалент операции,

s   - количественный эквивалент операции

k    - конкретный заказчик из множества заказчиков K3

Множество операций по фактической отгрузке, проводимых организацией за период

                      (6)

Множество операций по фактической оплате, проводимых поставщиками за период

                     (7)

К ним прилагаются соответствующие справочники по продукции, сырью, клиентам, рецептам изготовления продукции из сырья, ценам и т.п.

3. Методы, алгоритмы и процедуры решения задачи

Для решения поставленных задач использовались нейросетевые модели и генетические алгоритмы.

3.1. Применение нейронных сетей

Нейронные сети используются для решения задачи 1a.

Полносвязные нейронные сети с обучением без учителя используются для кластеризации входной информации для представления их в виде, удобном для обучения персептрона. Фактически они используются для исследования альтернативного представления входной информации. Преобразование производится при помощи описанного ниже алгоритма.

Подпись:  
Рис. 1. Архивация данных для использования в ИНС.

График движения денежных средств понедельно обрабатывается следующим образом:

После построения графика проводится сравнение значений на графике с линиями уровней, расположенных на одинаковом расстоянии. В случае, если точка на графике ниже линии уровня, то соответствующий бит в числе принимает значение ноль, в противном случае – единица. Добавляя к этим числам минимальное, максимальное и среднее значение на графике, мы настолько полно представляем его внешний вид, что этого достаточно для прогноза. При этом мы анализируем не набор чисел графика, а его внешний вид, закодированный описанным выше способом. При больших числах графика мы также производим архивацию входной информации, что в добавление к качественно новому способу представления информации ускоряет процесс ее обработки.

Данная информация используется для обучения ИНС в качестве описателя соответствующих Элементов Объекта.

Полносвязная нейронная сеть представляется следующим образом:

                                                                    (8)

Связи нейронов:

                                                  (9)

Где:

L                    веса связей в нейронной сети,

lik         -           k-й вес связи i-го нейрона,

I           -           количество нейронов,

K         -           количество входов каждого нейрона.

 

Обучающая выборка:

                                               (10)

Где:

vrk  -           k-й компонент r-го входного вектора,

R   -           объем обучающей выборки

K   -           количество компонент каждого обучающего вектора.

Правила обучения G описываются следующим образом:

Требуется таким образом настроить веса связей сети L, чтобы для каждого из обучающих векторов vr нашелся один и только один нейрон li, такой, что расстояние между векторами vr и li было бы минимальным:

 

                                    (11)

 

Для адаптированной работы полносвязной сети используется эмпирически выведенная формула подстройки скорости обучения:

            (12)

 

Где

E(t) и E(t+1)     -           значение шага обучения в момент времени t и t+1 соответственно

V1          - главный коэффициент изменения A

Tk           - номер текущего шага обучения

V2          - коэффициент приведения Tk

dErr - разница между текущим значением ошибки и его сохраненным наилучшим значением

V3          - коэффициент приведения при dErr

D           - количество модифицируемых нейронов за один шаг подстройки весов

V4               - коэффициент приведения при D

Sik          - количество подстроечных изменений нейрона i на шаге обучения Tk

V5          - коэффициент приведения при Sik.

 

В данной работе предлагается и изменение формулы подстройки весов при обучении ИНС. После модификации она выглядит следующим образом:

 

                           (13)

 

Где

lik(t) и lik(t+1) - значение k-го веса связи i-го нейрона в момент времени t и t+1 соответственно

E(t)  - значение шага обучения в момент времени t.

vrk         - k-й компонент обучающего вектора r, который расположен наиболее близко к вектору связей нейрона li.

                                                             (14)

zk         - коэффициент значимости при k-м параметре входного вектора vr.

Набор коэффициентов Z устанавливает приоритеты параметров для более точной адаптивной настройки сети.

При помощи персептрона строится первичная модель функционирования предприятия, необходимая, во-первых, для грубой и более быстрой оценки деятельности (задачи 1b и 1c), и, во-вторых, для первичной и наиболее доступной проверки функционирования ГА (задачи 1d и 1e), формализованного и описанного ниже.

Персептрон для каждого Элемента n представляется следующим образом:

                                              (15)

Где N - количество Элементов.

Связи нейронов:

                     (16)

Где

Ln - персептрон для моделирования Элемента n,

liksn            - k-й вес связи i-го нейрона в слое s,

S               - количество слоев перцептрона,

Is               - количество нейронов в слое s.

Обучающая выборка:

                                 (17)

Где

vrkn - значение k-го компонента вектора, описывающего Элемент n в момент времени t,

T1:T2        - исследуемый временной период.

Выходные слои персептронов:

                                               (18)

Где

O - выходной вектор персептрона

oi               - i-я компонента выходного вектора,

IS              - количество нейронов в выходном слое.

Правила обучения G представляются так:

Требуется таким образом настроить значения весов связей Ln, чтобы в ответ на подаваемый на вход персептрона обучающий вектор Vtn ответ сети On был бы равен Vt+1n:

                                                  (19)

Для адаптированной работы персептрона используется модификация формулы 12:

                           (20)

Эта модификация связана с тем, что параметры D и Sik при обучении персептрона не используется.

Описанные усовершенствования оптимизируют процесс обучения ИНС и адаптируют его под поставленную задачу анализа финансовой деятельности предприятия.

Общий алгоритм функционирования ИНС:

1.  на вход сети подается обучающий вектор;

2.  производится подстройка весов в соответствии с этим вектором (в персептроне учитывается и желаемый выход сети – состояние Элемента в момент времени t+1);

3.  шаги 1)-2) повторяются для всей обучающей выборки;

4.  шаги 1)-3) повторяются несколько раз.

Применение ИНС позволяет классифицировать Элементы моделируемого Объекта и произвести первичный прогноз его функционирования.

3.2. Применение генетических алгоритмов

Генетические алгоритмы используются для решения задач 1d и 1e.

3.2.1. Общие подходы к формированию ГА

Прежде всего, предлагается не производить сокращения популяций, сохраняя все получающиеся индивиды, по мере прохождения циклов эволюции выделяя и отслеживая в общей массе индивиды, наиболее полно обладающие признаками исследуемого реального объекта. Здесь подразумевается, что объекты имеют набор признаков двух типов:

-         статичных признаков, возможно имеющих минимум степеней свободы, и

-         динамичных признаков, имеющих гораздо больше степеней свободы.

Первые признаки служат выделения объекта из массы ему подобных, а вторые – позволяют оценить его текущее состояние.

Для того, чтобы сделать такую интерпретацию ГА максимально правомерной, необходимо ввести и формализовать правила, существующие в реальной биологической генетике.

Прежде всего введем более точную с биологической точки зрения терминологию. Под ГЕНОМ будем понимать какой-либо участок определяющей битовой последовательности, который может состоять как из одного, так и из нескольких бит. Под ИНДИВИДОМ будем понимать набор последовательно расположенных ген. Некоторые гены задаются доминантными, т.е. первично проявляющимися, а некоторые – рецессивными, т.е. при создании новых объектов подавляющимися доминантными генами. Задается числовой уровень доминантности и рецессивности для случаев встречи двух ген одного класса. Классы ген создаются двух типов: статичные и динамичные. Статичные задаются в самом начале как направление поиска решения, а динамичные – в процессе эволюции на основе описанных ниже принципов, причем последние различаются для диапазонов значений ген. Также каждый конкретный индивид имеет свою личную принадлежность к классу доминанты или рецессива. Назовем такую характеристику личностной.

Также значение функции оценки будем называть жизненной силой индивида, или просто его силой.

Очевидно, что желательные свойства объектов задаются принадлежностью к доминантныму, а нежелательные – к рецессивному классу.

3.2.2. Математическая модель ГА

Генетический алгоритм:

                                                         (21)

состоит из следующих элементов и связей между ними:

Популяция:

                                                                     (22)

где:

gti                     -           i-й индивид вмомент времени t;

T1:T2    -           рассматриваемый временной диапазон;

It                      -           размер популяции в момент времени t.

 

                                                                                  (23)

где: gtip                  -           ген типа p в I-м индивиде в момент времени t.

Статистика:

                                                                    (24)

где:

gti       - состояние i’-го элемента согласно статистике в момент времени t;

I           - количество элементов.

Данные предварительного прогноза, осуществленного при помощи персептрона:

                                                                    (25)

где:

gti’’ - состояние i’-го Элемента согласно обученному персептрону в момент времени t;

Данные для нахождения элементов в популяции:

                                          (26)

где:

gti’’’ - предполагаемое состояние i’-го элемента в момент времени t, находится как среднее состояние объекта между статистическим и состоянием согласно обученному персептрону

Набор возможных одноместных операций над элементами множества G:

                                                                              (27)

Набор возможных двуместных операций над элементами множества G:

                                                                (28)

Последовательность вызова операций над элементами популяции из множеств O1 и O2 на каждом шаге эволюции:

                                                                           (29)

Критерий сходимости ГА определяется как необходимость того, чтобы в каждый момент времени t для каждого элемента gti’ нашелся один или несколько индивидов gti:

                           (30)

Обязательными условиями нормального функционирования ГА является оптимальное формирование множества O, и то, что имеется статистика функционирования элементов объекта на период T’, частично или полностью перекрывающий исследуемый период снизу:

Opt(O)                                                                                                       (31)

                                                             (32)

Теперь рассмотрим операции входящие в множества O1  и O2.

3.2.2. Генетические операции

В данном случае использовались две двуместные операции: скрещивание и кроссовер; и одна одномесная - операция мутации. Рассмотрим их подробнее:

Операция скрещивания

В данном случае решение описывается гаплоидным набором, состоящим из одной хромосомы. Для каждого гена в хромосоме введем значение его доминантности. Данное значение имеет смысл вероятности того, что ген перейдет к потомку. Обозначим это значение как di - где i номер гена в хромосоме. Так как di - вероятность, то 0 £ di £ 1. Будем хранить каждое значение di­ как отношение целых чисел Di/Ci, где Di - сколько раз при переходе в потомка данного значения гена, оценочная функция потомка не уменьшалась, Ci - количество произведенных скрещиваний.

Опишем операцию скрещивания. Пусть для скрещивания выбраны две хромосомы Hm и Ho, состоящие из N генов:

                                                                         (33)

                                                                           (34)

Результатом скрещивания является хромосома потомок Hn.

Перед скрещиванием для каждого гена в родительских хромосомах производится рассчет коэффициентов доминантности по следующим формулам:

                                                                                (35)

                                                                                (36)

Пересчет необходим для того, чтобы d'mi+ d'oi равнялось 1.

Тогда результатом функции скрещивания будет хромосома следующего вида:

                                                                           (37)

где

                                                                       (38)

                                                      (39)

                                                                             (40)

Затем изменяем  Di и Ci у хромосом родителей:

                                            (41)

                                                                                   (42)

Данный метод позволяет учитывать историю предыдущих скрещиваний , но в тоже время учитывается предыстория не всей популяции, а только ее отдельной ветви. Это позволяет уменьшить вероятность "зависания" всей популяции в одном локальном минимуме.

В дополнении к этому можно рассчитывать вероятность перехода не для отдельного гена, а для групп генов. В этом случае перед скрещиванием выделяются непрерывные последовательности генов, такие что для каждого элемента группы выполняется условие, что значение доминантности больше значения доминантности соответствующего гена из второй хромосомы. Затем вероятность перехода рассчитывается для всей группы и в потомка переходит либо от отца, либо от матери  вся группа полностью.

Операция кроссовера

Под операцией кроссовера в данном случае понимается такая двуместная операция, при выполнении которой новые хромосомы не порождаются, а происходит лишь изменение родительских хромосом.

Пусть выбраны две хромосомы Hm и Ho, результатом операции кроссовера будут две хромосомы H'm и H'o, которые заместят в популяции исходные хромосомы.

При операции кроссовера вначале генерируется случайное число K, принимающее значения от 1 до N с равной вероятностью. Затем левые части хромосом Hm и Ho  до K-го элемента включительно переносятся в хромосомы H'm и H'o соответственно. После этого правые части хромосом Hm и Ho  с K+1-го элемента переносятся в хромосомы H'o и H'm соответственно. При копировании генов также копируются и коэффициенты C и D.

Операция мутации

Операция мутации заключается в инверсии произвольного гена в хромосоме. За одну операцию мутации изменяется только 1 ген, мутировавшая хромосома заменяет в популяции место исходной.

Пусть H - исходная хромосома, H' - мутировавшая хромосома, k - номер мутировавшего гена, тогда:

         (43)

Остальные элементы в хромосоме не изменяются.

 

3.2.3. Правила отбора

Теперь необходимо разобраться с правилами выбора индивидов для каждого конкретного скрещивания. Для этого, во-первых, необходимо осуществлять сортировку популяции на стадии эволюционных процессов (скрещивание, мутация, кроссовер). Т.е. организуется популяция, состоящая из неотсортированной и отсортированной частей. Каждый раз после создания нового ин-дивида для него вычисляется значение функции оценки. Это значение становится неотъемлемым атрибутом индивида. На основании вычисленного значения он и помещается в соответствующее место в отсортированной части популяции.

Также ведется независимая статистика случаев, когда от родителей с одним уровнем значения оценочной функции (например, низким) получаются потомки с другим уровнем этой функции (например, высоким). Статистика ведется не для индивидов целиком, а для каждого типа ген отдельно. Для выбранного примера по достижению какого-то уровня статистики (например, в 80% случаев) благоприятный ген изменяет свой уровень: если он был рецессивным, он становится доминантным с минимальным уровнем, а если был доминантным, то повышает свой уровень доминантности. Аналогично изменяется собственный класс индивида, но при каждом скрещивании, причем не на целую единицу, а на несколько ее малых доль, пропорционально вкладу в улучшение популяции. В данном случае величина этой доли может играть роль жизненной силы популяции. В процессе эволюции жизненная сила популяции уменьшается, чтобы стабилизировать внутренние процессы. Также эта величина может повышаться в зависимости от определенных статистических событий эволюции. Задание таких событий возможно только в результате тщательного изучения конкретного моделируемого объекта на практике.

При вычислении функции оценки для каждого индивида учитываются не только сами гены, но и их классы. Таким образом, при изменении на основе ведущейся статистики динамического класса гена, меняется и значение его функции значимости.

Теперь необходимо определиться с возможностью обеспечения преобладания более сильных индивидов в популяции. Это можно реализовать при помощи функции распределения случайных величин для выбора индексов индивидов из популяции. Мыпредлагем использовать динамическую функцию распределения, изменяющуюся по мере развития эволюции:

F=F(s, n, k, m),                                                                                           (44)

где:

s           -   номер текущего шага эволюции

n          -   размер популяции

k          - текущий номер индекса, по которому производится раздел массива популяции на неотсортированную и отсортированную части

m         - текущее максимальное значение силы индивида, вычисленное для находящихся в отсортированной части популяции индивидов.

Вид предложенной функция распределения на разных стадиях эволюции представлен на рис. 2-4.

 

 

 

 

 

 

 

 


Рис 2.

 

 

 

 

 

 

 

 


Рис 3.

 

 

 

 

 

 

 

 


Рис 4.

 

Теперь, после того, как мы определились с функциями распределения вероятностей выбора индивидов для скрещивания, необходимо заметить, что для выбора индивидов для операций мутации необходимо использовать функцию нормального распределения с минимальным перепадом значений (рис. 5):

F=F(n, q),                                                                                                   (45)

 

 

 

 

 

 

 


Рис. 5.

где q - центр нормального распределения. На данный момент предполагается использовать q=n/2:

Для кроссовера необходимо использовать такую функцию распределения вероятностей, при которой вероятность кроссовера первого выбранного для операции индивида с любым другим была бы обратно пропорциональна расстоянию между ними. В данном случае наиболее оптимальным представляется использование экспоненциальной зависимости.

Сама вероятность наступления события как мутации, так и кроссовера достаточно мала.

При выборе второй хромосомы для операций скрещивания и кроссовера учитывается следующий фактор.

Пусть fh(H1,H2) - функция вычисляющая Хеммингово расстояние между бинарными векторами хромосом.

Рассмотрим ситуацию fh(H1,H2)<2, в этом случае после скрещивания мы не получим новых хромосом, т.к. потомок будет тождественнен одному из родителей. С другой стороны при fh(H1,H2)=N (N - длина хромосомы) результат скрещивания аналогичен простой генерации случайной хромосомы.

Поэтому второй экземпляр для скрещивания выбирается по следующей схеме:

Выбираем, описанным выше способом вторую хромосому, а также L ее соседей (где L - параметр алгоритма). Затем из L+1 хромосом выбираем такую, хеммингово расстояние до которой, от первой выбранной хромосомы, было бы максимальным. При этом оно не должно быть меньшим 2 и большим hlim. Если не найдена ни одна хромосома удовлетворяющая вышеперечисленным условиям, то скрещивание не производится.

hlim на первом шаге устанавливается равным N, затем каждые F шагов уменьшается на 1, пока не станет равным 2. (F - параметр алгоритма).

По окончанию каждого жизненного цикла производится анализ сложившейся ситуации, классифицируются индивиды в классы на основе статичных признаков модели. Каждый такой класс соответствует одному объекту из начальной популяции. Оттуда удаляются наименее вероятные в реальной жизни индивиды. По мере возможности оставляется только один индивид. Если существует сразу несколько вероятных к существованию индивидов, то самый близкий к действительности индивид выбирается как исследуемый объект, и на нем исследуются свойства видоизмененного индивида (как вариант - несколько индивидов характеризуют видоизменение одного изначального индивида по разным параметрам). Оставшиеся в классе незадействованные индивиды регистрируются как новые индивиды (опять-таки из каждого или из группы), на следующих этапах эволюции служащих для формирования самостоятельных классов. Использование одного или нескольких индивидов для изучения и создания моделей реальных жизненных объектов определяется в зависимости от изучения фактических условий моделируемой действительности.

3.2.3. Общий алгоритм функционирования ГА

Нулевой этап, предварительный:

Данный этап является необязательным. На нем производится предварительный анализ статистики, если таковая имеется. Динамические показатели классов приравниваются к статическим и производится первичный ход эволюции, на котором формируется база данных по значениям динамических параметров классов для более реального исследования поведения индивидов на начальных этапах. Фактически для многих реальных объектов такую базу можно заполнить на основе статистических исследований без запуска эволюционных процессов с использованием ГА.

Первый этап:

Создается начальная популяция индивидов. Это делается либо случайным образом, либо на основе накопленной статистики, либо по результатам предыдущего этапа, если тот был осуществлен. Сразу вычисляются и сохраняются значения жизненной силы индивидов.

Второй этап:

Случайным образом производится разделение популяции на несколько приблизительно равных по объему подпопуляций. Некоторым частям присваивается женский тип, некоторым - мужской. Внутри каждой подпопуляции производятся операции мутации и кроссовера. Получающиеся в результате этих операций индивиды помещаются в отсортированную часть подпопуляции.

Третий этап:

В каждой подпопуляции производится выбор одного индивида с использованием описанной выше функции распределения вероятностей для скрещивания. Из всех представителей как женских, так и мужских групп побеждает только по одному представителю. Соревнование ведется как по жизненной силе, так и конкретно по личностной характеристике конкретного индивида. Полученная пара производит скрещивание, причем их потомок получает личностную характеристику, равную среднему арифметическому личностных характеристик своих родителей, плюс малая случайная величина со знаком, распределенная по нормальному закону с центром в точке «0». Родители по-мещаются в отсортированную, а получившийся индивид - в неотсортированную часть результирующей популяции. Такое разделение связано с тем, что заработавшие право на скрещивание в конкурентной борьбе родители признаются достойными занять свое место в популяции, в то время как их потомки должны еще заработать это право. Возможно также введение весьма малой величины вероятности события появления более одного потомка в результате скрещивания, в том числе и почти идентичных копий, имеющих только различные личностные характеристики. Если в результате скрещивания создается индивид с жизненной силой меньше какого либо конкретного порогового значения, то он не попадает в результирующую популяцию - не выживает. Данный этап повторяется до тех пор, пока количество индивидов в подпопуляциях не достигнет порогового, минимального значения (в пределе нуля). Закончившиеся популяции выбывают из процесса выбора конкурирующих индивидов.

Четвертый этап:

Полученная результирующая популяция является законченным этапом эволюции. На ней производится классификация, анализ и отсев имеющихся индивидов. Также формируются выводы о новых состояниях изучаемых объектов, дополняется статистика об их поведении и эволюции (задача 1d). Затем в случае необходимости производится переход ко второму этапу. В качестве критериев этого перехода используется фактор достижения определенным количеством объектов конкретных состояний. Статистика о промежуточных состояниях объектов, формируемая на естественном языке (задача 1e), служит в качестве набора управленческих инструкций для достижения реальных задаваемых целей.

4. Практическое использование

В результате проведенных исследований обучения ИНС из 36 нейронов экспериментальным путем были установлены значения параметров V1, V2, V3, V4, V5. Для обеих формул V1 приняло значение 0.7, V2 – 0.0001, а V3 – 0.01,V4 – 0.001, а V5 – 0.05. При использовании от 5 до 7 линий уровней (рис.1) ИНС предсказывает значения с точностью ±0,05 в более чем 80% случаев.

5. Заключение

В данной статье предложено усовершенствование существующих методов обучения нейронных сетей, а также принципиально новая технология использования генетических алгоритмов, позволяющая строить математическую модель объекта и прогнозировать его функционирование. В качестве локальных решений конкретных подзадач предлагаются неописанные ранее способы представления статистических данных.

Разработанные методы анализа и способы представления данных позволяют создать достаточно полную модель производственного предприятия на основе статистических данных. Созданные технологии помогают выявлять в анализируемых данных неявные закономерности, не выявляемые классическими методами, а усовершенствование существующих моделей ускоряет процесс анализа данных и делает локализацию искомого решения более точной. Все это позволяет проводить анализ складывающейся ситуации и помогает принимать правильные управленческие решения для получения большей прибыли и оптимальной работы с партнерами.

Литература

1.         Францкевич Г.И., Костюк В.П. Разработка экспертной системы для анализа и прогноза финансовой деятельности предприятий.// Математическое и программное обеспечение вычислительных систем. Межвузовский сборник научных трудов, М.-1998 г. с. 111-115

2.         Францкевич Г.И., Новиков А.Н., Костюк В.П. Модели и методы принятия, поддержки и реализации решений в управлении финансовыми процессами на основе нейросетевых технологий. // Математическое и программное обеспечение вычислительных систем. Межвузовский сборник научных трудов, Рязань.-1999 г. с. 64-68

3.         Г. И. Францкевич, В. П. Костюк РАЗРАБОТКА И АДАПТАЦИЯ НЕЙРОСЕТЕВОЙ МОДЕЛИ ДЛЯ АНАЛИЗА И УПРАВЛЕНИЯ ФИНАНСОВОЙ ДЕЯТЕЛЬНОСТЬЮ ПРЕДПРИЯТИЯ// Математическое и программное обеспечение вычислительных систем. Межвузовский сборник научных трудов, Рязань.-2000 г. с. 48-52

4.         Таунсенд К., Фохт Д. Проектирование и программная реализация экспертных систем на персональных ЭВМ: Пер с англ. – М.: Финансы и статистика, 1990. – 320 с. ил.

5.         Naylor C. Build your own expert system. John Wiley&Sons Ltd., Chichester, 1987

(C) 2001 Георгий И. Францкевич, Алексей А. Букарев, Валерий П. Костюк


Страницы...
Предыдущая публикация 
Начальная 
Оглавление публикаций 
Следующая публикация 

Дата последнего изменения страницы: 16.07.01