авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ

Pages:   || 2 | 3 |
-- [ Страница 1 ] --

Челябинский государственный педагогический университет

На правах рукописи

Иванов Сергей Александрович

Устойчивость

дискретных моделей стандартных

конфигураций нейронных сетей

с запаздывающими взаимодействиями

05.13.18 – Математическое моделирование, численные методы

и комплексы программ

ДИССЕРТАЦИЯ

на соискание ученой степени кандидата физико-математических наук

Научный руководитель д. ф.-м. н., проф.

Кипнис М.М.

Челябинск – 2014 Содержание.................................... 4 Введение Глава 1 Метод конусов устойчивости..... для диагностирования устойчивости нейронных сетей 1.1 Модели нейронных сетей....................... 1.2 Формальное определение нейронных сетей............. 1.3 Цели главы 1............................. 1.4 Кривая -разбиения для данных,,,............. 1.5 Области (,,, )......................... 1.6 Конусы устойчивости для матричного уравнения = + с одновременно триангулизируемыми матрицами..... 1.7 Алгоритм диагностирования устойчивости матричных разностных уравнений с двумя запаздываниями................. 1.8 Програмный продукт «Устойчивость матричных разностных уравнений с двумя запаздываниями»......... 1.9 Сравнение результатов главы 1 с известными результатами... Глава 2 Устойчивость базовых конфигураций нейронных сетей 2.1 Устойчивость нейронной сети кольцевой конфигурации...... 2.2 Устойчивость нейронной сети линейной конфигурации...... 2.3 Сравнение областей устойчивости нейронных сетей кольцевой и линейной конфигураций. Парадоксальные точки......... 2.4 Устойчивость нейронной сети звездной конфигурации...... 2.5 Устойчивость нейронной сети двуслойной конфигурации..... 2.6 Устойчивость полносвязных нейронных сетей........... 2.7 Сравнение результатов главы 2 с известными результатами... Глава 3 Устойчивость нейронных сетей, полученных из базовых........ сетей с помощью операции декартова умножения 3.1 Постановка задачи о декартовых произведениях сетей...... 3.2 Устойчивость нейронной сети планарной конфигурация (нейронной решетки).





............................... 3.3 Устойчивость нейронной сети с топологией связей многомерного куба (нейронного гиперкуба)..................... 3.4 Устойчивость нейронной сети тороидальной конфигурации... 3.5 Устойчивость нейронной сети цилиндрической конфигурации.. 3.6 Расширение области устойчивости при разрыве большого кольца нейронных сетей............................ 3.7 Парадоксальные точки в малых кольцах нейронных сетей.... 3.8 Сравнение результатов главы 3 с известными результатами...................................... Заключение................................... Литература Приложение А. Исходный код программы для построения конуса -устойчивости............................... Приложение Б. Исходный код программы «Устойчивость..... разностных матричных уравнений с запаздываниями»

Приложение В. Исходный код программы для построения областей.................... устойчивости нейронных сетей Введение Нейронные сети изучают междуна Актуальность темы исследования родные научные сообщества: International Neural Network Society (INNS), the European Neural Network Society (ENNS), the Japanese Neural Network Society (JNNS). Издаются журналы, посвященные исключительно нейронным сетям:

Neural Networks (изд-во Elsevier), IEEE Transactions on Neural Networks and Learning Systems (IEEE, США), Advances in Artificial Neural Systems (изд-во Hindawi), Optical Memory&Neural Networks (Information Optics) (изд-во МАИК НАУКА/INTERPERIODICA), Neural Network World (АН Чехии) и т.д.

Всякую модель, в которой имеются узлы и связи между ними, в настоящее время можно рассматривать как нейронную сеть. Таким образом, нейронными сетями являются модели системы взаимодействующих вулканов [32], компью терные сети [46, 47, 52], модели процесса извлечения слов из человеческой памяти [5], нервные системы живых существ.

Устойчивость нейронных сетей является одной из главных ее характерис тик. Проблема устойчивости осложняется запаздываниями во взаимодействии нейронов. Поэтому ее изучение требует применения теории функционально-диф ференциальных уравнений (ФДУ), если модель нейронной сети непрерывна, либо разностных матричных уравнений с запаздываниями, если модель диск ретна. В теорию ФДУ внесли вклад Н.В. Азбелев, Р. Беллман, Ю.Ф. Долгий, Н.Н. Красовский, А.В. Ким, В.Г. Пименов, З.И. Рехлицкий, П.М. Симонов.

Данная диссертация посвящена устойчивости дискретных моделей нейрон ных сетей. Такие модели были построены в работах Е. Каслик и ее учителя С.

Балинта [58–60] (2007–2009) как аналоги непрерывных моделей.

Общие результаты изучения устойчивости, применимые ко всем сетям, ввиду их общности, не могут дать полное представление о поведении отдель ных классов сетей. Поэтому актуальна проблема описания условий устойчиво сти наиболее часто встречающихся конфигураций нейронных сетей: кольцевой, линейной, звездной, двуслойной, полносвязной, решетчатой, тороидальной, ци линдрической, а также сетью с топологией связей многомерного куба. Именно этим проблемам применительно к дискретным моделям посвящена настоящая диссертация.





Много работ посвящено глобальной Степень разработанности темы устойчивости нейронных сетей (например, van der Driesche и Zou [45] (1998), Idels и Kipnis [53] (2009), И.В. Бойков [3] (2012). Меньшее внимание привлекала локальная устойчивость нейронных сетей, которая требует изучения матричных дифференциальных или разностных уравнений с запаздываниями. Проблема устойчивости дискретных сетей разработана гораздо меньше соответствующей проблемы для непрерывных сетей. Кроме того, в литературе отсутствуют систе матические исследования устойчивости стандартных нейронных сетей. Только устойчивость кольцевой нейронной сети в ее непрерывных моделях можно счи тать достаточно разработанной (см. S. Campbell с соавторами [38, 87] (2005, 2004), Guo [49] (2008), Т. Хохлова и М. Кипнис [64] (2012)).

Недавно в диссертации Т. Хохловой [26] (2013) предпринято сравнительное исследование непрерывных моделей кольцевой и линейной нейронных сетей.

Но в области дискретных моделей известны только вышеуказанные статьи Е.

Каслик с соавторами. При этом методы Е. Каслик изучения устойчивости коль цевой нейронной сети недостаточны для изучения вопроса об утойчивости коль ца с неограниченным количеством нейронов, и в работах Каслик не изучено влияние разрыва кольца на устойчивость сети.

Разработок по устойчивости многочисленных стандартных моделей ней ронных сетей, таких как двуслойные сети, тороидальные, сети с топологией связей многомерного куба нет ни для непрерывных, ни для дискретных моделей.

Настоящая диссертация восполняет этот пробел в области дискретных моделей.

Цель работы — систематическое исследование Цели и задачи работы областей устойчивости стандартных конфигураций нейронных сетей в простра нстве их параметров. Мы ставим задачи выделить базовые стандартные конфи гурации, изучить их устойчивость, а затем, определив декартово произведение нейронных сетей в духе соответствующего определения для весовых графов, изучить области устойчивости декартовых произведений базовых нейронных сетей.

В диссертации впервые даны методы анализа устойчи Научная новизна вости разностных уравнений с запаздываниями, позволяющие находить точные границы областей устойчивости в пространстве параметров стандартных ней ронных сетей. Эти методы обладают большей общностью и сферой применения, чем известные в литературе методы.

Впервые в множестве нейронных сетей выделены базовые нейронные сети, определены декартовы произведения нейронных сетей и созданы средства ана лиза их устойчивости. Впервые построены точные границы областей устойчи вости в пространстве параметров дискретных моделей стандартных нейронных сетей: линейных, звездных, решетчатых, тороидальных и других.

Впервые обнаружены парадоксальные явления в дискретных моделях коль цевых нейронных сетей: потеря их устойчивости в результате разрыва. Доказано, что в больших кольцах нейронных сетей парадоксальные явления исчезают, и указаны условия их существования в малых кольцах.

Впервые для широкого класса нейронных сетей поставлены и решены воп росы: о сохранении или несохранении устойчивости сети в процессе неограниче нного наращивания количества нейронов при неизменной архитектуре сети;

о сохранении или несохранении устойчивости сети с односторонними воздействи ями нейронов на соседние нейроны, при условии неограниченного возрастания силы воздействия.

Исследование Теоретическая и практическая значимость работы устойчивости стандартных нейронных конфигураций обогащает теорию ней ронных сетей с запаздывающими взаимодействиями выявлением новых эф фектов. Например, оно разделило нейронные сети по конфигурациям на два класса: в первом классе (линейные, решетчатые конфигурации) переход на односторонние взаимодействия гарантирует устойчивость сети, во втором кла ссе (кольцевые, тороидальные) не гарантирует. Введение понятия парадокса льных точек также дает как теоретические перспективы их исследования в сложных нейронных сетях, так и возможности исключения нежелательных яв лений в реальных нейронных сетях в процессе их разрыва. Практическим при менением работы является также внедрение специальных курсов по устойчи вости нейронных сетей в учебные программы магистров на факультете ин форматики Челябинского государственного педагогического университета. В рамках этих спецкурсов магистранты под руководством автора проделывали численные эксперименты по изучению устойчивости нейронных сетей [15–17].

Автор разработал новый метод Методология и методы исследования исследования матричных разностных уравнений с запаздываниями — метод конусов устойчивости, и применил этот метод к анализу устойчивости нейрон ных сетей. Этот метод сводит анализ устойчивости многомерных задач к ана лизу расположения некоторых точек трехмерного пространства относительно некоторой поверхности в трехмерном пространстве, называемой конусом устой чивости. Использованы также идеи метода -разбиений.

Результаты и положения, выносимые на защиту 1. Автор разработал новый метод конусов устойчивости для анализа устой чивости дискретных моделей нейронных сетей с произвольным количеством нейронов и произвольными запаздываниями. Метод реализован в виде алго ритмов и комплекса программ для вычисления границ областей устойчивости нейронных сетей в пространстве параметров.

2. Построены области устойчивости в пространстве параметров нейрон ных сетей базовых конфигураций: кольцевой, линейной, двуслойной, звездной, с учетом запаздываний как в демпфировании собственных колебаний нейронов, так и во взаимодействиях различных нейронов.

3. Определена операция декартова произведения нейронных сетей, указан метод анализа устойчивости декартова произведения нейронных сетей, благода ря чему построены области устойчивости в пространстве параметров нейронных сетей решетчатой (планарной), тороидальной, цилиндрической конфигураций и нейронных сетей с топологией связей многомерного куба. Показано, что раз рыв большого кольца нейронных сетей благоприятствует устойчивости. В то же время найдены условия, при которых разрыв нейронного кольца может сопровождаться потерей устойчивости.

4. Построены классификации нейронных сетей: А) по признаку сохране ния устойчивости в процессе неограниченного увеличения количества нейронов с сохранением архитектуры сети;

Б) по признаку сохранения устойчивости при неограниченном увеличении силы действия нейронов в одном из направлений при условии нулевого воздействия в другом направлении.

Достоверность ре Степень достоверности и апробация результатов зультатов диссертации подтверждается согласованностью теоретических выво дов с результатами численных экспериментов. Основные результаты диссерта ции докладывались на следующих конференциях: на Международной конфе ренции «Колмогоровские чтения V. Общие проблемы управления» (Тамбов, 2011 г.);

на Всероссийской конференции «Статистика, моделирование, оптими зация (СМО)» (Челябинск, 2011);

на Всероссийской конференции «Теория управления и математическое моделирование» (Ижевск, 2012);

на Всероссий ской научно-практической конференции «Информатика и информационные технологии» (Челябинск, 2013);

на международной конференции «Applications of Mathematics in Engeneering and Economics» (Sozopol, Bulgaria, 2013).

Материалы диссертации изложены в 14 публикациях, из них Публикации 6 статей в рецензируемых журналах [6–9, 55, 56], 7 статей в сборниках трудов конференций [10, 11, 13–17] и свидетельство о регистрации программы для ЭВМ [12]. В статьях [9, 55, 56] М. Кипнису и В. Малыгиной принадлежат замысел и общее руководство работой. В трудах научных конференций [15–17] автор диссертации выступал как научный руководитель магистрантов-соавторов. Все конкретные результаты диссертации получены лично автором.

Диссертация состоит из введения, Структура и объем диссертации трех глав, заключения, библиографии и Приложений А, Б, В. Общий объем диссертации 135 страниц, включая 43 рисунка. Библиография включает 88 наи менований на 10 страницах.

Глава Метод конусов устойчивости для диагностирования устойчивости нейронных сетей 1.1 Модели нейронных сетей 1.1.1 Модели биологических нейронных сетей Чтобы понять, что происходит между нейронами внутри сети, нужно ра зобрать строение «типичного» нейрона [30, 31]. Основная масса биологических нейронов схожа по строению и свойствам с двигательными нейронами спинного мозга млекопитающих. Из сомы (тела нейрона) исходит много ветвей, называ емых дендритами;

сома и дендриты образуют входную поверхность нейрона.

Из аксонного бугра нейрона выходит длинное волокно, называемое «аксон», ветви которого образуют дерево. Концы ветвей аксона, называемые нервными окончаниями, встречаются с другими нейронами или эффекторами. Рассмотрим сеть, составленную из нейронов с мембранными потенциалами () (1 ). Согласно М. Арбибу [30, 31], уравнение мембранного потенциала () для нейрона с номером, без учета связей с другими нейронами, имеет вид (1.1) = () +, где равновесный потенциал -го нейрона, это мембранный потенциал, кото рый устанавливается в отсутствии внешних сигналов, постоянная времени, характеризующая инерционность -го нейрона.

Сигналы, полученные через дендриты нейроном с номером от нейрона с номером (1 ), обозначим посредством (). Учитывая (1.1),, получим для описания нейронной сети систему уравнений (1.2) = () + + (), = 1, 2,...,.

= Поскольку дендриты данного нейрона проводят сигналы только других нейро нов, имеем = 0.

Естественно считать, что в (1.2) () = (), где весовые коэффи циенты зависит от свойств аксонов -го нейрона, дендритов -го нейрона и синапсов на их стыке. Поэтому система (1.2) становится системой (1.3) = () + + (), = 1, 2,...,, = где = 0.

Аксон может иметь большую длину. Например, тело нейрона, который контролирует большой палец ноги человека, лежит в спинном мозге, а его аксон проходит по всей длине ноги. Скорость передачи нервных импульсов по нервным волокнам человека варьируется от долей метра в секунду (сигналы по немиелинезированным волокнам) до 120 м/сек (по быстропроводящим сен сорным волокнам). Еще меньше скорость нервных процессов простейших орга низмов (до 2 м/сек). Эти свойства делают обоснованным ввод запаздывания в уравнения нейронных сетей. Поэтому вместо системы (1.3) естественно рассма тривать систему (1.4) = () + + ( ), = 1, 2,..., = с запаздываниями (1, ).

Для исследований математических моделей нейронных сетей традицион ными являются соглашения о равенстве всех запаздываний и показателей инер ционности нейронов:,,. Введем матрицу = ( ),=1 и векторы () = (1 (),..., ()), = (1,..., ). Тогда система (1.4) примет вид (1.5) () = () + + · ( ).

Рассмотрим стационарное решение () * уравнения (1.5). Имеет место равенство * = · * +. Введем отклонения () = () *. Уравнение (1.5) в отклонениях примет вид (1.6) () = () + · ( ).

Матричное дифференциальное уравнение с запаздыванием (1.6) с интер претацией, указанной выше, считается общепризнанной моделью нейронных сетей при их исследовании на устойчивость стационарных состояний (см., на пример, [86] (1999), [87] (2004), [64, 88] (2012), [26, 65] (2013)).

Но целью диссертации является изучение дискретных моделей нейронных сетей. Поэтому подвергнем дискретизации уравнение (1.6). Будем изучать по ведение системы в моменты времени = 0 + ( 1), N = {1, 2,...}.

Введем обозначение для вектора состояния нейронной сети (0 + ( 1)) =. Предположим, что запаздывание кратно, то есть = ( 1) при некотором N = {1, 2,...}. Заменим производную () = (0 + ( 1)) в (1.6) разделенной конечной разностью ( 1 ). Тогда уравнение (1.6) станет разностным матричным линейным однородным уравнением (1.7) = (1 ·, )1 + = 1, 2,...

Назовем величину = (1 ) коэффициентом демпфирования нейрона, введем обозначение =. Окончательно, получим из (1.7) дискретную модель нейронной сети из нейронов (1.8) = 1 +, = 1, 2,...

где коэффициент демпфирования нейронной сети, матрица взаимодействий нейронов в сети, запаздывание во взаимодействии различных нейронов. Ди агональные элементы матрицы равны нулю.

Мы не утверждаем, что модель (1.8) в каком-то смысле эквивалентна мо дели (1.6). Мы считаем, что модель (1.8) достойна изучения для понимания процессов в нейронных сетях с запаздывающими взаимодействиями. Модель нейронных сетей (1.8) неоднократно повторялась в работах по дискретным мо делям нейронных сетей, в частности, в работах Е. Каслик с соавторами [58–61].

Наши методы изучения устойчивости матричных разностных уравнений достаточно мощны, чтобы учесть возможность, когда запаздывание во вза имодействии различных нейронов не кратно запаздыванию в демпфировании собственных колебаний нейронов, равному 1 в (1.8). Поэтому мы введем нату ральное число, такое что 1, и будем изучать уравнение с двумя запаздываниями (1.9) = +, = 1, 2,...

Натуральное число будем называть запаздыванием в демпфировании собст венных колебаний нейрона.

1.1.2 Модели искусcтвенных нейронных сетей Клетка в модели искусственной нейронной сети Хопфилда с добавлени ем Маркуса-Вестервельта представляет собой электрическую цепь, состоящую из емкости и активного сопротивления, -я клетка (искусственный нейрон) характеризуется емкостью и сопротивлением [51, 73]. Уравнение для -й клетки имеет вид 1 (1.10) () = () + ( ( )), = 1, 2..., = где () электрическое напряжение, характеризующее -ю клетку, неко торые весовые коэффициенты (1 ), функция имеет сигмоидный, вид. Например, можно положить () = 1+(). Рассмотрим стационарное решение системы (1.10), в котором () *. Константы * удовлетворяют системе * = * =1 ( ), = 1, 2....

Как это принято в литературе (см., например, [45]), будем считать, что все характеристики нейронов, и запаздывания совпадают:,,. Введем показатель инерционности искусственого нейрона равенством =. Введем отклонения () = () *. Тогда для век тор-функции () = (1 (),..., ()) после линеаризации уравнения (1.10) по лучаем уравнение () = () + · ( ), где некоторая матрица, что совпадает с уравнением (1.6).

Далее, используя идеи предыдущего пункта, из этого дифференциального уравнения получаем уравнение = 1 +, что совпадает с результатом (1.8) моделирования биологической нейронной сети с последующей линеаризацией в предыдущем разделе диссертации.

В работах Е. Каслик и ее учителя С. Балинта [58–61] даны дискретные нелинейные уравнения для нейронной сети Хопфилда из нейронов, похожие на формулу (1.10):

() () () (1.11) = 1 + ( ) +, = 1, 2..., 1.

= () Здесь сигнал -го искусственного нейрона в момент времени Z+, внешнее воздействие на -й нейрон, независимое от времени, = ( ) матрица сил взаимодействий нейронов, некоторая сигмоидная функция, коэффициент демпфирования собственных колебаний -го нейрона, запазды вание.

В результате линеаризации уравнения (1.11) вокруг любого стационарного состояния при естественном допущении, что = не зависит от, получаем уравнение вида (1.8).

Итак, мы формулируем общие цели диссертации таким образом: мы изуча ем устойчивость нейронных сетей посредством изучения уравнений (1.8), (1.9), выбирая матрицы такими, чтобы они отражали системы связей в стандарт ных нейронных сетях. Элементы матрицы R являются силами взаимо действия между различными нейронами, поэтому считаем, что все диагональ ные элементы суть нули.

Термину «стандартные нейронные сети» мы не даем формального опре деления. Мы понимаем «стандартные нейронные сети» как нейронные сети, часто встречающиеся в литературе. К ним относятся кольцевые, линейные, двуслойные, звездные, полносвязные, решетчатые (планарные), цилиндриче ские, тороидальные.

В диссертации мы разделим их изучение на две главы. В главе 2 мы изучим простые стандартные нейронные сети, которые мы назвали базовыми: кольце вые, линейные, двуслойные, звездные, полносвязные. В главе 3 мы изучим ус тойчивость декартовых произведений базовых сетей: решетчатых (планарных), цилиндрических, тороидальных.

1.2 Формальное определение нейронных сетей Нейронные сети описываются либо линейными неоднородными (см. раздел 1.1.1), либо нелинейными уравнениями (см. раздел 1.1.2), но в рамках насто ящей диссертации мы интересуемся локальной устойчивостью стационарных состояний нейронных сетей. Поэтому в следующем формальном определении нейронной сети будем рассматривать только линейные однородные уравнения, которые, как предполагается, являются результатом линеаризации нелинейных уравнений вокруг стационарных состояний.

Нейронной сетью назовем упорядоченную пятерку Определение 1.1.

объектов = (,,,, ), где R,, Z+ ( ), R. Диаго нальные элементы матрицы равны нулю.

Назовем (1.9) уравнением сети.

Представляющим графом нейронной сети = (,,,, ) мы назовем взвешенный направленный граф (, ) с множеством вершин = {1, 2,..., } и множеством дуг, определенным следующим образом: (, ), если и только если = 0. В случае = 0 вес дуги (, ) есть.

Ввиду того, что все диагональные элементы мы считаем нулевыми, петель в представляющем графе нет.

Следует заметить, что представляющий граф неполностью характеризует нейронную сеть: в графе нет информации о характеристиках,,.

Поскольку кольцевая и линейная конфигурации играют важную роль в нашей работе, рассмотрим именно их в следующем примере.

Рассмотрим циркулянтную матрицу (, ) ( 3) и три Пример 1.1.

диагональную матрицу (, ) ( 2):

0 0... 0 0 0... 0 0... 0 0 0... 0 0 0... 0 0 0 0... 0 (1.12) (, ) =......., (, ) =...

.....

..........

....

........

0 0 0... 0 0 0 0... 0 0 0... 0 0 0 0... Нейронные сети (, ) = (,,,, (, )) и (, ) = (,,,, (, )) назовем кольцевой и линейной нейронной сетью соответственно. В матрице (, ) сила действия нейрона на соседа против часовой стрелки есть, сила действия в противоположном направлении равна. Нейронная сеть (, ) отличается от (, ) только отсутствием связей между первым и последним нейроном.

Графы кольцевой 3 (, ) и линейной 2 (, ) нейронных сетей указаны на Рисунке 1.1. В дальнейшем мы будем изображать две разнонаправленные взвешенные дуги (, ), (, ) в графах как одно ребро.

b b a a dc 3 a b Сети 3 (, ) и 2 (, ).

Рис. 1.1.

Наше определение нейронной сети как упорядоченной пятерки объектов будет активно использоваться в главе 3 диссертации, где будет введено понятие декартового произведения нейронных сетей.

1.3 Цели главы В главе 1 мы излагаем созданный нами метод конусов устойчивости для анализа устойчивости разностного матричного уравнения (1.13) = +, = 1, 2,...

Здесь : Z+ C ;

, C, натуральные числа, — запаздывания ( ). Если =, где единичная матрица, R, то мы получаем уравнение нейронной сети (1.9). Более общее уравнение (1.13) полезно, когда некоторые члены из второго слагаемого в правой части уравнения (1.9) перене сем в первое слагаемое. Это оправдано, когда некоторые из нейронов в исходной нейронной системе имеют меньшее запаздывание, чем основная масса нейронов.

Характеристический полином () порядка для уравнения (1.13) имеет вид () = det( ). (1.14) Мы называем уравнение (1.13) (асимптотически) устойчивым, если его ну левое решение (асимптотически) устойчиво.

Для устойчивости уравнения (1.15) требуется ограниченность всех его тра екторий. Но иногда требуется либо ужесточить, либо ослабить требование ус тойчивости. Эти соображения оправдывают следующие определения (см., нап ример, [28]).

Матричное уравнение (1.13) назовем -устойчивым Определение 1.2.

( R, 0), если для любого его решения () последовательность (||/) ограничена. Уравнение (1.13) назовем асимптотически -устойчивым, если для любого его решения () имеет место lim ||/ = 0.

При = 1 понятие (асимптотической) -устойчивости совпадает с поня тием обычной (асимптотической) устойчивости. Для благозвучия будем назы вать (асимптотически) -неустойчивым уравнение, которое не являются (асим птотически) -устойчивым.

Очевидно, матричное уравнение (1.13) асимптотически -устойчиво, если и только если все корни его характеристического полинома (1.14) лежат внутри круга радиуса с центром в 0. Если хотя бы один корень полинома (1.14) лежит вне круга радиуса с центром в 0, то матричное уравнение (1.13) -неустойчиво.

Будем рассматривать уравнения вида (1.13) с одновременно триангулизи руемыми матрицами,. Известно [25], что если, коммутируют, то они одновременно триангулизируемы.

1.4 Кривая -разбиения для данных,,, Рассмотрим скалярное уравнение (1.15) = +, = 1, 2,...

где, - запаздывания, : N R. Проблема анализа устойчивости уравнения (1.15) с действительными коэффициентами, полностью изучена в работах [19, 20, 22, 23, 39, 43]. Рассмотрим уравнение (1.15) с комплексными коэффици ентами,.

Характеристический многочлен для (1.15) имеет вид () =. (1.16) Если = 1, = 1, N, 1, то траектория уравнения (1.15) распадается на независимых траекторий, а полином (1.16) после замены = понижает порядок:

1 () = 1 1 1.

Поэтому часто (но не всегда) будем считать запаздывания, взаимно про стыми.

Очевидно, уравнение (1.15) -устойчиво, если вне круга радиуса с цент ром в начале координат нет корней полинома (1.16) и на границе этого круга нет кратных корней того же полинома. Уравнение (1.15) асимптотически -ус тойчиво, если и только если все корни его характеристического полинома (1.16) лежат внутри круга радиуса с центром в 0.

Как мы отметили ранее, при = 1 пропорциональное изменение двух запаздываний, в уравнении (1.15) не влияет на -устойчивость. При = это не так. Легко видеть, что уравнение (1.17) = + асимптотически -устойчиво тогда и только тогда, когда уравнение (1.15) асим птотически -устойчиво. Отсюда следует важный факт: пропорциональное уве личение запаздываний, с сохранением коэффициентов, в уравнении (1.15) положительно влияет на асимптотическую -устойчивость при и отрицательно при 1.

Кривая -разбиения для данных, Z+, C, Определение 1.3.

R+ это кривая на комплексной плоскости переменной, заданная уравне нием () = exp() || exp(( )), (1.18) R.

В разных ситуациях нам будет удобно ограничивать пределы изменения пара метра в (1.18) по-разному. Кривую (1.18) мы будем также называть годогра фом.

Годограф (1.18) разбивает комплексную плоскость на связные области.

Это разбиение называется -разбиением [48]. Если положить R, и подставить на место коэффициента в полином (1.16) любые две внутренние точки 1, 2 одной из связных областей -разбиения, то два получившихся полинома будут иметь одинаковое количество корней внутри круга комплекс ной плоскости радиуса. В частности, если R, 0, = 1 и подстановка некоторой внутренней точки 1 одной из областей -разбиения в уравнение (1.15) на место коэффициента дает устойчивое уравнение, то подстановка любой другой внутренней точки этой же области дает также устойчивое уравне ние. На этих соображениях основан метод -разбиения.

Укажем важное свойство симметрии годографа (1.18).

(о симметрии). Если, взаимно просты, то годограф (1.18) Лемма 1.1.

переходит в себя при повороте на угол 2/.

Для взаимно простых, найдутся такие, Z+, что Доказательство.

(1.19) = 1.

Из (1.18), (1.19) вытекает (1.20) exp(2/) () = ( + 2/).

Лемма 1.1 доказана.

В дальнейшем мы будем считать, что arg для любого ком плексного, в то время как Arg будем считать многозначной функцией и равенство Arg = будем считать верным, если одно из значений Arg равно.

Следующая лемма утверждает, что между начальной частью годографа, расположенной между лучами arg = /, arg = /, и нулем нет других точек годографа ().

Пусть, взаимно просты, 1, ||. Пусть Лемма 1.2.

[0;

/(2)] есть наименьший положительный корень уравнения arg () = /, и пусть 0 2 1. Тогда для любого R из (1.21) arg () = arg (2 ) следует |()| |(2 )|.

Функция |()| является 2/-периодичной, при любом Доказательство.

Z возрастает на [(2 2)/, (2 1)/] и убывает на [(2 1)/, 2/]. Кроме того, |( + /)| = |( + /)| для любого. Предположим, для приведения к противоречию, что для некоторого верно (1.21) и |()| |(2 )|. Тогда существует такое положительное целое и такое R, что (1.22) || 2.

= 2/ +, Из (1.18), (1.22) следует, что Arg () = ( ) + Arg( exp() ||) = 2/ + Arg( exp() ||) + ( ) = 2/ + Arg (). 1.23) ( Поскольку, взаимно просты и, найдем натуральные числа,, такие что = +, 1. Тогда (1.23) влечет Arg () = 2/ + Arg (), что противоречит (1.21) и неравенству | arg ()| /, следующему из (1.22).

Лемма 1.2 доказана.

1.5 Области (,,, ) Для годографа (1.18) имеет место (0) = ( ||( )). Если || /( ), (1.24) то нам интересна замкнутая кривая на плоскости комплексного переменного, которую мы назовем основным овалом. Эта кривая есть образ отрезка [1, 1 ] при отображении (), определенном посредством (1.18). Здесь 1 (0, /] есть наименьший положительный корень уравнения arg () =. Нам также интересны те части годографа (1.18), которые получаются поворотом основного овала на углы 2/, Z, 0 ) (см. Лемму 1). Их мы тоже назовем основными овалами.

Пусть, взаимно просты, 1, Z, Определение 1.4.

0, пусть выполнены равенство (1.19) и неравенство (1.24). Основным овалом для уравнения (1.15) назовем замкнутую кривую на плоскости ком плексного переменного, заданную уравнением (1.18), где переменная меня 0 0 (a) (b) 0 0 (c) (d) ||, Рис. 1.2. Кривая и три основных овала для (a) (b) -разбиения = 3, = 5:

|| =, || /( ), || = /( ).

(c) (d) ется от (1 + 2/) до (1 + 2/), где 1 есть наименьший положи тельный корень уравнения (1.25) arg () =.

Из Леммы 1.1 и формулы (1.20) следует, что все основных овалов полу чаются из 0 поворотом на углы 2/, где = 0, 1,..., ( 1).

Рассматривая Определение 1.4, мы заключаем следующее. Для сущест вования основного овала требуется, чтобы || /( ). При 1 и || комплексное число 0 находится вне любого из овалов, и пересечение всех овалов пусто. Если же = 1, то при фиксированных, при условии || [0, /( )) основной овал 0 единственен. Ввиду этого результаты об устойчивости уравнения (1.15) различны для = 1 и 1.

0 0 (a) (b) 0 0 (c) (d) ||, || =, Рис. 1.3. Кривая и основной овал для (a) (b) -разбиения 0 = 1, = 5:

|| /( 1), || = /( 1).

(c) (d) Динамика изменения основного овала на комплексной плоскости пе ременного такова (Рисунок 1.2 для 1, Рисунок 1.3 для = 1). С увеличением || от 0 он уменьшается, и когда значение || достигает /( ), он исчезает, сжимаясь в точку = exp(2/) /( 1) (Рисунок 1.2d, 1.3d).

Пусть, взаимно просты, 1, Z, 0, Лемма 1.3.

R и 0 /( ). Если комплексное число лежит вне основного овала, то характеристический полином (1.16) имеет корень, такой что ||.

Пусть фиксированы,,,,, пусть комплексное число Доказательство.

лежит вне основного овала. Рассмотрим систему овалов (), заменяя на в Определении 1.4. При овалы () включат в себя окружность сколь угодно большого радиуса. Поэтому найдется 0, такое что точка войдет внутрь овала (0 ). Овалы и (0 ) гомотопичны, поэтому найдется 1 (, 0 ], такое что лежит на кривой (1 ), что означает наличие корня характеристического полинома (1.16), такого что || = 1. Лемма 1.3 доказана.

Пусть, взаимно просты, 1, C и Определение 1.5.

|| /( ). Областью (,,, ) назовем множество комплексных чисел, таких что для любого (0 ) число лежит внутри основного овала.

При тех же условиях, если, не являются взаимно простыми и =НОД(, ), положим (,,, ) = (/, /,, ).

В дальнейшем в Теоремах 1.1-1.4 выяснится, что (,,, ) есть мно жество комплексных чисел, таких что уравнение (1.15) асимптотически -ус тойчиво при данных. Очевидно, при 1 и взаимно простых, область (,,, ) обладает следующими свойствами. При 0 || это есть связная область на плоскости комплексного переменного, содержащая 0, границей которой служит кривая -разбиения (1.18). При || = область вырождается в точку = 0, при || /( ) область (,,, ) пуста, при || /( ) область (,,, ) вообще не определена ввиду того, что основные овалы (Определение 1.4) не определены.

При = 1 область (, 1,, ) есть множество точек, лежащих внутри овала 0. Если 0 ||, то (, 1,, ) содержит 0. Если || /( 1), то (, 1,, ) непуста и не содержит 0. Если || = /( 1), то (, 1,, ) вырождается в точку = /( 1), и, наконец, при || /( 1) область (, 1,, ) вообще не определена. Следующие теоремы ос нованы на локализации корней полинома (1.16) относительно круга радиуса при неотрицательных коэффициентах и комплексных.

Пусть, взаимно просты, 1, R+, 0.

Теорема 1.1.

1. Если, то при любом комплексном уравнение (1.15) -неустойчиво.

2. Если =, то то при любом комплексном = 0 уравнение (1.15) -неус тойчиво;

при = 0 оно -устойчиво (не асимптотически).

3. Если 0, то уравнение (1.15) асимптотически -устойчиво тогда и только тогда, когда комплексное число лежит внутри области (,,, ).

4. Если 0, то уравнение (1.15) является -устойчивым тогда и только тогда, когда комплексное число лежит либо внутри, либо на границе области (,,, ).

1. Пусть. Найдем такое, что Доказательство.

/( ).

Ввиду неравенства /( ) можно рассмотреть основных овалов (), = 0, 1,..., 1, заменяя в Определении 1.4 переменную на. Ввиду система овалов () не имеет ни одной общей точки. Поэтому для любого комплексного числа найдется Z, 0, такое что находится вне овала (). По Лемме 1.3 уравнение (1.15) -неустойчиво. Ввиду оно -неустойчиво. Пункт 1 доказан.

2. Пусть =. При = 0 пункт 2 Теоремы 1.1 очевиден. Пусть = 0. Если 0, то лежит вне овала 0. Если Re 0 и четно, то лежит вне Re овала /2. Если Re 0 и нечетно, то лежит вне овала (1)/2, либо вне овала (+1)/2. В любом случае по Лемме 1.3 уравнение (1.15) -неустойчиво.

Пункт 2 доказан.

3. Пусть 0. Пусть число лежит внутри области (,,, ).

Тогда при любом (0 ) число лежит внутри овала. В силу Леммы 1.2 от 0 до может быть проведен луч на комплексной плоскости, не пересекающий кривую -разбиения (1.18). Поэтому полином (1.16) имеет одинаковое количество корней внутри круга радиуса как при данном, так и при = 0. Но при = 0 все корни полинома (1.16) находятся внутри круга радиуса. Поэтому и при данном уравнение (1.15) асимптотически -устой чиво.

Если же находится на границе или вне области (,,, ), то лежит либо на границе одного из основных овалов, либо вне его, и по Лемме 1.3 уравнение (1.15) асимптотически -неустойчиво.

4. Если лежит вне области (,,, ), то заключение пункта 4 Теоремы 1. непосредственно следует из Леммы 1.3. Если лежит внутри (,,, ), то заключение пункта 4 Теоремы 1.1 непосредственно следует из пункта 3 Теоремы 1.1. Пусть лежит на границе области (,,, ). Тогда для любого корня полинома (1.16) либо ||, либо || =. В последнем случае ввиду неравенства 0 /( ) имеем = 1 ( ( )) = 0, поэтому корень на границе круга радиуса не кратный. Теорема 1.1 доказана.

Случай, когда меньшее запаздывание равно единице, резко отличается от случая 1.

Пусть = 1, R+, 0.

Теорема 1.2.

1. Если /( 1), то при любом комплексном уравнение (1.15) -неус тойчиво.

2. Если 0 /( 1), то уравнение (1.15) асимптотически -устойчи во тогда и только тогда, когда комплексное число лежит внутри области (, 1,, ).

3. Если 0 то уравнение (1.15) -устойчиво тогда и только /( 1), тогда, когда комплексное число лежит либо внутри, либо на границе обла сти (, 1,, ).

1. Пусть /( ), пусть дано комплексное число.

Доказательство.

Найдем такое, что /( ) /( ) и точка находится вне овала 0 (), полученного по Определению 1.4 заменой на. По Лемме 1.3 найдется комплексный корень полинома (1.16), такой что ||, и -неустойчивость уравнения (1.15) доказана. Положим теперь = /( 1).

Тогда предыдущие рассуждения также докажут -неустойчивость, если = /( 1). Если же = /( 1), то при = /( 1) число = является кратным корнем полинома (1.16), и, следовательно, уравнение (1.15) также -неустойчиво. Пункт 1 Теоремы 2 доказан.

2. Пусть 0 /( 1). Область (, 1,, ), то есть область внутренних точек овала 0, связна. Функция |()| (см. (1.18)) монотонно возрастает при движении как от 0 до, так и от 0 до (). Поэтому внутри 0 нет ни одной точки годографа (1.18). Для завершения доказательства асимптотической -ус тойчивости (1.15) в любой точке внутри 0 достаточно показать, что хотя бы в одной точке 0 внутри овала 0 имеет место асимптотическая -устойчивость.

Случай 1. 0. Тогда точка = 0 лежит внутри 0, при = 0 полином (1.16) имеет ( 1)-кратный корень = 0 и простой корень =, что ввиду дает асимптотическую -устойчивость.

Случай 2. /( 1). Рассмотрим точку = 1 на границе 0, и рассмотрим характеристический полином (1.16) с данным значением :

2 () = 1 + 1.

Уравнение 2 () = 0 преобразуется к виду ) (( )1 ( ) ( )2 ) ( (1.26) 1 1 = 0.

= Один из корней уравнения (1.26) равен, все другие ввиду неравенства /( 1) по признаку Кона [41] находятся внутри круга радиуса.

Возвратимся к уравнению (1.16) и выясним, куда движется корень =, когда коэффициент движется от точки = 1 внутрь 0, так что d R, d 0. Из (1.16) следует, что при = + d =, ( 1) d что ввиду неравенства /( 1) дает d/d 0. Поэтому при d 0 имеем. Следовательно, внутри 0 есть значения, обеспечивающие асимптотическую -устойчивость уравнения (1.15), поэтому и при любом зна чении внутри 0 уравнение (1.15) асимптотически -устойчиво.

3. Пункт 3 Теоремы 1.2 доказывается так же, как пункт 4 Теоремы 1.1. Теорема 1.2 доказана.

В уравнении (1.15) сделаем замену, не влияющую на (асимптотическую) -устойчивость:

(1.27) = exp( arg ).

Уравнение (1.15) перейдет в следующее:

(1.28) = +, где (1.29) = ||, = exp( arg ).

Характеристический полином для (1.28) имеет вид () =, (1.30) и связан с (1.16) заменой = exp( arg ), не влияющей на расположение корней относительно круга радиуса. Для нас важно, что новое уравнение (1.28) ввиду (1.29) имеют действительный неотрицательный коэффициент при 0 0 (a) (b) 0 0 (c) (d) Рис. 1.4. Области для и трех различных значений коэффициента (a) (,,, ) = 5 :

(b) (c) (d) = 1, = 2, = 3, = 4.

, что позволяет применить к нему предыдущие результаты. Поэтому из Теорем 1.1, 1.2 сразу выводим следующие теоремы, дающие ответ на вопрос об устойчивости уравнения (1.15) при комплексных коэффициентах,.

Пусть, взаимно просты, 1, C, 0.

Теорема 1.3.

1. Если ||, то при любом комплексном уравнение (1.15) -неустойчи во.

2. Если || =, то то при любом комплексном = 0 уравнение (1.15) -неус тойчиво;

при = 0 оно -устойчиво (не асимптотически).

3. Если ||, то уравнение (1.15) асимптотически -устойчиво тогда и только тогда, когда комплексное число = exp( arg ) лежит внутри области (,,, ).

4. Если ||, то уравнение (1.15) -устойчиво тогда и только тогда, когда комплексное число = exp( arg ) лежит либо внутри области (,,, ), либо на ее границе.

Пусть = 1, C, 0.

Теорема 1.4.

1. Если || /( 1), то при любом комплексном уравнение (1.15) -неус тойчиво.

2. Если || /( 1), то уравнение (1.15) асимптотически -устойчиво тогда и только тогда, когда комплексное число = exp( arg ) лежит внутри области (, 1,, ).

3. Если || /( 1), то уравнение (1.15) -устойчиво тогда и только тогда, когда комплексное число = exp( arg ) лежит либо внутри, либо на границе области (, 1,, ).

Пусть в уравнении (1.15) = 6, = 0.8 + 0.9, = 1.15.

Пример 1.2.

Пусть 6 12. Для каждого из указанных значений найдем, при каких значениях комплексного коэффициента уравнение (1.15) -устойчиво.

2 k=6 k = k = k= k = k=8 k= 2 0 2 4 2 0 2 (a) (b) Рис. 1.5. К Примеру 1.2. Области уравнения (1.15) для -устойчивости = 6, = 0.8 + 0.9, (a) (b) = 1.19, = 6, 7, 8, 9, = 10, 11, 12.

Дадим комментарии к Рисунку 1.5, демонстрирующему ответ. Предвари тельно высчитаем || = 1.204, arg 0.844.

Для = 6 область -устойчивости не требует применения Теорем 1.1-1.4.

Это круг | + |, показанный на Рисунке 1.5a. Поскольку числа 6, 7 взаимно просты, для = 7 по Теореме 1.3 уравнение (1.15) -устойчиво тогда и только тогда, когда exp( 6 arg )(7, 6,, ). Соответствующий ”кривой шести угольник” указан на Рисунке 1.5a. Аналогично для = 11 условие exp( 11 arg )(11, 6,, ) необходимо и достаточно для асимптотической устойчивости (1.15), ”кривой шестиугольник” показан на Рисунке 1.5b.

Для = 8 критерий устойчивости есть условие exp( 3 arg )(4, 3,, 2 ). Соответствующий ”кривой треугольник” показан на Рисунке 1.5a. Аналогичен ”двуугольник” exp( 3 arg )(3, 2,, 3 ) для = на Рисунке 4а и ”кривой треугольник” exp( 3 arg )(5, 3,, 2 ) для = 10 на Рисунке 1.5b.

Для = 12 согласно Теореме 4 критерием устойчивости является при надлежность комплексного коэффициента овалу exp( · 2 arg )(2, 1,, 6 ) (Рисунок 1.5b).

Рассмотрение Примера 1.2 закончено.

В дальнейшем нам понадобится иногда сосредоточиваться на случае = и действительных значениях. В этом случае область (, 1,, ) выглядит как некоторый овал (см. Рисунок 1.4a). Поэтому удобно ввести следующее опреде ление.

Область (, 1,, ) называется овалом -устойчи Определение 1.6.

вости для данных Z+, R, R+.

1.6 Конусы устойчивости для матричного уравнения = + с одновременно триангулизируемыми матрицами Для удобства ссылок выпишем здесь снова матричное уравнение (1.13) (1.31) = +, = 1, 2,...

и его характеристический полином () (см. (1.32)):

() = det( ). (1.32) Если 1, то конусом -устойчивости для Определение 1.7.

данных,, назовем множество точек = (1, 2, 3) R3, таких что и пересечение этого множества с любой плоскостью 3 = 0 ) есть область (,,, ). Если = 1, то конусом -ус (0 тойчивости для данных, назовем множество точек = (1, 2, 3) R3, таких что 0 3 /( 1) и пересечение этого множества с любой плоскостью 3 = (0 /( 1)) есть область (, 1,, ).

Один из конусов -устойчивости изображен на Рисунке 1.6. При = 1 мы назовем конус -устойчивости просто конусом устойчивости, опуская префикс.

1. 0. 1. 1 0. 0. 2 1. Рис. 1.6. Конус (см. Определение 1.7) для -устойчивости = 5, = 4, = 1.15.

Возвращаясь к Рисунку 1.4, мы можем истолковать фигуры на Рисунке 1.4(a) как сечения конуса устойчивости для = 5, = 1 на различных высотах 3 =, на Рисунке 1.4(b) - как сечения конуса устойчивости для = 5, = и т.д.

Конусы устойчивости для 1 является пересечением конусообразных поверхностей, образованных основными овалами, когда параметр меняется от 0 до /( ) (Рисунок 1.7).

Рис. 1.7. Конус устойчивости для как пересечение трех поверхностей, = 3, = образованных основными овалами Рассмотрим простой случай диагональной системы (1.33) diag(11,..., ) diag(11,..., ) = с комплексными коэффициентами,, 1.

Построим точки = (1, 2, 3 ) R3 (1 ) так, что (1.34) 3 = | |.

1 + 2 = exp( arg ), Из определения конуса -устойчивости и Теорем 1.3-1.4 следует, что (1.33) является асимптотически -устойчивым, если и только если все точки ( ) лежат внутри конуса -устойчивости для данных,.

Следующими по сложности за диагональными системами вида (1.31) явля ются системы с треугольными матрицами,. В этих системах устойчивость определяется только диагональными элементами матриц,. Естественное расширение класса треугольных систем - это системы с матрицами,, сов местно приводимыми к треугольному виду. Известно [25], что коммутирующие матрицы этим свойством обладают.

Пусть 1 и числа, взаимно просты и 0.

Теорема 1.5.

Пусть,, R и 1 = и 1 =, где и — нижние треугольные матрицы с элементами, (1, ). Построим точки = (1, 2, 3 ) R3, (1 ), такие что (см. (1.34)) 3 = | |.

1 + 2 = exp( arg ), Тогда уравнение (1.31) асимптотически -устойчиво если и только если все точки (1 ) находятся внутри конуса -устойчивости для данных,,.

Если существует (1 ), такое что расположено вне конуса -устойчивости, то уравнение (1.31) -неустойчиво.

Обозначим =. Уравнение (1.31) переходит в Доказательство.

(1.35) = +.

Характеристический полином для (1.35), имеет вид ( ), (1.36) () = = и совпадает с характеристическим многочленом диагональной системы (1.33).

Поэтому из п. 3 Теоремы 1.3 (для 1) и п. 2 Теоремы 1.4 (для = 1) получаем заключение Теоремы 1.5 об асимптотической -устойчивости, а из п.

4 Теоремы 1.3 (для 1) и п. 3 Теоремы 1.4 (для = 1) получаем заключение Теоремы 1.5 о -неустойчивости. Теорема 1.5 доказана.

1.7 Алгоритм диагностирования устойчивости матричных разностных уравнений с двумя запаздываниями Для диагностирования устойчивости матричных разностных уравнений ви да (1.31), где, приводятся к треугольному виду одним преобразованием, разработан алгоритм, основанный на результатах разделов 1.3–1.6.

Описание алгоритма таково.

Данные матрицы, приводим к треугольной форме, одним преоб разованием и находим диагональные элементы, матриц,. Построим точки = (1, 2, 3 ) R3 следующим образом:

arg )), 2 = Im( exp( arg )), 3 = | |.

1 = Re( exp( (1.37) СЛУЧАЙ 1: 1 & 3. Делаем вывод о неустойчивости системы (Теорема 1.5 и Определение 1.7).

СЛУЧАЙ 2: 1 & 3. Для ответа на вопрос, устойчива ли система (1.31), необходимо проверить, как расположена каждая точка относительно конуса устойчивости для данных, и. Проверка выполняется последова тельно для каждой точки. Разберем работу алгоритма для одной точки.

Она расположена в сечении конуса плоскостью 3 = | |. Если сечение пусто, то алгоритм заканчивает свою работу, делая вывод о неустойчивости системы.

Определяем аргумент точки. Находим корень 0 уравнения ( ) + arg( exp() arg 3 ) = arg( exp( (1.38) arg )).

Подставив найденое значение 0 в уравнение = exp(( )0 )(( ) exp(0 ) | |), найдем точку на кривой -разбиения для даных, и, аргумент которой равен аргументу точки. Если расстояние от начала координат до точки окажется меньше, чем до точки, то говорим о неустойчивости системы.

Если расстояние от начала координат до точки окажется больше, чем до точки, то говорим об устойчивости системы. Если имеет место равенство, то констатируем, что система находится на границе устойчивости. В этом случае алгоритм не включает исследование системы на устойчивость, поскольку мы заинтересованы в поисках границ области устойчивости, и именно границу мы нашли.

СЛУЧАЙ 3: = 1 & 3 /( ). Делаем вывод о неустойчивости системы (Теорема 1.5 и Определение 1.7).

СЛУЧАЙ 4: = 1 & 3 /( ). В данном случае внутри кривой -разбиения не будет начала координат. Она будет смещена влево по оси 1. Чтобы можно было воспользоваться действиями предыдущих случаев, вводим новую величину arg )) + (| | ). (1.39) 1 = Re( exp( После этого точка получает вид.

arg )), 3 =. (1.40) 1 = 1, 2 = Im( exp( Теперь применяем шаги, описанные выше.

СЛУЧАЙ 5: = 1 & 3. Действуем как в случае 2.

Описание алгоритма закончено.

1.8 Програмный продукт «Устойчивость матричных разностных уравнений с двумя запаздываниями»

На основе алгоритма раздела 1.7 была разработана программа «Устой чивость матричных разностных уравнений с двумя запаздываниями», кото рая по известным собственным числам матриц, даёт заключение об ус тойчивости данного матричного уравнения. Программа выполнена в пакете 1. 0. 0. 0. 0. 0. Рис. 1.8. Графическое окно программы «Устойчивость матричных разностных уравнений с двумя запаздываниями».

MATLAB 7.11.0 (R2010b) посредством matlab APY для создания графическо го интерфейса пользователя (GUI). Исходный код программы представлен в приложении А. На программу получено авторское свидетельство [12]. В графи ческом окне программы задаем необходимые параметры запаздываний,, параметр и размерность системы. После этого нажимаем кнопку «Ввод», которая создаст необходимое количество ячеек для ввода собственных чисел матриц,. Для корректной работы необходимо вводить собственные числа матриц в том порядке, в каком они были получены в результате приведения к треугольному виду. Для получения ответа на вопрос, устойчива ли система с заданными параметрами, нажимаем на кнопку «Рассчитать». Программа про веряет каждую точку согласно алгоритму описанному выше. Если все точки лежат внутри конуса устойчивости, то программа дает ответ «система устой чива»;

если хотя бы одна лежит вне конуса устойчивости, то программа дает ответ «система неустойчива». В графическом окне программы строится конус устойчивости и точки, который можно вращать в трех плоскостях, для более наглядного представления о запасе устойчивости. Точность вычислений прог раммы обусловлена точностью вычислений конкретных функций в среде MAT­ LAB 7.11.0 (R2010b), которая не меньше чем 1016. Программа работает только для взаимно простых и. Если и не взаимно просты, то, пользуясь определением 1.5, сводим задачу к изучению системы с взаимно простыми и и используем программу для определения устойчивости данной системы.

В приложении диссертации приведены исходные коды программ для пост роения конуса -устойчивости (Приложение А), диагностирования устойчивости разностных матричных уравнений (Приложение Б) и построения областей устой чивости нейронных сетей (Приложение В). Программа Б служит для решения единичных задач по диагностированию устойчивости, с обращениями к Прог рамме А. Программа В служит тогда, когда для некоторых моделей требуется построить области устойчивости в пространстве параметров. Программа В слу жит диспетчером многократных применений Программ А, Б с использованием результатов предыдущего этапа построения границы для уточнения результатов на следующем этапе.

1.9 Сравнение результатов главы 1 с известными результатами Усилиями Ф. Даннана [43] (2004), Ю. Николаева [22, 23] (2003, 2004) и М. Кипниса совместно с Р. Нигматулиным [19, 20] (2003, 2004) была решена проблема описания области устойчивости скалярного уравнения 1.15 с двумя запаздываниями. Ранее облегченные версии уравнения 1.15 изучали Левин и Мэй [70] (1976) при = 1, = 1, ученики Г. Ладаса С. Куруклис [69](1994) и В. Папаниколау [78] (1996) при = 1 и произвольном действительном.

М. Кипнис и И. Левицкая [67] (2007) исследовали чуть более сложное скалярное уравнение, чем (1.15), а именно, уравнение = 1 + +. Здесь результаты получились не столь прозрач, = 1, 2..., ные и не столь удобные для графического представления.

Упомянем недавнюю работу исследователей из Брно [40] (2012), в которой рассматривалось уравнение = 1 + + 1, = 1, 2....

В 2005 г. пришла очередь матричного уравнения (1.31). И. Левицкая [71] (2005), следуя идеям работы Рехлицкого [24] (1956) для дифференциальных уравнений, впервые в теории разностных уравнений ввела понятие овала устой чивости для нашего основного уравнения (1.31) с = 1 и единичной матрицей. Не зная о результате Левицкой, Х. Мацунага [75] (2007) изложил результаты по устойчивости того же уравнения, только с 2 2 матрицами.

Затем Е. Каслик [57] (2009) расширила результаты Левицкой, рассматри вая проблему устойчивости для уравнения (1.31) с = 1 и скалярной матрицей =, где R, 0 1 и единичная матрица. Каслик ограничилась только указанными значениями, по-видимому, из-за технических трудностей доказательств, связанных с тем, что при 1 начало координат находится вне овала устойчивости.

Й. Диблик и Д. Хусаинов [44] (2005) рассматривали матричное уравнение (1.31) с = 1 и с добавлением возмущающего слагаемого () в правую часть. В этой работе они не интересовались задачей об устойчивости. Авторы определили некоторые модификации экспонент от матриц и через них анали тически выражали общее решение уравнения. Недавно С. Стевич, Й. Диблик и соавторы проделали ту же работу с уравнением (1.31) с 1 [82] (2012).

Отметим, что Х. Мацунага [76] (2010) изучал устойчивость очень простой 2 2 системы вида (1.31), также с = 1, с матрицами 0 =, =, 0 которые, конечно, приводятся к треугольному виду одним преобразованием, и поэтому легко анализируются методами главы 1.

Затем появилась работа М. Кипниса и В. Малыгиной [68] (2011), в которой рассматривалась проблема устойчивости матричного уравнения (1.31) с = 1. Позже в этом же году опубликована статья автора диссертации [56] (2011) совместно с научным руководителем и В. Малыгиной. Эта статья положена в основу главы 1 диссертации.

Для анализа устойчивости дифференциального уравнения с запаздывания ми в работе [66] сконструирована поверхность в R3, также называемая конусом устойчивости.

Выводы таковы. В сравнении с работами Левицкой [71] и Каслик [57] метод главы 1 применм к более широкому классу уравнений. В сравнении с работой и Кипниса и Малыгиной [68] в главе 1 шире класс уравнений (введено второе запаздывание), и, кроме того, метод диссертации позволяет диагностировать степень устойчивости систем, благодаря понятию -устойчивости. В сравнении с работами Мацунаги [75, 76] метод конусов устойчивости значительно мощнее, поскольку не ограничивает размерности задачи. Алгоритм и программа разде лов 1.6, 1.7 не имеют аналогов в литературе.

Глава Устойчивость базовых конфигураций нейронных сетей 2.1 Устойчивость нейронной сети кольцевой конфигурации 2.1.1 Постановка задачи В этом разделе мы изложим проблему -устойчивости нейронных колец (Рисунок 2.1). Нейронная сеть (, ) = (,,,, (, )) с кольцевой кон n Кольцевая нейронная сеть из нейронов Рис. 2.1.

фигурацией нейронов описывается системой разностных уравнений (2.1) = + (, ), = 1, 2,...

где вектор состояния сети в момент = 1, 2..., единичная матрица, коэффициент демпфирования собственных колебаний нейрона (|| 1), Z+ запаздывание в демпфировании. Матрица (, ) взаимодействий нейронов, запаздывающих на тактов, имеет вид 0 0... 0... 0 0 0... 0 (2.2) (, ) =...

.....

.....

.

.....

0 0 0... 0 0 0... Здесь сила воздействия нейрона на соседний нейрон по часовой стрелке, сила обратного воздействия (, R). Сходные c (2.1), (2.2) непрерывные модели изучались в работах Юан-Кемпбелл [87] (2004) и Хохловой-Кипниса [64] (2012), а дискретные — в работах Каслик-Балинта [58, 59] (2007). От моделей работ [58, 59, 87] наша модель отличается наличием различных реакций нейрона на соседние нейроны. От моделей работы [64] наша модель отличается, кроме дискретности, наличием запаздывающего демпфирования (запаздывание в системе (2.1), (2.2)) и различением степени устойчивости (параметр ).

Собственные числа циркулянтной матрицы (2.2) равны [4, 25] 2 (2.3) = exp( ) + exp( ).

Исходя из определения конуса -устойчивости 1.7, Теорем 1.3-1.4 из пункта 1. и формулы (2.3), для диагностирования -устойчивости системы (2.1) проверке подлежат точки = (1, 2, 3 ), (1 ), такие что 2 2 3 = ||. (2.4) )) · exp( arg ), 1 + 2 = ( exp( ) + exp( Таким образом, задача диагностирования -устойчивости системы (2.1) поряд ка сводится к геометрической задаче в R3 : асимптотическая -устойчивость равносильна условию, что все точки (1 ) лежат внутри конуса -устойчивости (см. Определение 1.7) для данных,,.

Множитель exp( arg ) в (2.4) ведет себя по-разному в зависимости от знака : при 0 он равен 1, при 0 он равен exp( ). Поэтому поведение кольцевой системы нейронов зависит от знака.

2.1.2 Устойчивость большой кольцевой конфигурации нейронов Обозначим в (2.4) = и будем считать действительным переменным, [0, 2). Получим непрерывную кривую () = (1 (), 2 (), 3 ()), заданную равенством (2.5) 1 () + 2 () = ( exp() + exp()) · exp( 3 = ||.

arg ), Прямым следствием теоремы 1.5 является следующая теорема.

Если все точки эллипса (2.5) лежат внутри конуса -ус Теорема 2.1.

тойчивости для данных,,, то система (2.1) асимптотически -устой чива при любом. Если хотя бы одна точка эллипса (2.5) лежит вне указан ного конуса, то система -неустойчива при достаточно больших.

0. b = 0.

= 0.

= 0.

= 0.

= 0. 0.

= 1 0.5 0 0.5 a Области устойчивости в плоскости (, ) для системы (2.1) при различных коэффициентах Рис. 2.2.

демпфирования и достаточно большом. Запаздывания = 1, = 3.

0. k= k= k= k= b k= k= k= k= 0. 0.2 0 0. a Области устойчивости системы (2.1) при различных запаздываниях и достаточно больших.

Рис. 2.3.

Коэффициент демпфирования = 0.9, = 1.

На Рисунке 2.2 указана область -устойчивости кольцевой системы нейро нов в плоскости (, ) при = 1, фиксированных запаздываниях = 3, = 1 и различных значениях. На Рисунке 2.3 показаны области -устойчивости той же системы при = 1, фиксированных = 1, = 0.9 и различных значениях запаздывания. Количество нейронов считается достаточно большим. Обла сти найдены с помощью программы, описанной в п. 1.8 диссертации. Рисунок 2.3 похож на соответствующий рисунок для непрерывной модели кольцевой системы нейронов в работе Т. Хохловой и М. Кипниса [64] (2012).

При = 1 при смене знака множитель exp( arg ) в целом не меняет эллипса (2.5), поэтому области устойчивости на рисунках не изменятся при смене знака. Как мы покажем в следующем разделе, если 1, то область устойчивости может меняться при смене знака.

Сделаем замечание об устойчивости, независимой от запаздываний (de­ lay-independent stability). Если 1, то никакое ограничение на,,, кроме тривиального = = = 0, не может обеспечить -устойчивость для всех значений запаздываний,. Объяснение этому таково. Исходя из определений конуса устойчивости 1.7 и определения основного овала 1.4, при 1, фик сированном и неограниченном росте запаздывания все основные овалы стягиваются в начало координат, a конус устойчивости стягивается в отрезок. Следовательно, в процессе,, при 1 = 0, 2 = 0, 0 дополнительном условии взаимной простоты, точки эллипса (2.5) будут всегда находиться внутри конуса -устойчивости только при = = = 0.

Но если 1, то при выполнении неравенства || + || + || система (2.1) является асимптотически -устойчивой при любых запаздываниях,.

2.1.3 Устойчивость малой кольцевой конфигурации нейронов В этом разделе мы рассмотрим кольцевые конфигурации с небольшим числом нейронов.

Аналогично теореме 2.1 справедлива следующая теорема.

Если все точки (1 ), определенные формулой Теорема 2.2.

(2.4), лежат внутри конуса -устойчивости для данных,, то система (2.1) асимптотически -устойчива. Если хотя бы одна точка лежит вне овала, то система -неустойчива.

Рассмотрим систему (2.1) для = 10, положим = 3, Пример 2.1.

= 2, = ±0.4, = 1. На Рисунке 2.4 показана локализация точек = 10), определенных посредством (2.4), и сечение конуса (1, 2, 3 ) (1 устойчивости для = 3, = 2 на уровне 3 = || = 0.4.

Области устойчивости в плоскости (, ) для кольцевой системы (2.1) для = 3, = 2, = 10, = ±0.4 показаны на Рисунке 2.5.

Пример 2.1 показывает, что при 1, так же как и при = 1, изменение знака, вообще говоря, влияет на устойчивость.

0.5 0. u 0 u 0. 0. 0.5 0 0.5 0.5 0 0. u u К Примеру 2.1. Точки (1 и сечение конуса устойчивости для = 3, = 2 на уровне Рис. 2.4. 10) = 0.4. (a) 0, (b) 0.

0. 0. 0 b b 0.5 0. 0.5 0 0.5 0.5 0 0. a a К Примеру 2.1. Области устойчивости для кольцевой системы (2.1) в плоскости (, ) для = 10, Рис. 2.5.

= 3, = 2, (a) = 0.4, (b) = 0.4.

2.2 Устойчивость нейронной сети линейной конфигурации 2.2.1 Постановка задачи Еще одной базовой конфигурацией нейронов является линейная. Линей ную конфигурацию нейронов (, ) = (,,,, (, )) можно описать системой (2.6) = + (, ), = 1, 2,...

где (, ) матрица сил запаздывающих взаимодействий нейронов:

0 0... 0 0... 0 0 0... 0 (2.7) (, ) =...

.....

.....

.

.....

0 0 0... 0 0 0 0... Здесь сила воздействия нейрона на правого соседа, сила обратного воздей ствия.

Интересно отметить, что характеристический многочлен () тридиаго нальной матрицы (, ) -го порядка связан с -м многочленом Чебышёва второго рода () формулой (см. [4]) () = ( ) ( 2 ). Поэтому собст венные числа числа, 1, матрицы (, ) хорошо известны:

(2.8) = 2 cos, 1.

+ Исходя из определения конуса устойчивости 1.7, Теорем 1.3-1.4 из пункта 1. и формулы (2.8), для диагностирования устойчивости системы (2.6) проверке подлежат точки = (1, 2, 3 ) (1 ), такие что (2.9) ) · exp( arg ), 3 = ||.

1 + 2 = (2 cos + 1 Но, очевидно, для проверки устойчивости линейной нейронной сети из точек (2.9) ключевыми являются две точки (2.10) 1 + 2 = ±(2 cos ) · exp( arg ), 3 = ||.

+ 1 Следовательно, имеет место Если обе точки (2.10) лежат внутри конуса -устойчи Теорема 2.3.

вости для данных,, то система (2.6) асимптотически -устойчива. Если хотя бы одна из двух точек лежит вне конуса, то система -неустойчива.

2.2.2 Устойчивость большой линейной конфигурации нейронов Устремляя к бесконечности в (2.10), из Теоремы 2.3 получим следующее условие устойчивости больших линейных конфигураций.

Если две точки определенные формулами 1+ (1, 2, 3 ), Теорема 2.4.

лежат внутри овала -устойчивос 2 = ±2 exp( arg ), 3 = ||, ти для данных,,, то система (2.6) асимптотически -устойчива при любом. Если хотя бы одна из указанных двух точек лежит вне конуса устойчивости, то система -неустойчива для всех достаточно больших.

В специальном, но важном случае = 1, = 1, 0 мы можем указать «коэффициентное» условие устойчивости линейной конфигурации как с ограниченным, так и с неограниченным количеством нейронов. Это зафик сировано в следующей теореме, прямом следствии Теорем 2.3, 2.4 и Теоремы 1.5.

Пусть = 1, 0.

Теорема 2.5.

1. Если 0 и (1 )2/4, то система (2.6) устойчива при любом запаздывании и любом. Если 0 и (1 )2/4, то система (2.6) неустойчива при любом запаздывании и всех достаточно больших.

2. Если 0 и || 1 2(, ), то система (2.6) устойчива при данном запаздывании и любом. Если 0 и || 4 2(, ), то система (2.6) неустойчива при данном запаздывании и всех достаточно больших. Здесь (, ) = cos(1)(), где () есть наименьший неотрицательный sin () корень уравнения = cos(1).

cos Области устойчивости системы (2.6) отражены на Рисунке 2.6.

k= k= = k b = k k= k= 1 0 a Области устойчивости системы (2.6) при = 1, = 0.4 при достаточно больших.

Рис. 2.6.

2.2.3 Устойчивость малой линейной конфигурации нейронов В этом разделе мы рассмотрим линейные конфигурации с небольшим чис лом нейронов.

Аналогично теореме 2.5 справедлива следующая теорема об устойчивости малых линейных конфигураций.

Пусть = 1, 0.

Теорема 2.6.

1. Если 0 и 4 (1), то система (2.6) устойчива при любом cos запаздывании. Если 0 и 4 (1), то система (2.6) неустойчива + cos при любом запаздывании.

+ 2. Если 0 и || 4 cos1 2(, ), то система (2.6) устойчива при данном запаздывании. Если 0 и || 4 cos1 2(, ), то система + (2.6) неустойчива при данном запаздывании. Здесь (, ) = cos(1)(), где + sin () () есть наименьший неотрицательный корень уравнения = cos(1).

cos Рассмотрим систему (2.6) для = 5, положим = 3, = 1, Пример 2.2.

= 0.4, = 1.

На Рисунке 2.7 показана локализация точек (1 5), определенных формулами (2.9), и сечение конуса устойчивости для для = 3, = 1 на уровне 3 = = 0.4.

0. 0. u u 0. 0. (a) (b) 0.5 0 0. 0.5 0 0. u u К Примеру 2.2. Точки (1 5), определенные формулами (2.9), и сечение конуса Рис. 2.7.

устойчивости для = 3, = 1 на уровне = 0.4 (овал устойчивости для = 3, = = 0.4, = 1, см. Определение 1.6): слева 0, справа 0.

На Рисунке 2.8 показано, как меняется область устойчивости для линейной конфигурации нейронов при изменении количества нейронов.

2.3 Сравнение областей устойчивости нейронных сетей кольцевой и линейной конфигураций.

Парадоксальные точки 2.3.1 Разрыв кольцевой сети В предыдущих разделах мы обращали внимание на изменение области устойчивости кольцевой и нейронной сетей при изменении параметров сетей:

количества нейронов, запаздываний,, коэффициента демпфирования.

В настоящем разделе мы намерены сравнить области устойчивости нейронной сети кольцевой конфигурации с областью устойчивости такой линейной кон n=3 n= b n= n= 1 0 a Области устойчивости системы (2.6) при = 1, = 0.4, = 2 и различных значениях.

Рис. 2.8.

фигурации нейронов, которая получается из кольцевой разрывом ее связей между, скажем, первым и последним нейроном, с сохранением прочих пара метров сети. Интерес к явлению разрыва кольца нейронов продиктован тем, что при операции лоботомии также происходит разрыв волокон в головном мозге, и также нейрохирургов интересует эффект стабилизации психики после операции.

Предварительно просмотрим результаты совместного обсчета областей ус тойчивости кольцевой и линейной конфигураций. Серия рисунков 2.9 показы вает области устойчивости кольцевой и линейной нейронной сети при фиксации запаздываний = 1, = 3. В первой строке рисунков 2.9 коэффициент демпфирования мал и положителен( = 0.2), во второй велик и положителен ( = 0.8), в третьей мал и отрицателен ( = 0.2), в четвертой велик по модулю и отрицателен ( = 0.8). Все рисунки в первом столбце рисунков 2. количество нейронов = 3, во втором и следующих столбцах = 4, 5, 6, 7.

Мы ожидаем, что при разрыве кольцевой сети и переходе ее в линейную области устойчивости в пространстве параметров получат приращение. Объя 1 1 1 1 0 0 0 0 b 1 1 1 1 0 1 1 0 1 1 0 1 1 0 1 0 a a a a a 1 1 1 1 0 0 0 0 b 1 1 1 1 1 0 1 1 0 1 1 0 1 1 0 1 1 0 a a a a a 1 1 1 1 0 0 0 0 b 1 1 1 1 1 0 1 1 0 1 1 0 1 1 0 1 1 0 a a a a a 1 1 1 1 0 0 0 0 b 1 1 1 1 1 0 1 1 0 1 1 0 1 1 0 1 1 0 a a a a a Рис. 2.9. Границы областей устойчивости в плоскости параметров кольцевой (2.1) (, ) (синий цвет) и линейной (2.6) (черный цвет) нейронных сетей при фиксированных запаздываниях В первой строке коэффициент демпфирования во = 1, = 3. = 0.2, = 0.2, = 0.8.

второй в третьей в четвертой В первом столбце количество = 0.8, нейронов во втором и следующих = 3, = 4, 5, 6, 7.

сняется это тем, что в кольцевой сети возмущение циркулирует по кольцу, в то время как в линейной оно, благодаря демпфированию, может успешно погаситься. Серия рисунков 2.9 в принципе подтверждают это. Однако, при некоторых значениях параметров разрыв кольцевой сети, наоборот, приводит к потере устойчивости. В серии рисунков 2.9 этот эффект хорошо виден при = и = ±0.8 и проявляется едва заметно при = 6 и любых. Этот эффект полностью отсутствует при = 3 и = ±0.2, а также при = 4 и любом. Для = 5, 7 по рисункам 2.9 трудно понять, существуют ли значения параметров (, ), при которых кольцевая система устойчива, а линейная неустойчива. Это прояснится в дальнейшем благодаря Теореме 2.7.

Вышеуказанные соображения оправдывают введение следующего опреде ления.

Назовем точку (, ) парадоксальной в кольцевой сети Определение 2.1.

(2.1) при данных,,, если кольцевая сеть (2.1) при данных,,,, асимптотически устойчива, а линейная (2.6) при тех же,,,, неустойчива.

Определение иллюстрируем Рисунком 2.10.

= 1, 2.3.2 Условия существования парадоксальных точек при Мы намерены в этом разделе указать условия существования парадок сальных точек. Для этого нам понадобятся две технические леммы. Первая из них использует тот факт, что при, по модулю достаточно близком к 1 (но меньшем 1), сечение конуса устойчивости на уровне || существенно отличается от окружности радиуса 1 ||. Вторая лемма использует то, что при, дос таточно близком к 0, сечение конуса устойчивости на уровне || похоже на окружность радиуса 1 ||.

Для любого натурального, для любого 1 найдется такое Лемма 2.1.

0 (0, 1), что при любом (0 ;

1) из неравенства (1 ||) (2.11) 1 cos 2+ следует, что точка = (1, 0, ||) лежит внутри овала устойчивости для данного, для = 1.

Рассмотрим овалы устойчивости (см. определение 1.6 и ри Доказательство.

сунки 1.4a) на различных высотах 3 = (0, 1). Положим 2 = 0 и получим, b - -1 0 a Рис. 2.10. К Определению 2.1. Границы областей устойчивости в плоскости параметров (, ) кольцевой (2.1) (синий цвет) и линейной (2.6) (черный цвет) нейронных сетей. Параметры Область парадоксальных точек закрашена красным цветом.

(,,, ) = (0.8, 3, 1, 3).

что внутри овала устойчивости будут разные интервалы значений 1 : от интер (1) вала (1, 1) на уровне = 0 до интервала (cos 21 cos на уровне 21, 0) = 1, причем левые границы этих интервалов отрицательны и монотонно уве личиваются при увеличении от нуля до единицы. Поскольку 1 0 при 1, найдется такое 0, что при (0, 1) выполнение неравенства (2.11) гарантирует попадание точки = (1, 0, ||) внутрь конуса устойчивости.

Для любого натурального, для любого 1 найдется такое Лемма 2.2.

1, что при любом (1, 1 ) из того, что точка = (1, 2, ||) лежат внутри конуса устойчивости, следует что 1 || (2.12) |1 |.

cos 2+ При = 1 овал устойчивости на уровне = 0 является Доказательство.

окружностью радиуса 1. Поэтому при достаточно малом все точки внутри конуса устойчивости на уровне будут удовлетворять неравенству 2.12.

Следующая теорема дает условия существования парадоксальных точек при = 1, 1.

Пусть = 1.

Теорема 2.7.

1. Если делится на 4, то парадоксальные точки в сети (2.1) не существуют ни при каких 1,.

2. Если четно, но не делится на 4, то парадоксальные точки в сети (2.1) существуют при любых,, таких что 1, || 1.

3. Если нечетно, то для любого запаздывания 1 найдется 0 (0;

1), такое что для любого, удовлетворяющего условию 0 || 1, парадок сальные точки в сети (2.1) существуют.

4. Если нечетно, то для любого запаздывания 1 найдется 1 (0;

1), такое что для любого, удовлетворяющего условию 0 || 1, парадок сальные точки в сети (2.1) не существуют.

Согласно Теореме 1.4 введем точки = (,, ) и Доказательство. 1 2 ), такие что = (,, ), (1 1 2 2 1 + 2 = (( + ) cos ) exp( arg ), 3 =, (2.13) + ( ) sin exp( arg ), =. (2.14) 1 + 2 = 2 cos + 1. Пусть = 4, Z+. Если 0, то из (2.13), (2.14) имеем = 0 при любом (1 ), = 0, поэтому ввиду неравенства | | 2 || имеем |2 | = | | = max | |.

(2.15) 2 || cos + 1 Если 0, то = 0 при любом (1 ) и |1 | = | + | 2 cos = max | |. (2.16) + 1 Из (2.15),(2.16), учитывая звездность конусов устойчивости, получаем, что если все точки находятся внутри овала устойчивости, то все точки также лежат внутри овала устойчивости. Асимптотическая устойчивость кольцевой конфигурации гарантирует асимптотическую устойчивость линейной конфигу рации. На плоскости параметров парадоксальных точек нет. Первый пункт теоремы доказан. Второй столбец серии рисунков 2.9 иллюстрирует этот пункт.

2. Пусть = 4 + 2, Z+. Найдем парадоксальную точку (, ) при 0.

Положим = в (2.13) и (2.14). Тогда = = 0. Исходя из того, что 1 2 2 2(3 + 1) = sin = min sin max sin = sin = cos, 4 + 2 4 + 2 4 + 2 4 + 2 4 + из (2.13) и (2.14) имеем min = max = 2 cos = max 2 = min 2.

2 cos 2 4 + 3 4 + (2.17) Ввиду (2.17) и (2.13), (2.14), учитывая звездность конусов устойчивости, при любых, при условии || 1 можно подобрать такое 0, что точка находится вне конуса устойчивости, а все точки (1 ) находятся внутри. Таким образом точка (, ) является парадоксальной. Второй пункт теоремы доказан. К этому пункту относится четвертый столбец серии рисунков 2.9.

3. Пусть = 2 + 1, Z+. Согласно Лемме 2.1 подберем такое 0 (0;

1), что при 0 1 выполняется неравенство (2.11).

3.1. Пусть 0 1. Докажем наличие парадоксальной точки (, ) при некотором 0. Положив = в (2.13) и (2.14), получим = = 0. Из 2 2 того, что min cos 2+1 = cos 2+1, 0, имеем 2 2 max 1 = max 2 cos (2.18) = 2 cos = 2|| cos, 2 + 1 2 + 1 2 + 1 max = max 2|| cos max 1. (2.19) = 2|| cos 2 + 2 2 + 2 1 Пусть удовлетворяет неравенству 1 (2.20) ||.

2 cos 2+2 2 cos 2+ Из (2.20) и (2.19), (2.18) вытекает max 1 max 1. (2.21) 1 Точка (, ) является парадоксальной. Действительно, при данных значениях, ввиду (2.21) следует, что все точки с положительными первыми коорди натами лежат внутри конуса устойчивости, а хотя бы одна точка с положи тельными первыми координатами лежит вне конуса устойчивости. Линейная конфигурация, таким образом, неустойчива при рассмотренных параметрах.

Для выяснения расположения точек с отрицательными первыми коор динатами проведем выкладки с учетом (2.13), (2.20) и (2.11):

(1 ) min 1 = 2 (2.22).

cos 2+ Неравенство (2.22) гарантирует устойчивость кольцевой сети, что завершает доказательство.

3.2. Пусть (1) 0. При четных значениях в формулах (2.13), (2.14) множитель exp( arg ) равен 1, поэтому рассуждения пункта 3.1 могут быть повторены. При нечетных значениях в формулах (2.13), (2.14) exp( arg ) = 1, поэтому здесь заключение теоремы получается аналогично пункту 3.1, с той разницей, что существуют парадоксальные точки (, ) при 0.

4. Пусть = 2 + 1, Z+. Согласно Лемме 2.2 подберем такое 1, что при (1, 1 ) выполняется неравенство (2.12). Пусть кольцевая конфигурация асимптотически устойчива.

4.1. Рассмотрим случай 0. Учитывая (2.12):

1 || |1 | = | + | (2.23).

cos 2+ Но из (2.14) и (2.23) получаем:

max | | = 2 || cos (2.24) | + | cos 1 ||.

2 + 1 2 + Из (2.24) следует, что линейная конфигурация асимптотически устойчива. 4.2.

Рассмотрим случай 0. Тогда из (2.12) имеем:

max |2 | = | | cos (2.25) | |.

2 + Остальная часть доказательства аналогична пункту 4.1. с использованием не равенства | | 2 || вместо | + | 2 ||.

Теорема доказана.

2.3.3 Зависимость наличия парадоксальных точек от числа нейронов, запаздывания и коэффициента демпфирования Теорема 2.7 утверждает, что для любых нечетных, любых = существуют положительные константы 0, 1 (0, 1), такие что из условия 0 1 следует существование парадоксальных точек, а из условия 0 1 следует отсутствие парадоксальных точек в системе (2.1).

Численные эксперименты показывают, что 0 = 1, но нам не удалось это доказать. Аналогичное явление имеет место при отрицательных коэффициен тах демпфирования. Чтобы выяснить зависимость наличия парадоксальных точек от (в случае нечетного ), от запаздывания 1 и от коэффициента демпфирования, автор проделал серию экспериментов. Для = 1, для данно го 1 в экспериментах мы искали две функции () и (), определенные на нечетных натуральных, такие что при () 1 и при 1 () парадоксальные точки в системе (2.1) при данных, существуют, а при () () парадоксальные точки не существуют. Результаты численных экспериментов отображены на Рис. 2.11.

paradoxical points exist k= 0.5 k= k= 0 paradoxical points do not exist k= k= 0. k= paradoxical points exist 3 5 7 9 n Рис. 2.11. Граничные значения коэффициентов демпфирования и, при переходе через которые появляются и исчезают парадоксальные области в плоскости параметров в сетях с нечетным количеством нейронов.

= 1, = 2.3.4 Условия существования парадоксальных точек при В следующей теореме мы опишем условия существования парадоксальных точек при = 1, = 1. Здесь метод конусов устойчивости неприменим, и мы воспользуемся традиционным анализом собственных чисел матриц.

Пусть = 1, = 1.

Теорема 2.8.

1. Если делится на 4, то парадоксальные точки не существуют ни при каких.

2. Если не делится на 4, то парадоксальные точки существуют при любых (1, 1).

Матрица + 1 (см. 2.2) для уравнения кольцевой конфи Доказательство.

гурации 2.1 и матрица +2 (см. (2.7)) для уравнения линейной конфигурации 2.6 имеют собственные числа соответственно 2 = + ( + ) cos (2.26) + ( ) sin,1, = + 2 cos (2.27),1.

+ 1. Пусть = 4, Z+. Если 0, то ввиду неравенства | | 2 || имеем max | | | | = | + ( )| | = max | |.

(2.28) | + 2 || cos + 1 Если 0, то имеет место неравенство max | | max(|4 |, |2 |) = || + | + | || + 2 cos = max | |.

+ 1 1 (2.29) Из (2.28),(2.29) следует, что если все точки находятся внутри круга еди ничного радиуса, то все точки также лежат внутри этого круга. Асимпто тическая устойчивость кольцевой конфигурации гарантирует асимптотическую устойчивость линейной конфигурации. На плоскости параметров парадок сальных точек нет.

2. Пусть не делится на 4.

СЛУЧАЙ 2.1: = 4+2, Z+. Найдем парадоксальную точку (, ). Исходя 2 2 из того, что max sin 4+2 = sin 4+2 = cos 4+2, из (2.26), (2.27) и = имеем max | | = | + 2 cos | = max | |. (2.30) | | + 2 cos 4 + 2 4 + 1 Ввиду (2.30) для любого (1, 1) можно подобрать такое, что max | | 1, max | | 1. Такие точки (, ) являются парадоксальными. Заметим, что парадоксальными могут быть точки (, ) как при 0, так и при 0.

СЛУЧАЙ 2.2: = 2 + 1, Z+. Докажем наличие парадоксальной точки (, ).

СЛУЧАЙ 2.1.1: (0, 1). При = 0 из (2.26) и (2.27) и того, что 2 min cos 2+1 = cos 2+1, имеем max | | = || + 2|| cos = max | |. (2.31) || + 2|| cos 2 + 2 1 2 + Далее доказательство существования парадоксальных точек заканчивается как в случае 2.1.

СЛУЧАЙ 2.1.2: (1, 0). Здесь также выполняется неравенство (2.31), но только при = 0, и доказательство существования парадоксальных точек заканчивается так же, как в случае 2.1. Теорема доказана.

В численных экспериментах выясняется, что области парадоксальных точек, если они существуют, становятся едва заметными при больших значениях.

Это подтверждается теоремой 3.12 главы 3 диссертации, в которой, в отличие от предыдущих рассмотрений, может быть больше 1, и речь идет не только об устойчивости, но и о -устойчивости для любого положительного.



Pages:   || 2 | 3 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.