Мегаобучалка Главная | О нас | Обратная связь


Постановка и формализация задач оптимального преследования и уклонения летательных аппаратов



2019-08-13 169 Обсуждений (0)
Постановка и формализация задач оптимального преследования и уклонения летательных аппаратов 0.00 из 5.00 0 оценок




7.2.1. Краткая характеристика противодействующих объектов
и множеств допустимых управлений

Противодействующими аэродинамическими объектами являются летательный аппарат-перехватчик P и летательный аппарат-цель E. Параметры и координаты перехватчика будут записываться с индексом «Р», а цели – с индексом «Е». В задаче преследования P является союзником, а E – противником.

Известно [143], что для воздействия на величину скорости полета необходимо изменить тангенциальную силу, действующую на ЛА в направлении движения, а для изменения направления полета необходимо приложить к ЛА силу, перпендикулярную вектору скорости, т.е. нормальную силу. Диапазон располагаемых нормальных перегрузок современных целей и ракет-перехватчиков на этапе наведения на порядок шире диапазона располагаемых тангенциальных перегрузок. Это позволяет сделать вывод об эффективности использования нормальных перегрузок для решения типовых задач преследования и уклонения. Поэтому в качестве вектора управления  принимается вектор нормальной перегрузки .

Для P рассматриваются два возможных способа управления: «управление в полярных координатах» для летательных аппаратов обычной самолетной схемы и «управление в декартовых координатах» для летательных аппаратов с крестообразным крылом.

Для создания нормальной перегрузки требуемой величины  и требуемого направления  в обычной самолетной схеме (с крыльями, расположенными в одной плоскости) используются угол атаки  и угол крена  («управление в полярных координатах»). Поскольку между  и , а также  и  существуют определенные связи, то вектор  характеризуется величиной нормальной перегрузки  и углом , задающим положение  в плоскости, ортогональной вектору скорости  (рис. 7.7).

Базой для отсчета угла  является вертикальная плоскость. Таким образом, вектор управления имеет вид

                                                                                                (7.34)

Множество допустимых управлений  является кругом плоскости, ортогональной вектору , и определяется следующим образом (рис. 7.8):

                                                        .                                                  (7.35)

Угол  неограничен и его требуемое значение всегда можно найти в диапазоне . Предполагается, что влияние угла скольжения  несущественно и им можно пренебречь.

Рис. 7.7. Введенные системы координат Рис. 7.8. Допустимое множество

Для создания нормальной перегрузки требуемой величины и требуемого направления у ЛАi с крестообразным крылом используются угол атаки  и угол скольжения . Поскольку между  и , а также между и  существуют определенные связи, то вектор  создается в результате геометрического сложения перегрузок  и , формируемых в двух взаимно-перпендикулярных плоскостях («управление в декартовых координатах»). Вектор управления имеет вид

                                                                                              (7.36)

где

При этом накренение ЛА уже не требуется. Более того, предполагается, что угол крена жестко стабилизирован и равен нулю.

Для того чтобы использовать математическое описание вектора управления в виде (7.36) для ЛАi с управлением в «полярных координатах», необходимо определить  по следующим соотношениям:

                                                   ,                                            (7.37)

                                                   .                                             (7.38)

Тогда множество допустимых управлений  вида (7.35) будет определяться

                                                       ,                                                 (7.39)

где символ  обозначает евклидову норму, т.е.

                                               .                                         (7.40)

В качестве ЛА-противника будет всегда рассматриваться объект, для которого известно ограничение на нормальную к вектору скорости  перегрузку. Поэтому и для ЛА-противника вектор управления имеет вид (7.36), а множество допустимых управлений имеет вид (7.39).

Если длительность этапа управляемого движения невелика, то множества допустимых управлений (множества располагаемых перегрузок)  изменяются незначительно и этими изменениями можно пренебречь.

Алгоритмы преследования и уклонения являются позиционными
«в обратных связях», поэтому возмущения, возникающие в системе PE из-за неидеальной работы системы стабилизации ЛА-союзника и возможного неоптимального поведения ЛА-противника, учитываются при формировании закона управления.

7.2.2. Уравнения движения

Вводятся в рассмотрение следующие системы координатных осей (рис. 7.7):

·  – нормальная земная система координат (СК), центр которой зафиксирован произвольным образом;

·  – нормальная подвижная СК, центр которой совпадает с центром масс Р, а оси параллельны осям нормальной земной СК;

·  – определяется аналогично . Центр совпадает с центром масс Е.

·  – траекторная подвижная СК, центр которой совпадает с центром масс P, ось  лежит в вертикальной плоскости и может служить для отсчета величины , а ось , лежащая в горизонтальной плоскости ( ), образует с осями  и  правую систему;

·  – определяется аналогично СК , но для Е;

·  – земная неподвижная СК, центр которой с положением центра масс Р в начальный момент времени , а оси совпадают с осями траекторной СК ;

·  – определяется аналогично СК , но для E.

Координаты центров масс E и P в системе  задаются как  – для P и  – E. Положение СК  относительно  задается углами  и .

Углы  являются углами наклона траекторий ЛА, а  – углами поворота траекторий ЛАi ( i = Р,Е).

Положение точки  относительно  задается параметрами . Положение точки  относительно  задается параметрами  (на рис. 7.7 не показаны ).

Движение центров масс P и E в системе координат  описывается системой нелинейных дифференциальных уравнений [143]:

                                                                          (7.41)

где  – ускорение свободного падения;  – скорость ЛА.

Вектор управления ЛАi является двумерным

Ограничение на управление имеет вид (7.39) или (7.36).

При активном маневрировании E на малой высоте полета возможно столкновение с Землей, поэтому необходимо формировать закон управления  с учетом требования

                                                                                                            (7.42)

Предполагается, что высота полета P всегда положительна и поэтому подобное ограничение на движение P не накладывается.

7.2.3. Критерии управления

Вектором координат ЛАi в СК  будем называть

                                                                                   (7.43)

Вектором позиции ЛАi в СК будем называть

                                                                  (7.44)

где  – вектор скорости ЛАi, а Vi – модуль скорости ЛАi.

Множество позиционных стратегий ЛАi обозначается

                                                                                        (7.45)

Множество программных стратегий ЛАi обозначается

                                                                                                      (7.46)

Предполагается, что ЛА-союзнику в каждый момент управляемого движения  точно известны векторы позиций и множества допустимых управлений P и E. Процесс принятия решения от замера позиций до выдачи оптимального управления осуществляется мгновенно. Способы определения векторов позиций рассматриваются ниже.

Расстояние между P и E обозначается

                                                                              (7.47)

Пусть управляемое движение системы (7.41) началось в некоторый момент времени  , и зона перехвата P имеет радиус действия L.

Тогда целью управления P является обеспечение в некоторый момент времени  условия

                                                                                           (7.48)

которое называется L-встречей, при этом E стремится не допустить выполнения условия (7.48).

Введем критерии управления.

1. Пусть  – момент времени, когда выполняется условие (рис. 7.9)

                                                  .                                            (7.49)

Конечный промах  определим следующим образом:

                                                                                      (7.50)

Тогда в качестве первого критерия управления принимается

                                                                                   (7.51)

Рис. 7.9. Минимальный промах и время до L-встречи

Таким образом, P стремится достичь минимально-возможного конечного промаха h, а E – наоборот, стремится увеличить конечный промах, причем никаких дополнительных условий на момент  конечного промаха не накладывается.

2. Пусть  – момент времени, когда впервые выполняется условие (7.48) (рис. 7.9), где

                                                                                                    (7.52)

То есть

                                            .                                      (7.53)

P стремится обеспечить выполнение условия (7.48), причем за минимальное время, а E стремится не допустить L-встречи (7.48) или хотя бы отдалить ее во времени. Поэтому в качестве второго критерия управления принимается

                                         .                                   (7.54)

Следует заметить, что момент существует всегда, поскольку для каждой пары траекторий P и E всегда найдется момент времени, когда расстояние (7.47) между ними минимально. Момент существует только в том случае, если выполняется условие (7.48), а если  – единственный, то .

Сформулируем задачи преследования и уклонения в соответствии с введенными критериями  (7.51) и  (7.54).

Задача 1: . В классе позиционных стратегий  требуется найти оптимальное управление , удовлетворяющее условию

                                (7.55)

и условию (7.42), какими бы ни были начальные позиции объектов.

Вектора управления  являются двумерными

                                          .                                    (7.56)

Допустимые множества управлений задаются в виде (7.39)

                                               .                                         (7.57)

Задача 1: . Формулируется аналогично задаче 1: , но вместо критерия  используется критерий  (7.54).

Задача 2: . В классе позиционных стратегий  требуется найти оптимальное управление , удовлетворяющее условию

                                (7.58)

и условию (7.42), какими бы ни были начальные позиции объектов. Вектора управления являются двумерными

                                          .

Допустимые множества управлений задаются в виде (7.39).

Задача 2: . Формулируется аналогично задаче 2: , но вместо критерия  используется критерий  (7.54).

7.2.4. Анализ условий существования равновесия
(седловой точки)

Приведенное ниже доказательство базируется на приведенных в п. 7.1.1 теоремах существования равновесия. В антагонистической дифференциальной игре имеет место равенство

                      ,                (7.59)

если оптимальные управления ,  доставляют седловую точку [129, 242].

Соотношение (7.59) соответствует выполнению равенства

                                                                    (7.60)

где – функция Гамильтона для данной игры.

В случае терминального показателя (7.51) , гамильтониан имеет вид

                                                                        (7.61)

где – сопряженный вектор,  – векторная запись уравнений (7.51).

Поскольку движение всей системы (7.41) есть две отдельные траектории P и E (т.е. уравнения, описывающие движения одного объекта, не зависят от вектора управлений другого), то уравнение (7.61) представимо в виде (7.62)

                   .             (7.62)

Поскольку  явно зависит только от , а  – только от , то

                        ;                  (7.63)

                        .                  (7.64)

Таким образом,

         ;   (7.65)

         .   (7.66)

Поскольку правые части уравнений (7.65) и (7.66) равны друг другу и выполняется условие «разделения» (см. замечание 4 в утв. 7.2) и, кроме того, объекты однотипны [98, 129], то, в случае , имеет место седловая точка.

При интегральном показателе (7.54)  Гамильтониан имеет вид

                                    .                              (7.67)

Повторяя выкладки (7.62), можно показать, что в случае интегрального критерия также имеет место седловая точка.

Оптимальные стратегии , , доставляющие седловую точку (7.59), обладают тем свойством, что P (E) невыгодно отклоняться от оптимальной стратегии  ( ), поскольку при таком отклонении выигрыш E (P) только увеличится, а собственный выигрыш уменьшится. Кроме того, оптимальные стратегии  и  являются устойчивыми по отношению к получаемой информации об используемой противником стратегии.

Свойство (7.59) означает, что решение задач преследования может быть получено из известного решения задач уклонения (и наоборот).

Если заменить множества на  (или любое другое), а  на  (или любое другое), то свойство (7.59) принимает вид

                      .                (7.68)

Свойство (7.68) будет использовано в дальнейшем.

7.3. Оценка области достижимости центра масс
летательного аппарата со стационарным множеством допустимых управлений

7.3.1. Общая характеристика способа оценки
области достижимости

Область достижимости  в момент времени  из начальной точки  и начального момента  определяется как множество значений вектора координат  в момент времени , полученные при всевозможных допустимых законах управлениях  и начальном условии . Динамика области достижимости (ОД) может быть описана динамикой ее границ [193]. Граница ОД определяется траекториями предельного быстродействия [118, 193]. Если движение исследуемого объекта описывается линейной системой уравнений, то существуют относительно простые способы построения границы ОД с использованием фундаментальной матрицы решений [118, 129]. Эта методика существенно использует выпуклость ОД линейных систем. Для нелинейных систем свойство выпуклости ОД, в общем случае, не имеет места. Поэтому для них задача определения границ ОД, или граничных управлений (т.е. приводящих на границу ОД), может быть сформулирована в следующем виде [118, 264]. Необходимо в пространстве координат  каким-либо образом задать направление , например, задав прямую, проходящую через начальное положение центра масс ЛА  и некоторую другую точку  этого пространства (рис. 7.10), и решить две отдельные задачи:

1) найти управление, максимизирующее расстояние , пройденное объектом за фиксированное время в направлении ;

2) найти управление, минимизирующее расстояние , пройденное объектом за фиксированное время  в направлении .

Рис. 7.10. Задача достижения экстремума расстояния в направлении   за фиксированное время Т Рис. 7.11. Поточечная оценка ОД

Варьируя направлением  в пространстве координат и каждый раз решая эти две поставленные задачи, можно сделать поточечную [193] оценку ОД для фиксированного  (рис. 7.11).

При решении обеих задач весьма желательно выявить структурные свойства оптимального в смысле общих критериев (max  и min ) управления, не зависящие от конкретного направления  и времени . Знание структуры граничного управления существенно упрощает определение границ ОД в фиксированный момент времени . Заметим, что решению задачи минимизации  соответствует управление со структурными свойствами предельного быстродействия, а решению задачи максимизации  – в общем случае, некоторая другая структура управления, которую также необходимо определить.

Рассмотрим кратко вопрос существования оптимальных управлений в рамках данных задач.

В общем случае существуют такие направления , , для которых вообще не найдется никаких управлений, удовлетворяющих краевым условиям за фиксированное время . Также возможна ситуация, когда существует единственное допустимое управление.

В этом случае оно является решением для обеих задач (см. , ). Наконец, существуют такие направления (от  до ), для которых допустимое управление не единственно. Тогда решения поставленных задач существуют и совпадать не могут.

Формирование управляющего воздействия  или  в каждый момент управляемого движения  основывается на гипотезе посто-
янcтва скорости  обоих объектов в прогнозируемом времени  на программном такте ПКЗУ , где , т.е. , но вектор скорости изменяется.

Кроме того, величина скорости изменяется при изменении программного такта.

Поэтому структуры граничного управления объекта, определяющие поточечную оценку границ , должны быть найдены с учетом этой гипотезы. Таким образом, динамика центра масс ЛА с постоянной скоростью движения  в нормальной земной СК  описывается дифференциальными уравнениями

    (7.69)

Рис. 7.12. Области суб- и супер-достижимости Рис. 7.13. Новые множества допустимых управлений

Используя подход [183, 258], определим понятия субдостижимости , супердостижимости  следующим образом:

                                            .                                      (7.70)

Здесь  – область достижимости объекта (7.69). Таким образом, субдостижимость  оптимально оценивает ОД ЛА  снизу и дает гарантированную оценку того, что  заведомо не меньше, чем .

Супердостижимость  оптимально оценивает ОД ЛА  сверху и дает гарантированную оценку того, что  заведомо не больше, чем  (рис. 7.12). На рис. 7.12  – символ границы области .

Учитывая минимаксный или максиминный характер решаемых задач, для игрока-союзника необходимо использовать оценку снизу – субдостижимость , а для игрока-противника – использовать оценку сверху – супердостижимость .

Проведем анализ системы (7.69), учитывая, что:

                                                     ;                                               (7.71)

                                                                                                        (7.72)

Располагаемая перегрузка  определяет максимально возможную, нормальную к скорости , перегрузку, действующую на ЛА в процессе полета при отсутствии ускорения свободного падения . Оно изменяет максимально возможную нормальную перегрузку на величину :

                                                    ,                                              (7.73)

причем

                                                     .                                              (7.74)

Введем обозначение (рис. 7.15)

                                                      ;                                                (7.75)

                                                      ,                                                (7.76)

тогда

или

                                                                                                      (7.77)

Таким образом, в процессе полета максимально возможная действующая на ЛА нормальная перегрузка будет не меньше величины  (оценка снизу), но и не больше величины  (оценка сверху). Это позволяет получить новое математическое описание движения центра масс ЛА для определения его суб- и супердостижимости, которое в нормальной земной неподвижной СК  имеет следующий вид:

            (7.78)

Ограничения на управление имеют вид

                                                                                                            (7.79)

и

                                                                                                              (7.80)

– для определения субдостижимости, или

                                                                                                              (7.81)

– для определения супердостижимости.

Необходимо отметить, что описание в виде (7.69) будет справедливым для любой неподвижной СК (в том числе и для , поскольку сила тяжести в уравнениях отсутствует (но ее действие учтено в ограничениях (7.80) и (7.81)).

Направление  однозначно определяется прямой ( ). Координаты точки  в СК  обозначим , , .

Введем угол , определяемый согласно

                                                   = .                                              (7.82)

Введем дополнительные СК (рис. 7.14, 7.15):

·  – неподвижная земная СК, задаваемая поворотом системы  вокруг оси  на угол ;

·

2019-08-13 169 Обсуждений (0)
Постановка и формализация задач оптимального преследования и уклонения летательных аппаратов 0.00 из 5.00 0 оценок









Обсуждение в статье: Постановка и формализация задач оптимального преследования и уклонения летательных аппаратов

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Почему человек чувствует себя несчастным?: Для начала определим, что такое несчастье. Несчастьем мы будем считать психологическое состояние...
Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ...
Модели организации как закрытой, открытой, частично открытой системы: Закрытая система имеет жесткие фиксированные границы, ее действия относительно независимы...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (169)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.009 сек.)