Постановка и формализация задач оптимального преследования и уклонения летательных аппаратов
7.2.1. Краткая характеристика противодействующих объектов Противодействующими аэродинамическими объектами являются летательный аппарат-перехватчик P и летательный аппарат-цель E. Параметры и координаты перехватчика будут записываться с индексом «Р», а цели – с индексом «Е». В задаче преследования P является союзником, а E – противником. Известно [143], что для воздействия на величину скорости полета необходимо изменить тангенциальную силу, действующую на ЛА в направлении движения, а для изменения направления полета необходимо приложить к ЛА силу, перпендикулярную вектору скорости, т.е. нормальную силу. Диапазон располагаемых нормальных перегрузок современных целей и ракет-перехватчиков на этапе наведения на порядок шире диапазона располагаемых тангенциальных перегрузок. Это позволяет сделать вывод об эффективности использования нормальных перегрузок для решения типовых задач преследования и уклонения. Поэтому в качестве вектора управления принимается вектор нормальной перегрузки . Для P рассматриваются два возможных способа управления: «управление в полярных координатах» для летательных аппаратов обычной самолетной схемы и «управление в декартовых координатах» для летательных аппаратов с крестообразным крылом. Для создания нормальной перегрузки требуемой величины и требуемого направления в обычной самолетной схеме (с крыльями, расположенными в одной плоскости) используются угол атаки и угол крена («управление в полярных координатах»). Поскольку между и , а также и существуют определенные связи, то вектор характеризуется величиной нормальной перегрузки и углом , задающим положение в плоскости, ортогональной вектору скорости (рис. 7.7). Базой для отсчета угла является вертикальная плоскость. Таким образом, вектор управления имеет вид (7.34) Множество допустимых управлений является кругом плоскости, ортогональной вектору , и определяется следующим образом (рис. 7.8): . (7.35) Угол неограничен и его требуемое значение всегда можно найти в диапазоне . Предполагается, что влияние угла скольжения несущественно и им можно пренебречь.
Для создания нормальной перегрузки требуемой величины и требуемого направления у ЛАi с крестообразным крылом используются угол атаки и угол скольжения . Поскольку между и , а также между и существуют определенные связи, то вектор создается в результате геометрического сложения перегрузок и , формируемых в двух взаимно-перпендикулярных плоскостях («управление в декартовых координатах»). Вектор управления имеет вид (7.36) где При этом накренение ЛА уже не требуется. Более того, предполагается, что угол крена жестко стабилизирован и равен нулю. Для того чтобы использовать математическое описание вектора управления в виде (7.36) для ЛАi с управлением в «полярных координатах», необходимо определить по следующим соотношениям: , (7.37) . (7.38) Тогда множество допустимых управлений вида (7.35) будет определяться , (7.39) где символ обозначает евклидову норму, т.е. . (7.40) В качестве ЛА-противника будет всегда рассматриваться объект, для которого известно ограничение на нормальную к вектору скорости перегрузку. Поэтому и для ЛА-противника вектор управления имеет вид (7.36), а множество допустимых управлений имеет вид (7.39). Если длительность этапа управляемого движения невелика, то множества допустимых управлений (множества располагаемых перегрузок) изменяются незначительно и этими изменениями можно пренебречь. Алгоритмы преследования и уклонения являются позиционными 7.2.2. Уравнения движения Вводятся в рассмотрение следующие системы координатных осей (рис. 7.7): · – нормальная земная система координат (СК), центр которой зафиксирован произвольным образом; · – нормальная подвижная СК, центр которой совпадает с центром масс Р, а оси параллельны осям нормальной земной СК; · – определяется аналогично . Центр совпадает с центром масс Е. · – траекторная подвижная СК, центр которой совпадает с центром масс P, ось лежит в вертикальной плоскости и может служить для отсчета величины , а ось , лежащая в горизонтальной плоскости ( ), образует с осями и правую систему; · – определяется аналогично СК , но для Е; · – земная неподвижная СК, центр которой с положением центра масс Р в начальный момент времени , а оси совпадают с осями траекторной СК ; · – определяется аналогично СК , но для E. Координаты центров масс E и P в системе задаются как – для P и – E. Положение СК относительно задается углами и . Углы являются углами наклона траекторий ЛА, а – углами поворота траекторий ЛАi ( i = Р,Е). Положение точки относительно задается параметрами . Положение точки относительно задается параметрами (на рис. 7.7 не показаны ). Движение центров масс P и E в системе координат описывается системой нелинейных дифференциальных уравнений [143]: (7.41) где – ускорение свободного падения; – скорость ЛА. Вектор управления ЛАi является двумерным Ограничение на управление имеет вид (7.39) или (7.36). При активном маневрировании E на малой высоте полета возможно столкновение с Землей, поэтому необходимо формировать закон управления с учетом требования (7.42) Предполагается, что высота полета P всегда положительна и поэтому подобное ограничение на движение P не накладывается. 7.2.3. Критерии управления Вектором координат ЛАi в СК будем называть (7.43) Вектором позиции ЛАi в СК будем называть (7.44) где – вектор скорости ЛАi, а Vi – модуль скорости ЛАi. Множество позиционных стратегий ЛАi обозначается (7.45) Множество программных стратегий ЛАi обозначается (7.46) Предполагается, что ЛА-союзнику в каждый момент управляемого движения точно известны векторы позиций и множества допустимых управлений P и E. Процесс принятия решения от замера позиций до выдачи оптимального управления осуществляется мгновенно. Способы определения векторов позиций рассматриваются ниже. Расстояние между P и E обозначается (7.47) Пусть управляемое движение системы (7.41) началось в некоторый момент времени , и зона перехвата P имеет радиус действия L. Тогда целью управления P является обеспечение в некоторый момент времени условия (7.48) которое называется L-встречей, при этом E стремится не допустить выполнения условия (7.48). Введем критерии управления. 1. Пусть – момент времени, когда выполняется условие (рис. 7.9) . (7.49) Конечный промах определим следующим образом: (7.50) Тогда в качестве первого критерия управления принимается (7.51) Рис. 7.9. Минимальный промах и время до L-встречи Таким образом, P стремится достичь минимально-возможного конечного промаха h, а E – наоборот, стремится увеличить конечный промах, причем никаких дополнительных условий на момент конечного промаха не накладывается. 2. Пусть – момент времени, когда впервые выполняется условие (7.48) (рис. 7.9), где (7.52) То есть . (7.53) P стремится обеспечить выполнение условия (7.48), причем за минимальное время, а E стремится не допустить L-встречи (7.48) или хотя бы отдалить ее во времени. Поэтому в качестве второго критерия управления принимается . (7.54) Следует заметить, что момент существует всегда, поскольку для каждой пары траекторий P и E всегда найдется момент времени, когда расстояние (7.47) между ними минимально. Момент существует только в том случае, если выполняется условие (7.48), а если – единственный, то . Сформулируем задачи преследования и уклонения в соответствии с введенными критериями (7.51) и (7.54). Задача 1: . В классе позиционных стратегий требуется найти оптимальное управление , удовлетворяющее условию (7.55) и условию (7.42), какими бы ни были начальные позиции объектов. Вектора управления являются двумерными . (7.56) Допустимые множества управлений задаются в виде (7.39) . (7.57) Задача 1: . Формулируется аналогично задаче 1: , но вместо критерия используется критерий (7.54). Задача 2: . В классе позиционных стратегий требуется найти оптимальное управление , удовлетворяющее условию (7.58) и условию (7.42), какими бы ни были начальные позиции объектов. Вектора управления являются двумерными . Допустимые множества управлений задаются в виде (7.39). Задача 2: . Формулируется аналогично задаче 2: , но вместо критерия используется критерий (7.54). 7.2.4. Анализ условий существования равновесия Приведенное ниже доказательство базируется на приведенных в п. 7.1.1 теоремах существования равновесия. В антагонистической дифференциальной игре имеет место равенство , (7.59) если оптимальные управления , доставляют седловую точку [129, 242]. Соотношение (7.59) соответствует выполнению равенства (7.60) где – функция Гамильтона для данной игры. В случае терминального показателя (7.51) , гамильтониан имеет вид (7.61) где – сопряженный вектор, – векторная запись уравнений (7.51). Поскольку движение всей системы (7.41) есть две отдельные траектории P и E (т.е. уравнения, описывающие движения одного объекта, не зависят от вектора управлений другого), то уравнение (7.61) представимо в виде (7.62) . (7.62) Поскольку явно зависит только от , а – только от , то ; (7.63) . (7.64) Таким образом, ; (7.65) . (7.66) Поскольку правые части уравнений (7.65) и (7.66) равны друг другу и выполняется условие «разделения» (см. замечание 4 в утв. 7.2) и, кроме того, объекты однотипны [98, 129], то, в случае , имеет место седловая точка. При интегральном показателе (7.54) Гамильтониан имеет вид . (7.67) Повторяя выкладки (7.62), можно показать, что в случае интегрального критерия также имеет место седловая точка. Оптимальные стратегии , , доставляющие седловую точку (7.59), обладают тем свойством, что P (E) невыгодно отклоняться от оптимальной стратегии ( ), поскольку при таком отклонении выигрыш E (P) только увеличится, а собственный выигрыш уменьшится. Кроме того, оптимальные стратегии и являются устойчивыми по отношению к получаемой информации об используемой противником стратегии. Свойство (7.59) означает, что решение задач преследования может быть получено из известного решения задач уклонения (и наоборот). Если заменить множества на (или любое другое), а на (или любое другое), то свойство (7.59) принимает вид . (7.68) Свойство (7.68) будет использовано в дальнейшем. 7.3. Оценка области достижимости центра масс 7.3.1. Общая характеристика способа оценки Область достижимости в момент времени из начальной точки и начального момента определяется как множество значений вектора координат в момент времени , полученные при всевозможных допустимых законах управлениях и начальном условии . Динамика области достижимости (ОД) может быть описана динамикой ее границ [193]. Граница ОД определяется траекториями предельного быстродействия [118, 193]. Если движение исследуемого объекта описывается линейной системой уравнений, то существуют относительно простые способы построения границы ОД с использованием фундаментальной матрицы решений [118, 129]. Эта методика существенно использует выпуклость ОД линейных систем. Для нелинейных систем свойство выпуклости ОД, в общем случае, не имеет места. Поэтому для них задача определения границ ОД, или граничных управлений (т.е. приводящих на границу ОД), может быть сформулирована в следующем виде [118, 264]. Необходимо в пространстве координат каким-либо образом задать направление , например, задав прямую, проходящую через начальное положение центра масс ЛА и некоторую другую точку этого пространства (рис. 7.10), и решить две отдельные задачи: 1) найти управление, максимизирующее расстояние , пройденное объектом за фиксированное время в направлении ; 2) найти управление, минимизирующее расстояние , пройденное объектом за фиксированное время в направлении .
Варьируя направлением в пространстве координат и каждый раз решая эти две поставленные задачи, можно сделать поточечную [193] оценку ОД для фиксированного (рис. 7.11). При решении обеих задач весьма желательно выявить структурные свойства оптимального в смысле общих критериев (max и min ) управления, не зависящие от конкретного направления и времени . Знание структуры граничного управления существенно упрощает определение границ ОД в фиксированный момент времени . Заметим, что решению задачи минимизации соответствует управление со структурными свойствами предельного быстродействия, а решению задачи максимизации – в общем случае, некоторая другая структура управления, которую также необходимо определить. Рассмотрим кратко вопрос существования оптимальных управлений в рамках данных задач. В общем случае существуют такие направления , , для которых вообще не найдется никаких управлений, удовлетворяющих краевым условиям за фиксированное время . Также возможна ситуация, когда существует единственное допустимое управление. В этом случае оно является решением для обеих задач (см. , ). Наконец, существуют такие направления (от до ), для которых допустимое управление не единственно. Тогда решения поставленных задач существуют и совпадать не могут. Формирование управляющего воздействия или в каждый момент управляемого движения основывается на гипотезе посто- Кроме того, величина скорости изменяется при изменении программного такта. Поэтому структуры граничного управления объекта, определяющие поточечную оценку границ , должны быть найдены с учетом этой гипотезы. Таким образом, динамика центра масс ЛА с постоянной скоростью движения в нормальной земной СК описывается дифференциальными уравнениями (7.69)
Используя подход [183, 258], определим понятия субдостижимости , супердостижимости следующим образом: . (7.70) Здесь – область достижимости объекта (7.69). Таким образом, субдостижимость оптимально оценивает ОД ЛА снизу и дает гарантированную оценку того, что заведомо не меньше, чем . Супердостижимость оптимально оценивает ОД ЛА сверху и дает гарантированную оценку того, что заведомо не больше, чем (рис. 7.12). На рис. 7.12 – символ границы области . Учитывая минимаксный или максиминный характер решаемых задач, для игрока-союзника необходимо использовать оценку снизу – субдостижимость , а для игрока-противника – использовать оценку сверху – супердостижимость . Проведем анализ системы (7.69), учитывая, что: ; (7.71) (7.72) Располагаемая перегрузка определяет максимально возможную, нормальную к скорости , перегрузку, действующую на ЛА в процессе полета при отсутствии ускорения свободного падения . Оно изменяет максимально возможную нормальную перегрузку на величину : , (7.73) причем . (7.74) Введем обозначение (рис. 7.15) ; (7.75) , (7.76) тогда или (7.77) Таким образом, в процессе полета максимально возможная действующая на ЛА нормальная перегрузка будет не меньше величины (оценка снизу), но и не больше величины (оценка сверху). Это позволяет получить новое математическое описание движения центра масс ЛА для определения его суб- и супердостижимости, которое в нормальной земной неподвижной СК имеет следующий вид: (7.78) Ограничения на управление имеют вид (7.79) и (7.80) – для определения субдостижимости, или (7.81) – для определения супердостижимости. Необходимо отметить, что описание в виде (7.69) будет справедливым для любой неподвижной СК (в том числе и для , поскольку сила тяжести в уравнениях отсутствует (но ее действие учтено в ограничениях (7.80) и (7.81)). Направление однозначно определяется прямой ( ). Координаты точки в СК обозначим , , . Введем угол , определяемый согласно = . (7.82) Введем дополнительные СК (рис. 7.14, 7.15): · – неподвижная земная СК, задаваемая поворотом системы вокруг оси на угол ; ·
Популярное: Почему стероиды повышают давление?: Основных причин три... Почему человек чувствует себя несчастным?: Для начала определим, что такое несчастье. Несчастьем мы будем считать психологическое состояние... Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ... Модели организации как закрытой, открытой, частично открытой системы: Закрытая система имеет жесткие фиксированные границы, ее действия относительно независимы... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (169)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |