Стохастической неопределенности
Принятие решения в условиях стохастической неопределенности можно описать с помощью матрицы «выигрышей» (или «потерь») c m возможными действиями (стратегиями) и n возможными случайными состояниями природы , которая имеет вид: , где представляется как выигрыш (потеря), связанный с -ой стратегией ЛПР (игрока) и -м состоянием природы. При решении задач наряду матрицами рассматривают соответствующие таблицы:
Для используют также термин: «полезность» принятого решения. Таким образом, требуется найти вектор , который обеспечивает оптимум заданной функции полезности по некоторому критерию. В условиях неопределенности вероятностное распределение, соответствующее состояниям природы, не известно. Поэтому выбор стратегии игроком принимается на основе ряда критериев: 1. Критерий Лапласа. 2. Максиминный (минимаксный) критерий. 3. Максимаксный критерий. 4. Критерий Гурвица. 5. Критерий Сэвиджа. Критерий Лапласа опирается на следующее соображение: так как распределение вероятностей состояний среды неизвестно, можно считать их равными, то есть . Выбор наилучшей стратегии выбирается на основе критерия максимизации выигрыша, если задает выигрыш: , (5.1) или минимизации потерь, если задает потерю: , (5.2) Пример T578. Хенк — прилежный студент, который обычно получает хорошие отметки благодаря, в частности, тому, что имеет возможность повторить материал в ночь перед экзаменом. Перед завтрашним экзаменом Хенк столкнулся с небольшой проблемой. Его сокурсники организовали на всю ночь вечеринку, в которой он хочет участвовать. Хенк имеет три альтернативы: — участвовать в вечеринке всю ночь; — половину ночи участвовать в вечеринке, а половину — учиться; — учиться всю ночь. Профессор, принимающий завтрашний экзамен, непредсказуем, и экзамен может быть легким ( ), средним ( ) или трудным ( ). В зависимости от сложности экзамена и времени, затраченного Хенком на повторение, можно ожидать следующие баллы. Порекомендуйте Хенку, какой выбор он должен сделать. Решение. Очевидно, что в данном случае необходимо воспользоваться формулой (5.1), чтобы максимизировать полученный балл. Рассчитаем ожидаемые значения баллов для каждого решения (стратегии): балла, баллов, балла.
Лаплас рекомендует учиться всю ночь. Максиминный (минимаксный) критерийназывают еще критерием Вальда, или критерием «осторожного наблюдателя», так как предполагается, что внешняя среда находится в самом невыгодном положении. Поэтому критерий сводится к выбору наилучшей альтернативы из наихудших, если задает прибыль (максиминный критерий): , (5.3) или к выбору наихудшей альтернативы из наилучших, если задает потери (минимаксный критерий): , (5.4) Применим критерии к предыдущей задаче. , критерий предлагает стратегию , оценивая при этом шансы Хенка, как получение 82 баллов, при условии, что он будет учиться всю ночь. Максимаксный критерийназывают также критерием «здорового оптимиста», так как предполагается, что внешняя среда находится в самом выгодном положении. Поэтому критерий сводится к выбору наилучшей альтернативы из наилучших, если задает выигрыш: , (5.5) Применим критерий к предыдущей задаче. , критерий предлагает стратегию , оценивая при этом шансы Хенка, как получение 100 баллов, при условии, что он будет учиться всю ночь. Критерий Гурвица предполагает, что внешняя среда может находиться в наилучшем состоянии с вероятностью , а в наихудшем состоянии с вероятностью , где . Если задает выигрыш, тогда решение по критерию Гурвица производится по условию: , (5.6) Если задает потери, тогда решение по критерию Гурвица производится по условию: , (5.7) Параметр называют показателем оптимизма, так как выбором параметра можно задавать степень оптимизма. При критерий Гурвица переходит в критерий оптимиста, а при — в критерий пессимиста. Рассмотрим решение предыдущей задачи с уровнем оптимизма . Ожидаемое значения баллов для стратегии : . Аналогично рассчитаем значения для остальных стратегий. Для сравнения приведем результаты расчетов при различных :
Наилучшим решением и для данного критерия является . Критерий Сэвиджа строится на основе матрицы «потерь» , которая получается из матрицы платежей (выигрышей или проигрышей) следующим образом: Построим матрицу потерь для рассматриваемого выше примера. В данном случае задает выигрыш. Поэтому найдем максимальные значения по столбцам:
Вычтем полученные числа 100, 88, 82 из элементов соответствующих столбцов, получим матрицу потерь:
К полученной матрице применяется минимаксный критерий: , что соответствует решению .
Популярное: Почему двоичная система счисления так распространена?: Каждая цифра должна быть как-то представлена на физическом носителе... Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ... ©2015-2020 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (2435)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |