Оптимальные решения в играх двух лиц с нулевой суммой
Для решения игры двух лиц с нулевой суммой предлагается критерий минимакса – максимина.Этот критерий является наиболее осторожным, поскольку основывается на выборе наилучшей из наихудших возможностей. Рассмотрим игру с матрицей
Каждый игрок стремится себе обеспечить максимально возможный выигрыш при любых действиях противника. Найдем оптимальные стратегии для каждого из игроков. Игрок А играет против игрока В и считает, что какую бы стратегию он ни выбрал, игрок В постарается выбрать стратегию, минимизирующую его проигрыш, и тем самым минимизирующую выигрыш игрока А, т.е. , (по строкам).
За оптимальную игрок А разумеется, выберет стратегию, для которой выигрыш будет максимальным, т.е. Выбранная игроком А стратегия называется максиминной стратегией, а соответствующее ей значение выигрыша α называется нижней ценой игры. Это гарантированный выигрыш игрока А при любой стратегии игрока В. В итоге, если игрок А придерживается своей максиминной стратегии, его выигрыш в любом случае будет не меньше нижней цены игры, т.е. Игрок В считает, что какую бы стратегию он ни выбрал, игрок А выберет стратегию, максимизирующую его выигрыш, значит, из осторожности он должен выбрать максимальный свой проигрыш , (по столбцам). Далее, среди этих стратегий игрок В должен выбрать в качестве оптимальной такую стратегию, для которой его проигрыш bj минимален, т.е. Выбранная игроком В стратегия называется минимаксной стратегией, а соответствующее ей значение проигрыша b называется верхней ценой игры. Это гарантированный минимальный проигрыш игрока В при любой стратегии игрока А. В итоге, если игрок В придерживается своей минимаксной стратегии, его проигрыш в любом случае будет не больше верхней цены игры, т.е. Из условий, определяющих критерий минимакса – максимина, следует Игра, для которой α = b называется игрой с седловой точкой. Решением игры называется пара оптимальных стратегий, соответствующих седловой точке.Выигрыш aij, соответствующий решению игры называется ценой игры (ν), причем ν = α = b. Решение игры обладает следующим свойством (устойчивостью): если один из игроков придерживается своей оптимальной стратегии, то для другого игрока не выгодно отклоняться от своей оптимальной стратегии. Если игра имеет седловую точку, то есть α = b,то говорят, что она решается в чистых стратегиях Найдем решение игры примера 1. Платежная матрица игры имеет вид
Нижняя цена игры , верхняя цена игры . Так как α = b,то игра имеет седловую точку. Решение игры (А3,В3), цена игры ν =0.
Популярное: Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ... Как выбрать специалиста по управлению гостиницей: Понятно, что управление гостиницей невозможно без специальных знаний. Соответственно, важна квалификация... Почему двоичная система счисления так распространена?: Каждая цифра должна быть как-то представлена на физическом носителе... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (1020)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |