Принятие решений по критериям лапласа, вальда, гурвица, сэвиджа, байеса теории статистических игр

В теории статистических игр условия исполнения операции зависят от

объективной действительности, которую в теории игр принято именовать «природой». Соответствующие обстановки именуют «играми с

природой» (статистическими играми). «Природа» в теории игр

рассматривается как некая незаинтересованная инстанция, поведение которой не смотря на то, что и неизвестно, но, по крайней мере, не содержит элемента сознательного противодействия отечественным замыслам. Пускай сторона А имеет вероятных стратегий [6]

О состоянии «природы» возможно сделать догадок

Для каждой пары стратегий ( ) существует функция которая есть случайной величиной и именуется функцией утрат.

Пускай удаётся выяснить величину ? эффективность ответа в условиях для всех комбинаций пар стратегий . В этом случае платёжная матрица игры имеет форму:

В теории статистических игр, кроме платёжной матрицы, употребляется и, так называемая, матрица рисков либо матрица сожалений.

Риском стороны А при применении стратегии в условиях именуется величина

(2.14)

где ? большой выигрыш стороны А в состоянии «природы» ПJ . 26

Критерий Лапласа основан на предположении, что любой вариант развития обстановки (состояния «природы») равновероятен. Для каждой строки матрицы выигрышей подсчитывается среднее арифметическое значение оценок. Оптимальному ответу будет соответствовать такое ответ, которому соответствует большое значение среднего арифметического, т.е.

n

F*= F(X*,Y)= max (1/n) ? aij (2.15)

j=1

Критерий Вальда. основывается на принципе большого пессимизма, другими словами на предположении, что случится наиболее риск и развития худший вариант ситуации нехорошего варианта необходимо свести к минимуму.

В каждой строке матрицы выбираем минимальную оценку. Оптимальному ответу соответствует такое ответ, которому соответствует максимум этого минимума, т. е.

F*= F(X*,Y)= max min aij , (2.16)

1?i?m 1?j?m

Данный критерий крайне осторожен. Он ориентирован на нехорошие условия, лишь среди которых и отыскивается наилучший и сейчас уже гарантированный итог. Критерий Вальда основывается на предположении, что случится наиболее риск и развития худший вариант ситуации нехорошего варианта необходимо свести к минимуму.

Критерий Сэвиджа. Сущность этого критерия содержится в минимизации

риска. Как и критерий Вальда, критерий Сэвиджа крайне осторожен. Они

различаются различным пониманием нехорошей обстановке: в первом случае — это минимальный выигрыш, во втором — большая утрата выигрыша по

сравнению с тем, чего возможно было бы достигнуть в данных условиях. В каждом столбце матрицы находится большая оценка max аij и составляется новая матрица, элементы которой определяются соотношением (2.14) для rij . Под риском rij знают разность между большим выигрышем, что имел бы место, если бы было точно как мы знаем, что наступит обстановка yj, , и выигрышем при выборе ответа хi в условиях yj. . Потом из матрицы рисков выбирают такое ответ, при котором величина риска принимает мельчайшее значение в самой негативной ситуации, т.е.

F*= F(X*,Y)= max min ( maxaj -aij ) , (2.17)

1?i?m 1?j?n 1?i?m

Сущность этого критерия содержится в минимизации риска. Как и критерий Вальда, критерий Сэвиджа крайне осторожен. Они различаются различным пониманием нехорошей обстановке: в первом случае — это минимальный выигрыш, во втором — большая утрата выигрыша если сравнивать с тем, чего возможно было бы достигнуть в данных условиях.

Критерий Гурвица —критерий «оптимизма — пессимизма» ЛПР. Вводится коэффициент оптимизма, с которой случится наилучший для ЛПР финал, нехороший вариант возможно ожидать с возможностью (1-?), 0 ?

В каждой строке матрицы выигрышей находится самая громадная оценка max аij и самая маленькая min aij.

Они умножаются соответственно на ? и (1 — ? ) и после этого вычисляется их сумма. Оптимальному ответу будет соответствовать такое ответ, которому соответствует максимум данной суммы, т.е.

28

F*= F(X*,Y)= max [?max aij + ( 1- ?)min aij ], (2.18)

1?i?m 1?j?n 1?j?n

При ? = 0 критерий Гурвица трансформируется в критерий Вальда. Это случай крайнего «пессимизма». При ? = 1 (случай крайнего «оптимизма») человек, принимающий ответ, рассчитывает на то, что ему будет сопутствовать самая удобная ситуации. «Коэффициент оптимизма» а назначается субъективно, исходя из опыта, интуиции и т.п. Чем более страшна обстановка, тем более осмотрительным должен быть подход к выбору ответа и тем меньшее значение присваивается коэффициенту ?

Критерий Байеса. За оптимальную стратегию принимается чистая стратегия при которой величина достигает громаднейшего значения. Посредством этого критерия задача принятия ответа в условиях неопределённости сводится к задаче принятия ответа в условиях определённости, лишь принятое ответ есть оптимальным не в каждом отдельном случае, а в среднем. По критерию Байеса, оптимальной будет та стратегия при которой минимизируется величина среднего риска

(2.19)

Стратегия, максимизирующая средний выигрыш, сходится со стратегией, минимизирующей средний риск.

Стратегия, максимизирующая средний выигрыш, сходится со стратегией минимизации риска.

Пример выбора стратегии по параметрам Лапласа, Вальда, Гурвица, Сэвиджа, Байеса .При планировании операции в заблаговременно неясных условиях, довольно которых возможно сделать разные догадки

Задана платёжная матрица

1. Критерий Вальда. В каждой строке платёжной матрицы выбираем мельчайший выигрыш и из взятых значений берём громаднейшее:

Следовательно оптимальной есть стратегия

2. Критерий Сэвиджа. Выстроим сперва матрицу сожалений Для этого вычислим большие выигрыши стороны при трёх разных состояниях «природы»:

Сейчас можем вычислить элементы матрицы сожалений:

Матрица сожалений имеет форму:

В каждой строке матрицы сожалений выберем громаднейший риск и из взятых значений отметим мельчайшее:

Следовательно, в соответствии с критерию Сэвиджа, оптимальными являются стратегии и

3. Критерий Гурвица. В каждой строке платёжной матрицы определяем лри коэффициенте оптимизма ?=0,6 мельчайший и громаднейший выигрыши и соответственно, а после этого для каждой строчки вычисляем величину :

По критерию Гурвица при ?=0,6 оптимальной есть стратегия

Лекция 22: Применение способов теории игр при принятии ответов


Также читать:

Понравилась статья? Поделиться с друзьями: