マックスミニ戦略とミニマックス戦略
ゲーム理論において2人のプレイヤーがいるとき、相手の行動を踏まえて、自己の利得を最大化することになります。
1つは、相手が自己の利得を最小化するように行動し、その中で自己の利得を最大化するというもので、「マックスミニ戦略」と言われます。ある意味、保守的な戦略で、最低限確保できそうな利得の中で、自己の利得を最大化するという形になっています。
プレイヤー$i \; (i =1 \, , \, 2)$の行動を$x_i$として、利得を$u_i$とすると、次のように表せます。
$\displaystyle \max_{x_i} \; [\min_{x_j} u(x_1 \, , \, x_2)] \quad (i \neq j)$
もう1つは、自己の利得を最大したものを、相手が最小化すると考えるもので、「ミニマックス戦略」と言われます。
$\displaystyle \min_{x_j} \; [\max_{x_i} u(x_1 \, , \, x_2)] \quad (i \neq j)$
例
次のような基本的な囚人のジレンマゲームを例に、囚人Aのマックスミニ戦略とミニマックス戦略に基づく利得を求めてみましょう。
囚人B | |||
---|---|---|---|
黙秘 | 自白 | ||
囚人A | 黙秘 | -1:-1 | -5: 0 |
自白 | 0:-5 | -3:-3 |
(マックスミニ戦略)
囚人Aは、自身が黙秘と自白を選んだときの最低限の利得を考えます。
黙秘を選んだときには、囚人Bの行動で-1か-5の利得となり、囚人Bが自身の利得を引き下げた場合を想定し、利得-5になると考えます。同様に、自白のときには、利得は-3になるとします。
すなわち、次のようになります。
黙秘:$\min(-1 \, , \, -5) = -5$
自白:$\min(0 \, , \, -3) = -3$
次に、このうち、囚人Aは、利得が大きい行動を選ぶので、自白をすることになります。
$\max [(-1 \, , \, -5) \, , \, (0 \, , \, -3)] = \max [-5 \, , \, -3] = -3$
(ミニマックス戦略)
ミニマックス戦略では、まずは囚人Aは、囚人Bが黙秘と自白それぞれの場合で、利得が最大になるように考えます。
黙秘:$\max(-1 \, , \, 0) = 0$
自白:$\max(-5 \, , \, -3) = -3$
そして、これらについて、囚人Bが自己の利得を最小化する行動をとると考えると、囚人Aは自白をすることになります。
$\min [(-1 \, , \, 0) \, , \, (-5 \, , \, -3)] = \min [0 \, , \, -3] = -3$
ミニマックス定理
ゼロ和ゲーム(定和ゲーム)とは、プレイヤーの利得の合計が一定であるようなゲームのことです。
一方のプレイヤーの利得が上がれば、もう一方のプレイヤーの利得が同じだけ低下するので、ゼロ和ゲームと言われています。
例えば、次のような顧客獲得競争ゲームでは、どの行動の組み合わせでも、A店・B店の利得の合計は10になっています。
B店 | |||
---|---|---|---|
価格維持 | 値下げ | ||
A店 | 価格維持 | 5:5 | 3:7 |
値下げ | 7:3 | 5:5 |
このような2人ゼロ和ゲームにおいて、ナッシュ均衡が存在する必要十分条件は、次のようにマックスミニ戦略とミニマックス戦略の利得が等しいときとされます。
$\displaystyle \min_{x_j} \; [\max_{x_i} u(x_1 \, , \, x_2)] = \min_{x_j} \; [\max_{x_i} u(x_1 \, , \, x_2)] \quad (i \neq j)$
そしてこれを、「ミニマックス定理」
参考
岡田章『ゲーム理論・入門』
武隈愼一『ミクロ経済学』