最適応答
ゲーム理論におけるナッシュ均衡の概念のもととなる最適応答(最適反応)について、説明します。
あるプレイヤー$i$の戦略を$s_i$とし、$i$を以外のすべてのプレイヤーの戦略の組を$\mathbf{s}_{-i} = (s_1 \, , \, \cdots \, , \, s_{i-1} \, , \, s_{i+1} \, , \, \cdots \, , \, s_n)$とします。
このプレイヤー$i$の利得を$\pi(s_i \, , \, \mathbf{s}_{-i})$としたとき、
$\pi(s_i^* \, , \, \mathbf{s}_{-i}) \geq \pi(s_i \, , \, \mathbf{s}_{-i})$
を満たすような$s_i^*$を、プレイヤー$i$の最適応答と言います。
分かりやすく言うと、他のプレイヤーの戦略を所与として、自己の利得を最大化するような戦略を、最適応答と言います。
例(デート・ゲーム)
最適応答の例を見るため、デート・ゲームを考えましょう。
男性と女性がおり、デートに行くことを考えます。男性は野球に見に行きたいと思い、女性はバレエを見に行きたいと思っています。双方の意見が合わないときには、デートは中止になり、2人の利得は0となります。2人が野球を選んだときには、野球に行きたい男性の利得は2ですが、女性はデート中止よりも良いのですが、野球を見に行きたいわけではないので、その利得1になります。逆に、2人がバレエを選んだときには、男性の利得は2、女性の利得は1になるとします。
以上から、次のような利得マトリックスとなります(左は数値は男性の利得、右の数値は女性利得)。
女性 | |||
---|---|---|---|
野球 | バレエ | ||
男性 | 野球 | 2:1 | 0:0 |
バレエ | 0:0 | 1:2 |
ここから最適応答を考えるため、男性と女性で分けて、考えます。
ただこれにあたり、混合戦略を考えて、男性が野球を選ぶ確率を$p$、女性が野球を選ぶ確率を$q$とします(逆に、それぞれがバレエを選ぶ確率は、$1-p \, , \, 1-q$となります)。
【男性】
まず、女性がどちらを選ぶかを所与として、男性が野球とバレエを選んだときの利得は、次のようになります。
(なお、$\pi_{1M}$は男性が野球を選んだときの利得、$\pi_{2M}$は男性がバレエを選んだときの利得とします)
野球 :$\pi_{1M} = 2 \times q + 0 \times (1 \; – \; q) = 2q$
バレエ:$\pi_{2M} = 0 \times q + 1 \times (1 \; – \; q) = 1 \; – \; q$
このとき、男性は
$\pi_{1M} > \pi_{2M}$ならば、野球を選択
$\pi_{1M} = \pi_{2M}$ならば、どちらでもよい
$\pi_{1M} < \pi_{2M}$ならば、バレエを選択
することになるので、
$\pi_{1M} > \pi_{2M}$は、$2q > 1 \; – \; q$であり、$q > 1/3$のとき、野球を選択($p=1$)
$\pi_{1M} = \pi_{2M}$は、$2q = 1 \; – \; q$であり、$q = 1/3$のとき、どちらでもいい($0 \leq p \leq 1$)
$\pi_{1M} < \pi_{2M}$は、$2q < 1 \; - \; q$であり、$q < 1/3$のとき、バレエを選択($p=0$)
となります。
以上をまとめると、
$p^*=1$ ($1/3 \leq q \leq 1$のとき)
$0 \leq p^* \leq 1$ ($q =1/3$のとき)
$p^* = 0$ ($0 \leq q \leq 1/3$のとき)
となり、これが、女性の戦略を所与として、男性が自己の利得を最大化している最適応答となります。
【女性】
男性の場合と同様に、女性についても最適応答を求めることができます。
、$\pi_{1F}$は女性が野球を選んだときの利得、$\pi_{2F}$は女性がバレエを選んだときの利得とします)
野球 :$\pi_{1F} = 1 \times p + 0 \times (1 \; – \; p) = p$
バレエ:$\pi_{2F} = 0 \times p + 2 \times (1 \; – \; p) = 2 \; – \; 2p$
このとき、女性は
$\pi_{1F} > \pi_{2F}$ならば、野球を選択
$\pi_{1F} = \pi_{2F}$ならば、どちらでもよい
$\pi_{1F} < \pi_{2F}$ならば、バレエを選択
することになるので、
$\pi_{1F} > \pi_{2F}$は、$p > 2 \; – \; 2p$であり、$p > 2/3$のとき、野球を選択($q=1$)
$\pi_{1F} = \pi_{2F}$は、$p = 2 \; – \; 2p$であり、$q = 2/3$のとき、どちらでもいい($0 \leq q \leq 1$)
$\pi_{1F} < \pi_{2F}$は、$p < 2 \; - \; 2p$であり、$q < 2/3$のとき、バレエを選択($q=0$)
となります。
以上をまとめると、
$q^*=1$ ($2/3 \leq p \leq 1$のとき)
$0 \leq q^* \leq 1$ ($p =2/3$のとき)
$q^* = 0$ ($0 \leq p \leq 2/3$のとき)
となり、これが、男性の戦略を所与として、女性が自己の利得を最大化している最適応答となります。
最適応答グラフ
男性と女性の最適応答が得られたわけですが、これをもとに、$p$と$q$の最適応答の組み合わせを表した最適応答グラフを作成することができます。
黒線が男性の最適応答、赤線が女性の最適応答となっています。
そして、この2つの最適応答が交わるところが、ナッシュ均衡となります。
最後に
この最適応答について、次のようにタカ・ハトゲームにおける問題も用意しています。
もっと知りたいという方は、こちらも見てください。
参考
奥野正寛(編著)『ミクロ経済学』
岡田章『ゲーム理論・入門』