2人のプレイヤーAとBがおり、2種類の純粋戦略をもつゼロサムゲームを考えます。
プレイヤーAの利得行列としては、次の通りです。
プレイヤーB | |||
---|---|---|---|
戦略Ⅰ | 戦略Ⅱ | ||
プレイヤーA | 戦略1 | 36 | -12 |
戦略2 | 16 | 32 |
なお、ゼロサムゲームなので、プレイヤーAの利得は、プレイヤーBの損失になるとします。
※「▶」をクリックすると、回答を見ることができます。
【問題1】
それぞれのプレイヤーが純粋戦略をとるとき、均衡する戦略の組はどうなりますか。
【回答1】
均衡は存在しません。
なぜなら、
【左上(戦略1、戦略Ⅰ)】
プレイヤーAはこの戦略を変更しないが、プレイヤーBは戦略Ⅱをとれば、利得が-36から12となる
(プレイヤーBの利得は、上記の表にマイナスを掛けた値になることに注意)
【右上(戦略1、戦略Ⅱ)】
プレイヤーBはこの戦略を変更しないが、プレイヤーAは戦略2をとれば、利得が-12から32となる
【左下(戦略2、戦略Ⅰ)】
プレイヤーBはこの戦略を変更しないが、プレイヤーAは戦略1をとれば、利得が16から36となる
【右下(戦略2、戦略Ⅱ)】
プレイヤーAはこの戦略を変更しないが、プレイヤーBは戦略Ⅰをとれば、利得が-32から-16となる
となるため、均衡となる戦略の組は存在しないことになります。
【問題2】
それぞれのプレイヤーが混合戦略をとるとき、それぞれの期待利得はどうなりますか。
【回答2】
プレイヤーAは確率$p$で戦略1、確率$1-p$で戦略2をとるものとして、プレイヤーBは確率$q$で戦略Ⅰ、確率$1-q$で戦略Ⅱをとるものとします。
まずは、プレイヤーAの期待利得$\pi_A$を考えると、
$\pi_A = p[36q – 12(1-q)] + (1-p)[16q + 32(1-q)]$
となります。この式から、$q=1$と$q=0$の場合を考えると、
$q=1$のとき、$\pi_A = 36p + 16(1-p) = 20p + 16$
$q=0$のとき、$\pi_A = -12p + 32(1-p) = -44p + 32$
であり、$20p + 16 = -44p + 32$から、この2式が等しいのは、$p=1/4$のときとなります。
これらから、プレイヤーAの期待利得$\pi_A$は、
$\begin{equation}\pi_A = \begin{cases}
20p + 16 (p \leq 1/4のとき) \\
-44p + 32 (p > 1/4のとき) \\
\end{cases}\end{equation}$
となります。このことから、プレイヤーAの期待利得が最も大きくなるのは、$p=1/4$のときです。
同様に、プレイヤーBの期待損失$\pi_B$を考えると、
$\pi_B = q[36p + 16(1-p)] + (1-q)[-12p + 32(1-p)]$
となります(なお、プレイヤーBの利得はプライヤーAの損失である点に注意)。この式から、$p=0$と$p=1$の場合を考えると、
$p=1$のとき、$\pi_B = 36q – 12(1-q) = 48q – 12$
$p=0$のとき、$\pi_B = 16q + 32(1-q) = -16q + 32$
であり、$48q – 12 = -16q + 32$から、この2式が等しいのは、$q=11/16$のときとなります。
これらから、プレイヤーBの期待損失$\pi_B$は、
$\begin{equation}\pi_A = \begin{cases}
48q – 12 (q > 11/16のとき) \\
-16q + 32 (p \leq 11/16のとき) \\
\end{cases}\end{equation}$
となります。このことから、プレイヤーBの期待損失が最も小さくなるのは、$p=11/16$のときです。
以上から、プライヤーA・Bの期待利得・期待損失は、
$\pi_A = 20×1/4 + 16 = 21$
$\pi_B = -16×11/16 + 32 = 21$
となります。
純粋戦略とは異なり、混合戦略では均衡が成立していることが分かります。