スポンサーリンク

ゲーム理論の純粋戦略と混合戦略の問題

スポンサーリンク
 
問題ゲーム理論初級
ゲーム理論における純粋戦略と混合戦略の問題を2つ用意しています。
スポンサーリンク
スポンサーリンク

 2人のプレイヤーAとBがおり、2種類の純粋戦略をもつゼロサムゲームを考えます。
 プレイヤーAの利得行列としては、次の通りです。

プレイヤーB
戦略Ⅰ戦略Ⅱ
プレイヤーA戦略136-12
戦略21632

 なお、ゼロサムゲームなので、プレイヤーAの利得は、プレイヤーBの損失になるとします。

※「▶」をクリックすると、回答を見ることができます。

【問題1】
 それぞれのプレイヤーが純粋戦略をとるとき、均衡する戦略の組はどうなりますか。

【回答1】 

 均衡は存在しません。

 なぜなら、

  【左上(戦略1、戦略Ⅰ)】
   プレイヤーAはこの戦略を変更しないが、プレイヤーBは戦略Ⅱをとれば、利得が-36から12となる
   (プレイヤーBの利得は、上記の表にマイナスを掛けた値になることに注意)

  【右上(戦略1、戦略Ⅱ)】
   プレイヤーBはこの戦略を変更しないが、プレイヤーAは戦略2をとれば、利得が-12から32となる

  【左下(戦略2、戦略Ⅰ)】
   プレイヤーBはこの戦略を変更しないが、プレイヤーAは戦略1をとれば、利得が16から36となる

  【右下(戦略2、戦略Ⅱ)】
   プレイヤーAはこの戦略を変更しないが、プレイヤーBは戦略Ⅰをとれば、利得が-32から-16となる

となるため、均衡となる戦略の組は存在しないことになります。

【問題2】
 それぞれのプレイヤーが混合戦略をとるとき、それぞれの期待利得はどうなりますか。

【回答2】 

 プレイヤーAは確率$p$で戦略1、確率$1-p$で戦略2をとるものとして、プレイヤーBは確率$q$で戦略Ⅰ、確率$1-q$で戦略Ⅱをとるものとします。

 まずは、プレイヤーAの期待利得$\pi_A$を考えると、

  $\pi_A = p[36q – 12(1-q)] + (1-p)[16q + 32(1-q)]$

となります。この式から、$q=1$と$q=0$の場合を考えると、

  $q=1$のとき、$\pi_A = 36p + 16(1-p) = 20p + 16$

  $q=0$のとき、$\pi_A = -12p + 32(1-p) = -44p + 32$

であり、$20p + 16 = -44p + 32$から、この2式が等しいのは、$p=1/4$のときとなります。

 これらから、プレイヤーAの期待利得$\pi_A$は、

  $\begin{equation}\pi_A = \begin{cases}
20p + 16 (p \leq 1/4のとき) \\
-44p + 32 (p > 1/4のとき) \\
\end{cases}\end{equation}$

となります。このことから、プレイヤーAの期待利得が最も大きくなるのは、$p=1/4$のときです。

 同様に、プレイヤーBの期待損失$\pi_B$を考えると、

  $\pi_B = q[36p + 16(1-p)] + (1-q)[-12p + 32(1-p)]$

となります(なお、プレイヤーBの利得はプライヤーAの損失である点に注意)。この式から、$p=0$と$p=1$の場合を考えると、

  $p=1$のとき、$\pi_B = 36q – 12(1-q) = 48q – 12$

  $p=0$のとき、$\pi_B = 16q + 32(1-q) = -16q + 32$

であり、$48q – 12 = -16q + 32$から、この2式が等しいのは、$q=11/16$のときとなります。

 これらから、プレイヤーBの期待損失$\pi_B$は、

  $\begin{equation}\pi_A = \begin{cases}
48q – 12 (q > 11/16のとき) \\
-16q + 32 (p \leq 11/16のとき) \\
\end{cases}\end{equation}$

となります。このことから、プレイヤーBの期待損失が最も小さくなるのは、$p=11/16$のときです。

 以上から、プライヤーA・Bの期待利得・期待損失は、

  $\pi_A = 20×1/4 + 16 = 21$

  $\pi_B = -16×11/16 + 32 = 21$

となります。

 純粋戦略とは異なり、混合戦略では均衡が成立していることが分かります。

スポンサーリンク
タイトルとURLをコピーしました