スポンサーリンク

有限回の繰り返しゲームについて

スポンサーリンク
 
投稿ゲーム理論初級
ゲーム理論において、有限回の繰り返しゲームについて、説明しています。
スポンサーリンク
スポンサーリンク
スポンサーリンク

はじめに

 次のような囚人のジレンマゲームがあるとします。

 囚人Aと囚人Bが協力し合えば、共に2の利得が得られ、一方が裏切れば裏切った者は4の利得、裏切られた者は利得が0、そして共に裏切った場合には利得は1になるというものです。

囚人B
協力裏切り
囚人A協力$2$、$2$$0$、$4$
裏切り$4$、$0$$1$、$1$

 このときに、1回だけのゲームでは、共に裏切ることがナッシュ均衡になります。

 他方、無限回の繰り返しゲームで、トリガー戦略を考えたときに、フォーク定理を考えると、共に協力するというのが、ナッシュ均衡になる可能性があります。

   フォーク定理について

   ウエイトという視点からのフォーク定理について

 ところ、1回ではないが、有限回繰り返されるゲームの場合はどうなるのでしょうか。

有限回の繰り返しゲーム

 まずは、2回繰り返した場合の利得を考えてみましょう。
 1回目の囚人A・囚人Bの利得をそれぞれ$\pi^A_1 \, , \, \pi^B_1$とすると、2回繰り返しゲームの利得行列は、次のようになります。

囚人B
協力裏切り
囚人A協力$\pi^A_1+ 2$、$\pi^B_1 + 2$$\pi^A_1 + 0$、$\pi^B_1 + 4$
裏切り$\pi^A_1 + 4$、$\pi^B_1 + 0$$\pi^A_1 + 1$、$\pi^B_1 + 1$

 この利得行列から分かるように、ナッシュ均衡は共に裏切るという選択になります。
 そして何よりも、重要なのは、1回目の選択による利得は全く影響を受けていない点です。
 例えば、囚人Bが協力するという選択をしているときに、囚人Aは、協力と裏切りにおけるそれぞれの利得を比較しますが、

  協力の場合:$\pi^A_1+ 2$

  裏切りの場合:$\pi^A_1 + 4$

であり、比較上は、$\pi^A_1$はキャンセルされるからです。

  $\pi^A_1+ 2 < \pi^A_1 + 4$ ⇒ $2 < 4$

 これは、3回目以上の繰り返しゲームでも同様のことが言え、$n$回目の繰り返しゲームでは、次のような利得行列になるだけです。

囚人B
協力裏切り
囚人A協力$\displaystyle \sum_{i=1}^{n-1} \pi^A_i+ 2$、$\displaystyle \sum_{i=1}^{n-1} \pi^B_i + 2$$\displaystyle \sum_{i=1}^{n-1} \pi^A_i + 0$、$\displaystyle \sum_{i=1}^{n-1} \pi^B_i + 4$
裏切り$\displaystyle \sum_{i=1}^{n-1} \pi^A_i + 4$、$\displaystyle \sum_{i=1}^{n-1} \pi^B_i + 0$$\displaystyle \sum_{i=1}^{n-1} \pi^A_i + 1$、$\displaystyle \sum_{i=1}^{n-1} \pi^B_i + 1$

 すなわち、有限回の繰り返しゲームでは、1回だけの囚人のジレンマと同様に、裏切るが支配戦略となります。

参考

  岡田章・加茂知幸・三上和彦・宮川敏治『ゲーム理論ワークブック

  岡田章『ゲーム理論・入門
 

スポンサーリンク
タイトルとURLをコピーしました