はじめに
次のような囚人のジレンマゲームがあるとします。
囚人Aと囚人Bが協力し合えば、共に2の利得が得られ、一方が裏切れば裏切った者は4の利得、裏切られた者は利得が0、そして共に裏切った場合には利得は1になるというものです。
囚人B | |||
---|---|---|---|
協力 | 裏切り | ||
囚人A | 協力 | $2$、$2$ | $0$、$4$ |
裏切り | $4$、$0$ | $1$、$1$ |
このときに、1回だけのゲームでは、共に裏切ることがナッシュ均衡になります。
他方、無限回の繰り返しゲームで、トリガー戦略を考えたときに、フォーク定理を考えると、共に協力するというのが、ナッシュ均衡になる可能性があります。
ところ、1回ではないが、有限回繰り返されるゲームの場合はどうなるのでしょうか。
有限回の繰り返しゲーム
まずは、2回繰り返した場合の利得を考えてみましょう。
1回目の囚人A・囚人Bの利得をそれぞれ$\pi^A_1 \, , \, \pi^B_1$とすると、2回繰り返しゲームの利得行列は、次のようになります。
囚人B | |||
---|---|---|---|
協力 | 裏切り | ||
囚人A | 協力 | $\pi^A_1+ 2$、$\pi^B_1 + 2$ | $\pi^A_1 + 0$、$\pi^B_1 + 4$ |
裏切り | $\pi^A_1 + 4$、$\pi^B_1 + 0$ | $\pi^A_1 + 1$、$\pi^B_1 + 1$ |
この利得行列から分かるように、ナッシュ均衡は共に裏切るという選択になります。
そして何よりも、重要なのは、1回目の選択による利得は全く影響を受けていない点です。
例えば、囚人Bが協力するという選択をしているときに、囚人Aは、協力と裏切りにおけるそれぞれの利得を比較しますが、
協力の場合:$\pi^A_1+ 2$
裏切りの場合:$\pi^A_1 + 4$
であり、比較上は、$\pi^A_1$はキャンセルされるからです。
$\pi^A_1+ 2 < \pi^A_1 + 4$ ⇒ $2 < 4$
これは、3回目以上の繰り返しゲームでも同様のことが言え、$n$回目の繰り返しゲームでは、次のような利得行列になるだけです。
囚人B | |||
---|---|---|---|
協力 | 裏切り | ||
囚人A | 協力 | $\displaystyle \sum_{i=1}^{n-1} \pi^A_i+ 2$、$\displaystyle \sum_{i=1}^{n-1} \pi^B_i + 2$ | $\displaystyle \sum_{i=1}^{n-1} \pi^A_i + 0$、$\displaystyle \sum_{i=1}^{n-1} \pi^B_i + 4$ |
裏切り | $\displaystyle \sum_{i=1}^{n-1} \pi^A_i + 4$、$\displaystyle \sum_{i=1}^{n-1} \pi^B_i + 0$ | $\displaystyle \sum_{i=1}^{n-1} \pi^A_i + 1$、$\displaystyle \sum_{i=1}^{n-1} \pi^B_i + 1$ |
すなわち、有限回の繰り返しゲームでは、1回だけの囚人のジレンマと同様に、裏切るが支配戦略となります。
参考
岡田章・加茂知幸・三上和彦・宮川敏治『ゲーム理論ワークブック』
岡田章『ゲーム理論・入門』