スポンサーリンク

フォーク定理について

スポンサーリンク
 
投稿ゲーム理論初級
ゲーム理論におけるフォーク定理について、囚人のジレンマの例を用いながら、説明しています。
スポンサーリンク
スポンサーリンク
スポンサーリンク

はじめに

 ゲーム理論における基本的なゲームとして、囚人のジレンマがあります。

 2人の囚人AとBがおり、犯罪について、黙秘するか自白するかの選択をそれぞれがすることになります。
 このとき、両方ともが黙秘すれば、刑期は1年済みますが、両方とも自白すれば刑期は3年になるとします。また、一方が自白し、もう一方が黙秘したときには、自白した者は無罪で、黙秘した者は刑期が5年になるとします。

 このときには、囚人2人両方にとっては、2人とも黙秘を続けるのがよいのですが、自白すれば無罪となることから、両方が自白することになり、刑期は3年になってしまうというものです。

 これを利得マトリックスで表すと、下のようなものになり、ナッシュ均衡は両者とも自白するというものになります。

囚人B
黙秘自白
囚人A黙秘-1:-1-5:0
自白0:-5-3:-3

繰り返しゲーム

 上記のような囚人のジレンマにおいて、1回の選択で終わるのではなく、何度も選択を行う繰り返しゲームを考えましょう。

両方が黙秘

 時間と共に、利得が減少することを考え、割引因子を$\delta (0 < \delta < 1)$とすると、例えば、両方が黙秘を続けた場合には、

  囚人Aの利得:$\pi_A^1 = 1 + (-1) \cdot \delta + (-1) \cdot \delta^2 + \; \cdots \; = \dfrac{-1}{1 \; – \; \delta}$

  囚人Bの利得:$\pi_B^1 = -1 + (-1) \cdot \delta + (-1) \cdot \delta^2 + \; \cdots \; = \dfrac{-1}{1 \; – \; \delta}$

となります。

一方が自白

 しかし、1回だけの場合と同様に、それぞれの囚人には、自白への誘因が働きます。
 例えば、囚人Aが自白して、囚人Bが黙秘を続けるという場合を考えましょう。

  囚人Aの利得:$\pi_A^2 = 0 + 0 \cdot \delta + 0 \cdot \delta^2 + \; \cdots \; = 0$

  囚人Bの利得:$\pi_B^2 = -5 + (-5)\delta + -5 \delta^2 + \; \cdots \; = \dfrac{-5}{1 \; – \; \delta}$

 このような場合には、一方的に囚人Aが得をすることになり、囚人Bはむしろ損をしてしまいます。

トリガー戦略

 そこで、トリガー戦略というものを考えます。トリガー戦略とは、囚人Aが1回目に自白をした場合、2回目以降は囚人Bは仕返しをし続けるとして、囚人Bも自白するとしましょう。

   囚人Aの利得:$\pi_A^3 = 0 + (-3) \cdot \delta + (-3) \cdot \delta^2 + \; \cdots \; = 3 + \dfrac{-3}{1 \; – \; \delta} = \dfrac{-3\delta}{1 \; – \; \delta}$

   囚人Bの利得:$\pi_B^3 = -5 + (-3) \cdot \delta + (-3) \cdot \delta^2 + \; \cdots \; = -2 + \dfrac{-3}{1 \; – \; \delta} = \dfrac{-5 + 2\delta}{1 \; – \; \delta}$

 $0 < \delta < 1$であるので、次式が成り立ち、囚人Bにとっては、囚人Aだけが自白したときに比べれば、良いことになり、トリガー戦略をとったほうがいいことになります。  $\pi_B^2 = \dfrac{-5}{1 \; - \; \delta} < \dfrac{-5 + 2\delta}{1 \; - \; \delta} =\pi_B^3$

 他方、囚人Aの利得を見ると、次式から、囚人Bのトリガー戦略で、利得は悪化することなります。

  $\pi_A^2 = 0 > \dfrac{-3\delta}{1 \; – \; \delta} =\pi_A^3$

両方が黙秘とトリガー戦略の比較

 とはいえ、囚人Aにとって、最初の両方が黙秘している状態の利得と比べたとき、このトリガー戦略を受けた利得のほうが高ければ、囚人Aは1回目に自白をしたほうがよいことになります。

 そこで、囚人Aがそもそも自白を選択しない条件は何なのかを考えると、両方が黙秘しているときの利得のほうが、自白をしトリガー戦略を受けた利得のほうが高いときです。

  $\pi_A^1 = \dfrac{-1}{1 \; – \; \delta} > \dfrac{-3\delta}{1 \; – \; \delta} = \pi_A^3$

 この式を整理すると、

  $\delta > \dfrac{1}{3}$

のとき、囚人Aは自白をせず、黙秘を行ったほうがよいことになります。

 言い方を変えれば、1回限りの囚人のジレンマでは、両方が自白することになりますが、このような繰り返しゲームでは、$\delta > 1/3$が成立すれば、両方とも黙秘をし続けることになります。

フォーク定理

 このように割引因子によって、囚人は自白したほうがいいのか黙秘したほうがいいのかが決定されます。
 そして、この繰り返しゲームで、トリガー戦略があるときに、より望ましい状態になることをフォーク定理と言います。

 より一般的な形でいえば、フォーク定理とは、

  「割引因子が十分に1に近いときには、囚人のジレンマは両方が黙秘することがナッシュ均衡になる」

ということになります。

参考

  奥野正寛(編著)『ミクロ経済学

  岡田章『ゲーム理論・入門
 

スポンサーリンク
タイトルとURLをコピーしました