はじめに
ゲーム理論において、支配戦略というものがあります。
支配戦略とは、他のプレイヤーがいかなる戦略をとろうとも、自身の戦略は1つになるというものです。言い方を変えれば、他のプレイヤーがとった戦略について、どのような戦略に対しても、自身の1つの戦略のほうが利得が高く、その戦略を選ぶというものになります。
この支配戦略という概念には、非常に便利な概念です。
なぜなら、あるプレイヤーに、いくつもの戦略があったとしても、支配戦略が存在すれば、そのプレイヤーの戦略は1つになるからです。平易な言い方ですれば、「一択」になるということです。
しかし、支配戦略が存在しない場合も多く、このようなときに使える可能性があるものとして、「反復支配戦略均衡」です。
反復支配戦略均衡
反復支配戦略均衡とは、他のプレイヤーがどのような戦略であっても、利得が大きくならない戦略を削除していって、最終的に支配戦略が残り、均衡が実現されるというものです。
イメージがつきにくいと思うので、例で説明しましょう。
数値例
プレイヤー1と2の2人があり、プレイヤー1はAとB、プレイヤー2はX・Y・Zの戦略をとります。
プレイヤー1の利得を左側の数値、プレイヤー2の利得を右側の数値としたとき、次のような利得マトリックスになっているとします。
プレイヤー2 | ||||
---|---|---|---|---|
X | Y | Z | ||
プレイヤー1 | A | 1:0 | 1:3 | 0:1 |
B | 0:4 | 0:1 | 5:0 |
(支配戦略の確認①)
まずは、このゲームについて、支配戦略が存在するかを考えましょう。
プレイヤー1にとっては、プレイヤー2の戦略がXとYのときには戦略Aを、プレイヤー2の戦略がZのときには戦略Bを選ぶことになります。
プレイヤー2の戦略がXやYのとき ⇒ プレイヤー1:戦略Aの利得1 > 戦略Bの利得0
プレイヤー2の戦略がZのとき ⇒ プレイヤー1:戦略Bの利得5 > 戦略Aの利得0
次に、プレイヤー2にとっては、プレイヤー1が戦略Aのときには戦略Yを、プレイヤー1が戦略Bのときには戦略Xを選びます。
プレイヤー1の戦略がAのとき ⇒ プレイヤー2:戦略Yの利得3 > 戦略Zの利得1 > 戦略Xの利得0
プレイヤー2の戦略がBのとき ⇒ プレイヤー2:戦略Xの利得4 > 戦略Yの利得1 > 戦略Zの利得0
これらのことから、このままでは支配戦略は存在しないことになります。
(戦略の逐次消去)
ところでもう一度、プレイヤー2の戦略を確認しましょう。
プレイヤー1が戦略A・Bいずれの場合でも、戦略Zは、プレイヤー2には最大の利得をもたらすことがありません。
プレイヤー1の戦略がAのとき ⇒ プレイヤー2:戦略Yの利得3 > 戦略Zの利得1 > 戦略Xの利得0
プレイヤー2の戦略がBのとき ⇒ プレイヤー2:戦略Xの利得4 > 戦略Yの利得1 > 戦略Zの利得0
なので、この戦略Zを消去します。このとき、利得マトリックスは次のようになります。
プレイヤー2 | |||
---|---|---|---|
X | Y | ||
プレイヤー1 | A | 1:0 | 1:3 |
B | 0:4 | 0:1 |
(支配戦略の確認②)
逐次消去されたこの利得マトリックスに基づいて、もう一度、支配戦略を確認しましょう。
プレイヤー1にとっては、プレイヤー2の戦略がXとYのときには戦略Aを選びます。
プレイヤー2の戦略がXのとき ⇒ プレイヤー1:戦略Aの利得1 > 戦略Bの利得0
プレイヤー2の戦略がYのとき ⇒ プレイヤー1:戦略Aの利得1 > 戦略Bの利得0
次に、プレイヤー2にとっては、プレイヤー1が戦略Aのときには戦略Yを、プレイヤー1が戦略Bのときには戦略Xを選びます。
プレイヤー1の戦略がAのとき ⇒ プレイヤー2:戦略Yの利得3 > 戦略Xの利得0
プレイヤー2の戦略がBのとき ⇒ プレイヤー2:戦略Xの利得4 > 戦略Zの利得0
これらのことから、プレイヤー2は相変わらず支配戦略が存在しないままですが、プレイヤー1は戦略Aが支配戦略になり、支配戦略が存在することになります。
(反復支配戦略均衡)
戦略Zを逐次消去したことで、プレイヤー1は戦略Aが支配戦略になりました。
このことから、プレイヤー2はより利得の高い戦略Yを選択することになり、均衡を得ることができます。
この均衡を反復支配戦略均衡といい、次のようになります。
プレイヤー1 ⇒ 戦略Aで利得1
プレイヤー2 ⇒ 戦略Yで利得3