支配戦略
ゲーム理論において、プレイヤーが戦略を選択するとき、他のプレイヤーの戦略によらず、必ず選択される戦略というものが考えられます。
例えば、AとBという2つの戦略があるとき、他のプレイヤーがどのような戦略をとろうが、Bのほうが利得が高い場合には、Bのほうを必ず選択することになるでしょう。
このように、他のプレイヤーの戦略が何であれ、利得が高い戦略があるとき、この戦略を「支配戦略」(優位戦略とも言います)といいます。
そして、すべてのプレイヤーに支配戦略があるときには、ナッシュ均衡になりますが、このときの均衡を「支配戦略均衡」と言います。
例
具体的なイメージをもってもらうため、顧客獲得競争ゲームを考えましょう。
2つの店があり、価格競争をしているとします。各店は、価格を維持するか値下げを行うという選択を行います。
両店とも「価格維持」・「値下げ」をした場合の利得は5になり、同じ利得を獲得します。片方の店が「価格維持」、もう一方の店が「値下げ」を行った場合には「価格維持」をした店の利得は3、「値下げ」を行った店の利得は7となり、「値下げ」を行った店は得をして、「価格維持」をした店は損(利得の減少)をすることになります。
このとき、利得マトリックスは次のようになります。
B店 | |||
---|---|---|---|
価格維持 | 値下げ | ||
A店 | 価格維持 | 5:5 | 3:7 |
値下げ | 7:3 | 5:5 |
A店にとって、
・B店が「価格維持」を選択 ⇒ A店は利得7を得られる「値下げ」を行う
・B店が「値下げ」を選択 ⇒ A店は利得5を得られる「値下げ」を行う
ということから、B店がどちらの戦略をとろうが、「値下げ」を選択することになり、A店にとって、「値下げ」は支配戦略になります。
このことは、B店に当てはまり、B店も「値下げ」が支配戦略になり、ナッシュ均衡は、両店とも「値下げ」ということになります。そして、この均衡は、両店とも支配戦略によるものなので、この均衡は、支配戦略均衡になっています。
数式による定義
最後に、複数のプレイヤーによる数式による定義を行っておきましょう。
プレイヤー$i$の戦略を$s_i$、プレイヤー$i$を除いたプレイヤーの戦略を$s_{-i}$とします。
各プレイヤーの組を$(s_i \, , \, s_{-i})$として、このときのプレイヤー$i$の利得を$\pi_i(s_i \, , \, s_{-i})$とすると、
$\pi_i(s’_i \, , \, s_{-i}) > \pi_i(s_i \, , \, s_{-i})$
が成立するとき、戦略$s’_i$は、プレイヤー$i$の支配戦略となります。
参考
岡田章『ゲーム理論・入門』
奥野正寛(編著)『ミクロ経済学』