ゲーム理論における支配戦略について

支配戦略

　ゲーム理論において、プレイヤーが戦略を選択するとき、他のプレイヤーの戦略によらず、必ず選択される戦略というものが考えられます。

　例えば、AとBという2つの戦略があるとき、他のプレイヤーがどのような戦略をとろうが、Bのほうが利得が高い場合には、Bのほうを必ず選択することになるでしょう。

　このように、他のプレイヤーの戦略が何であれ、利得が高い戦略があるとき、この戦略を「支配戦略」（優位戦略とも言います）といいます。

　そして、すべてのプレイヤーに支配戦略があるときには、ナッシュ均衡になりますが、このときの均衡を「支配戦略均衡」と言います。

例

　具体的なイメージをもってもらうため、顧客獲得競争ゲームを考えましょう。

　2つの店があり、価格競争をしているとします。各店は、価格を維持するか値下げを行うという選択を行います。

　両店とも「価格維持」・「値下げ」をした場合の利得は５になり、同じ利得を獲得します。片方の店が「価格維持」、もう一方の店が「値下げ」を行った場合には「価格維持」をした店の利得は３、「値下げ」を行った店の利得は７となり、「値下げ」を行った店は得をして、「価格維持」をした店は損（利得の減少）をすることになります。

　このとき、利得マトリックスは次のようになります。

		B店
		価格維持	値下げ
A店	価格維持	５：５	３：７
A店	値下げ	７：３	５：５

　A店にとって、

　　・B店が「価格維持」を選択　⇒　A店は利得７を得られる「値下げ」を行う
　　・B店が「値下げ」を選択　⇒　A店は利得５を得られる「値下げ」を行う

ということから、B店がどちらの戦略をとろうが、「値下げ」を選択することになり、A店にとって、「値下げ」は支配戦略になります。

　このことは、B店に当てはまり、B店も「値下げ」が支配戦略になり、ナッシュ均衡は、両店とも「値下げ」ということになります。そして、この均衡は、両店とも支配戦略によるものなので、この均衡は、支配戦略均衡になっています。

数式による定義

　最後に、複数のプレイヤーによる数式による定義を行っておきましょう。

　プレイヤー$i$の戦略を$s_i$、プレイヤー$i$を除いたプレイヤーの戦略を$s_{-i}$とします。

　各プレイヤーの組を$(s_i \, , \, s_{-i})$として、このときのプレイヤー$i$の利得を$\pi_i(s_i \, , \, s_{-i})$とすると、

　　$\pi_i(s’_i \, , \, s_{-i}) > \pi_i(s_i \, , \, s_{-i})$

が成立するとき、戦略$s’_i$は、プレイヤー$i$の支配戦略となります。

参考

　　岡田章『ゲーム理論・入門』

　　奥野正寛（編著）『ミクロ経済学』