はじめに
今日は昔の東大の数学の問題からの一問です。皆さん子どもの頃にじゃんけんグリコをしたことがある方は多いんじゃないでしょうか。あのじゃんけんをしてグーを出して勝てば3歩進めて…みたいなゲームです。
今回も問題はそのじゃんけんグリコでどのような戦略を取るのが最適かということにフォーカスした問題です。なかなか大人げないですね(笑)
なぜこの問題をチョイスしたかというと、この問題の答えは正しいんですが、ゲーム理論的には最適解じゃないんですよね。ま、詳しくは以下で解説します。
問題
\(A, B\)の二人がじゃんけんをして、
グーで勝てば3歩、チョキで勝てば5歩、パーで勝てば6歩
進む遊びをしている。
1回のじゃんけんで\(A\)の進む歩数から\(B\)の進む歩数を引いた値の期待値を\(E\)とする。
\(B\)がグー、チョキ、パーを出す確率の比が\(a, b, c\)であるとする。
\(A\)がどのような確率でグー、チョキ、パーを出すならば、任意の\(a, b, c\)に対し、\(E\geq 0 \)となるか。
(1992年 東大理系数学)
解答
表にするとこんな感じですね。
では問題の通り、\(B\)がグー、チョキ、パーを出す確率を\(a, b, c\)とし、\(A\)が出す確率を\(x, y, z\)とすると、\(A\)の1回のじゃんけんでの期待値は
\begin{align}
E &= 6/14 * 5/21 * 3 + 3/14 * 5/21 * (-6) + ay * (-3) + cy * 5 + az * 6 + bz * (-5) \\
&= -3a(y – 2z) + b(3x – 5z) + c(5y – 6x) \\
\end{align}
任意の\(a, b, c\)に対して\(E \geq 0\)を満たすには
\begin{eqnarray}
\left\{
\begin{array}{l}
xy – 2z \geq 0 \\
3x – 5z \geq 0 \\
5y – 6x \geq 0 \\
\end{array}
\right.
\end{eqnarray}
となればよい。ですが、問題の対称性から期待値がプラスにはならないんですね。だから解くべき方程式は以下のようになります。
\begin{eqnarray}
\left\{
\begin{array}{l}
xy – 2z = 0 \\
3x – 5z = 0 \\
5y – 6x = 0 \\
x + y + z = 1 \\
\end{array}
\right.
\end{eqnarray}
これを解けば
\begin{eqnarray}
\left\{
\begin{array}{l}
x = \frac{5}{14} \\
y = \frac{6}{14} \\
z = \frac{3}{14} \\
\end{array}
\right.
\end{eqnarray}
が正解となります。
ゲーム理論的解答
以下は問題の答えとは関係がない、ゲーム理論的な解です。
解の求め方は以下の記事を参考にしてください!


ナッシュ均衡点による解は
\begin{eqnarray}
\left\{
\begin{array}{l}
x = \frac{5}{21} \\
y = \frac{10}{21} \\
z = \frac{6}{21} \\
\end{array}
\right.
\end{eqnarray}
となります。
東大の解 vs ナッシュ均衡点
一般的にはこのゲームの解はナッシュ均衡点であるとは言われています。だからといって東大の問題の解である(グー、チョキ、パー) \(= (5/14, 6/14, 3/14)\)が最適ではないかと言われれば、それもそういうわけではなさそうです。
どちらの戦略が良いのかを簡単に判断する方法は、東大の解による戦略とナッシュ均衡点による戦略を戦わせればよいのです!てことでそれぞれの期待値を計算してみましょう。
今回は\(A\)さんが(グー、チョキ、パー) \(= (5/14, 6/14, 3/14)\)の戦略を、\(B\)さんが(グー、チョキ、パー) \(= (5/21, 10/21, 6/21)\)の戦略をとるとします。
- \(A\)さんが1回のじゃんけんで\(A\)の進む歩数から\(B\)の進む歩数を引いた値の期待値:
\begin{align}
E &= 5/14(3*10/21 – 6*6/21) + 6/14(-3*5/21 + 5*6/21) \\
& + 3/14(6*5/21 – 5*10/21) \\
&= 0 (これはそうなるように戦略を決定したので当たり前です。) \\
\end{align} - \(B\)さんが1回のじゃんけんで\(B\)の進む歩数から\(A\)の進む歩数を引いた値の期待値:\begin{align}
E &= 5/21(3*6/14 – 6*3/14) + 10/21(-3*5/14 + 5*3/14) \\
& + 6/21(6*5/14 – 5*6/14) \\
&= 0 \\
\end{align}
見事期待値が0で一致しましたね。ついでにですが、私はじゃんけんグリコで求めるべき期待値は相手と自分の差ではなく、自分のすすめる歩数の期待値だけだと思うんですよね。ですので、そちらも求めてみましょう。
- \(A\)さんが進む歩数の期待値
\begin{align}
E &= 5/14*3*10/21 + 6/14*5*6/21 + 3/14*6*5/21 \\
&= 10/7 \\
\end{align} - \(B\)さんが進む歩数の期待値
\begin{align}
E &= 5/21*3*6/14 + 10/21*5*3/14 + 6/21*6*5/14 \\
&= 10/7 \\
\end{align}
と同じ10/7となるのです。つまり、この2つの戦略はどちらも最適な戦略なんです!
不思議ですね、\((5/14, 6/14, 3/14)\)と\((5/21, 10/21, 6/21)\)という全く異なる2つの戦略が同じ期待値を取るなんて。
一般的にはナッシュ均衡点が最適解だと言われていますが、この問題に関しては東大の問題の解でも正しいんですね。なぜ期待値が一致するのかはよくわかりません(笑)
おわりに
じゃんけんグリコっていう子どもの遊びに対して最適戦略を考えるという大人気ない問題が面白かったので取り上げてみました。
これからじゃんけんグリコをする機会があれば、上のどちらかの戦略をとってみてくださいね(笑)
コメント