【受験数学】じゃんけんグリコの最適戦略

高校数学

はじめに

今日は昔の東大の数学の問題からの一問です。皆さん子どもの頃にじゃんけんグリコをしたことがある方は多いんじゃないでしょうか。あのじゃんけんをしてグーを出して勝てば3歩進めて…みたいなゲームです。

今回も問題はそのじゃんけんグリコでどのような戦略を取るのが最適かということにフォーカスした問題です。なかなか大人げないですね(笑)

 

なぜこの問題をチョイスしたかというと、この問題の答えは正しいんですが、ゲーム理論的には最適解じゃないんですよね。ま、詳しくは以下で解説します。

問題

\(A, B\)の二人がじゃんけんをして、

グーで勝てば3歩、チョキで勝てば5歩、パーで勝てば6歩

進む遊びをしている。

1回のじゃんけんで\(A\)の進む歩数から\(B\)の進む歩数を引いた値の期待値を\(E\)とする。

\(B\)がグー、チョキ、パーを出す確率の比が\(a, b, c\)であるとする。

\(A\)がどのような確率でグー、チョキ、パーを出すならば、任意の\(a, b, c\)に対し、\(E\geq 0 \)となるか。

(1992年 東大理系数学)

 

解答

表にするとこんな感じですね。

では問題の通り、\(B\)がグー、チョキ、パーを出す確率を\(a, b, c\)とし、\(A\)が出す確率を\(x, y, z\)とすると、\(A\)の1回のじゃんけんでの期待値は

\begin{align}
E &= 6/14 * 5/21 * 3 + 3/14 * 5/21 * (-6) + ay * (-3) + cy * 5 + az * 6 + bz * (-5) \\
&= -3a(y – 2z) + b(3x – 5z) + c(5y – 6x) \\
\end{align}

任意の\(a, b, c\)に対して\(E \geq 0\)を満たすには

\begin{eqnarray}
\left\{
\begin{array}{l}
xy – 2z \geq 0 \\
3x – 5z \geq 0 \\
5y – 6x \geq 0 \\
\end{array}
\right.
\end{eqnarray}

となればよい。ですが、問題の対称性から期待値がプラスにないんですね。だから解くべき方程式は以下のようになります。

\begin{eqnarray}
\left\{
\begin{array}{l}
xy – 2z = 0 \\
3x – 5z = 0 \\
5y – 6x = 0 \\
x + y + z = 1 \\
\end{array}
\right.
\end{eqnarray}

これを解けば

\begin{eqnarray}
\left\{
\begin{array}{l}
x = \frac{5}{14} \\
y = \frac{6}{14} \\
z = \frac{3}{14} \\
\end{array}
\right.
\end{eqnarray}

が正解となります。

3変数の連立方程式で4つ式がある時って解がない場合が多いんですよね。しかし、今回の場合、4つの式のうち独立であるものは3つだけなので、解が一意に定まってしまうというわけですね。連立方程式の独立と従属については大学の線形代数の授業で詳しく学べると思います。

ゲーム理論的解答

以下は問題の答えとは関係がない、ゲーム理論的な解です。

解の求め方は以下の記事を参考にしてください!

ナッシュ均衡点の導出 Part1
はじめに ある程度のゲーム理論に関する用語は説明なしに使っていきます。何を言っているのかが全くわからないという方はある程度ゲーム理論の勉強をしてからのほうがいいと思います。 いちおう以下はこのブログで解説しているゲーム理論の記事...
ナッシュ均衡点の導出 Part2
以前の記事の続きです。先にこれ読んだ方がわかりやすいと思います! ナッシュ均衡点の導出方法3:Lemke-Howson algorithm これまでに2つのナッシュ均衡点の導出方法を紹介しましたが、どちらも全てのナッシュ...

ナッシュ均衡点による解は

\begin{eqnarray}
\left\{
\begin{array}{l}
x = \frac{5}{21} \\
y = \frac{10}{21} \\
z = \frac{6}{21} \\
\end{array}
\right.
\end{eqnarray}

となります。

東大の解 vs ナッシュ均衡点

一般的にはこのゲームの解はナッシュ均衡点であるとは言われています。だからといって東大の問題の解である(グー、チョキ、パー) \(= (5/14, 6/14, 3/14)\)が解ではないかと言われれば、それもそういうわけではなさそうです。

どちらの戦略が良いのかを簡単に判断する方法は、東大の解による戦略とナッシュ均衡点による戦略を戦わせればよいのです!てことでそれぞれの期待値を計算してみましょう。

今回は\(A\)さんが(グー、チョキ、パー) \(= (5/14, 6/14, 3/14)\)の戦略を、\(B\)さんが(グー、チョキ、パー) \(= (5/21, 10/21, 6/21)\)の戦略をとるとします。

  • \(A\)さんが1回のじゃんけんで\(A\)の進む歩数から\(B\)の進む歩数を引いた値の期待値:
    \begin{align}
    E &= 5/14(3*10/21 – 6*6/21) + 6/14(-3*5/21 + 5*6/21) \\
    & + 3/14(6*5/21 – 5*10/21) \\
    &= 0 (これはそうなるように戦略を決定したので当たり前です。) \\
    \end{align}
  • \(B\)さんが1回のじゃんけんで\(B\)の進む歩数から\(A\)の進む歩数を引いた値の期待値:\begin{align}
    E &= 5/21(3*6/14 – 6*3/14) + 10/21(-3*5/14 + 5*3/14) \\
    & + 6/21(6*5/14 – 5*6/14) \\
    &= 0 \\
    \end{align}

見事期待値が0で一致しましたね。ついでにですが、私はじゃんけんグリコで求めるべき期待値は相手と自分の差ではなく、自分のすすめる歩数の期待値だけだと思うんですよね。ですので、そちらも求めてみましょう。

  • \(A\)さんが進む歩数の期待値
    \begin{align}
    E &= 5/14*3*10/21 + 6/14*5*6/21 + 3/14*6*5/21 \\
    &= 10/7 \\
    \end{align}
  • \(B\)さんが進む歩数の期待値
    \begin{align}
    E &= 5/21*3*6/14 + 10/21*5*3/14 + 6/21*6*5/14 \\
    &= 10/7 \\
    \end{align}

と同じ10/7となるのです。つまり、この2つの戦略はどちらも最適な戦略なんです!

不思議ですね、\((5/14, 6/14, 3/14)\)と\((5/21, 10/21, 6/21)\)という全く異なる2つの戦略が同じ期待値を取るなんて。

一般的にはナッシュ均衡点が最適解だと言われていますが、この問題に関しては東大の問題の解でも正しいんですね。なぜ期待値が一致するのかはよくわかりません(笑)

おわりに

じゃんけんグリコっていう子どもの遊びに対して最適戦略を考えるという大人気ない問題が面白かったので取り上げてみました。

これからじゃんけんグリコをする機会があれば、上のどちらかの戦略をとってみてくださいね(笑)

コメント

タイトルとURLをコピーしました