はじめに
ゲーム理論はとてもおもしろい分野で興味を持っている人も結構いると思います。しかし、検索してもちゃんと説明してくれている日本語の記事は少ないですね~。私も教科書や論文ほどがっつりは説明はしませんが、できるだけ深く、わかりやすく解説していきます!
ゲーム理論って?
Wikipedia様の定義を見てみましょう。
ゲーム理論(ゲームりろん、英: game theory)とは、社会や自然界における複数主体が関わる意思決定の問題や行動の相互依存的状況を数学的なモデルを用いて研究する学問である。
うん、私が説明してもこれ以上簡潔で的を得ている説明はできないです。でもこれを読んでもあんまりイメージできないんじゃないかと思います。
ですので、まずは具体例を見てみましょう!きっとそれが1番
例
囚人のジレンマ
これが1番有名な例です、名前を聞いたことがあるって人も結構いるんじゃないですか?
ある2人の囚人の駆け引きです。2人はある犯罪を犯した容疑で逮捕されました。しかし、警察は確実な証拠は見つかっていません。そこでそれぞれの囚人に直接聞くことにしました。その際に囚人には次のように提案しました。
- 片方の囚人だけが自白し、片方が黙秘した場合は自白した囚人の刑期を1年にし、黙秘を続けた囚人の刑期は5年とする。
- 2人とも自白した場合は2人とも刑期は3年、2人とも黙秘した場合は2人とも刑期は2年とする。
囚人は別々の独房に入れられており、お互い相手がどのような返事をしているのかは全く知りません。ではそれぞれの囚人はどのように答えるのが正しいのでしょうか??
損得表をわかりやすく表にまとめると次のようになります。
この問題の解は一般的にどのようになると考えられているでしょうか?
どう考えてもお互い黙秘するのがお互いにとっては良い結果ですよね。でもゲーム理論の解はお互いが自白することなんです。この(自白、自白)の組をナッシュ均衡点と呼ばれています。詳しくは下で解説します。
コナン vs 怪盗キッド
自分で考えた問題です。
キッドとコナンは今東京駅にいます。キッドは大阪に逃げたいと思っており、コナンくんもそれを知っています。しかし、後を追って新幹線に乗っているコナンくんに捕まってしまえば元も子もありません。そのため、キッドには途中の名古屋駅で降りるという選択肢もあります。もちろんコナンくんにも名古屋駅で降りるという選択肢はあります。
つまり、コナンくんはキッドと同じ駅で降りることができれば勝ち、キッドはコナンくんと異なる駅で降りれば良し、新大阪駅で降りることができれば万々歳となります。損得表は以下のようになります。

キッド、コナンくんはそれぞれはどのように行動するのが正解でしょうか??
すこしややこしいですが、直感でもいいので答えを出してみてください!
それでは解答です。実はキッドは1/2の確率で名古屋駅、1/2の確率で新大阪駅に降りるのが良い選択です。そして面白いのはコナンくんの行動で、コナンくんは1/4の確率で名古屋駅、3/4の確率で新大阪駅に降りるのが良い選択となります。つまり、正4面体のサイコロを投げて1が出たら名古屋駅、それ以外ならば新大阪駅で降りることになります。
これがまた面白いところですね!簡単に名古屋駅!新大阪駅!!などといった答えるのではなく、確率的に行動を選択するのが正解であると主張しているわけですから。
じゃんけんグリコ
最後はみんなが幼い頃に遊んだであろう、じゃんけんグリコです!正式名称がこれであっているのかしりませんが(笑)

Aさん、Bさんはそれぞれじゃんけんで何を出すのが正解なのでしょうか??
いやー、この遊びをしていた頃にそんなに深く考えていた子はきっといないでしょうね(笑)
実はこれ、東大の入試問題で出ています。しかしその解答はゲーム理論における解とは少し異なっていました。それもいつか記事にしたいと思います。
この解はグー、チョキ、パーをそれぞれ(5/21, 10/21, 2/7)でだす、というものです。
3つの例を通して少しゲーム理論がどんなものなのかは掴めてきたのではないでしょうか??次はどんなゲームが存在するのか、見ていきましょう!
ゲームの種類
ゲーム理論におけるゲームは様々な種類に分類されます。ここでは代表的なゲームの概略だけを紹介します。
戦略系ゲーム
最も基本的なゲームの形式です!1回限りのゲームで全てのプレイヤーが同時に戦略を決定するゲームです。上記の例で言うと、囚人のジレンマやコナン vs 怪盗キッドがその例です。相手の戦略との兼ね合いで自分の利得が決定されるため、後述のナッシュ均衡点を知らないと解を導出するのはかなり難しいんじゃないかと思います。
このゲームを基本として他のゲームも議論されていきます。
展開型ゲーム
名前通り、局面が展開していくゲームです。つまりそれぞれのプレイヤーの手番が交互に訪れるようなゲームのことです。囲碁や将棋などが分かりすい例でしょう!
これをマスターすればあらゆるボードゲームもほぼ確実に勝てるでしょう!(実際にはそんな計算してる暇はないよ笑)
情報不完備ゲーム
これまでは相手がどんな手を選択する可能性があるか、利得はどのようになるか、などの情報は知らされていることが前提となっていました。しかし、情報不完備ゲームではそれらの情報は必ずしも公開されていません。つまりかなり難しいゲームです。
公開されていない情報をどのように数式で表すのか、とても工夫されています。ポケモンの対戦などはこれに該当するんじゃないでしょうか?
繰り返しゲーム
名前通り、同じゲームを何度も繰り返すゲームです。上記の展開型ゲームは局面が展開していくため、シチュエーションは変わっていきますが、繰り返しゲームは完全に同じシチュエーションのゲームを何度も行います。例では「じゃんけんグリコ」がこれに該当します。
面白いのは戦略系ゲームである「囚人のジレンマ」を無限回繰り返す場合は、ナッシュ均衡点は(黙秘、黙秘)となるということです!一度裏切って自白してしまうと、今後相手にも自白されてしまい、結果的に利得は下がってしまうんでしょうね。
交渉ゲーム
最後は交渉ゲームです。これまでは自分の戦略を決定するのに交渉の選択肢などありませんでしたが、このゲームではそれが許されています。つまりは交渉によってより良い利得を得ることが可能なゲームです!交渉すればいつでも2人にとって最適な結果となるんじゃないか?と思う方もいらっしゃるかもしれませんが、必ずしもそうとは限りません。例えば上記の「囚人のジレンマ」ではたとえ交渉することが可能だったとしても、結果は(自白、自白)となってしまうでしょう。お互いがどれだけ”自分は黙秘する”と言い張っても、その行動に強制力がない限りは信用することはできません。
以上が主なゲームの種類です。それでは次は再三出てきたナッシュ均衡点の紹介です!
ナッシュ均衡点
ゲーム理論の解はこれまで長年研究され続けてきました。その中でも現在、解として考えられているのがナッシュ均衡点です!では定義を見てみましょう。
簡単に言うとナッシュ均衡点とは、どのプレイヤーも自分だけが戦略を変更しても自分はそれ以上の利得を得ることができない戦略の組です。
「囚人のジレンマ」の例で考えてみましょう!
(自白、自白)という戦略の組から片方だけが他の戦略、つまり黙秘に戦略を変更したとします。そうすると刑期は3年から5年と長くなってしまいます。これは囚人AとB両方に成り立つことであるので、(自白、自白)の組はナッシュ均衡点であるとわかります。
逆に(黙秘、黙秘)の組を考えてみましょう。囚人Aが自白に戦略を変更した場合、刑期は2年から1年と短くなります。つまり、より多くの利得を得ることができるため、ナッシュ均衡点ではありません!
どうでしょうか?直感的になぜナッシュ均衡点が解として考えられているのかがわかったのではないでしょうか?他の人がナッシュ均衡点に従うのであれば、自分も従わざるを得ない‥そういう理論です。
しかし、そのナッシュ均衡点を導出するのは結構難しいです。(自白、自白)のような単純な戦略の組なら簡単かもしれません。しかし例えば、2人の囚人がそれぞれ自白する確率を3/8、黙秘する確率を5/8とする戦略がナッシュ均衡点だった場合は簡単には導出することはできません。
ナッシュ均衡点を導出するアルゴリズムで最も有名なのがLemke-Howson algorithmです。以下の記事ではその解説を行っています!!
おわりに
今回はゲーム理論の表面だけ触れてみました。しかし、ゲーム理論は学べば学ぶほど奥深く、面白いので、今後はさらに深く解説していきたいなと思っています!
みんなで頑張ってゲーム理論をマスターして、世の中全てのボードゲーム、世界経済を支配しましょう!!←無理
コメント