ギャン・バギャム・ソルドン

一打粉砕に怒喝の心力を込め、万物を叩き割る剛剣の刃を生み出さん

【マイマイルドじゃんけん真剣部】vs菅野真衣におけるじゃんけんの最適戦略に関する考察

この夏の自由研究です。

初めに

菅野真衣のマイペースマイワールドには番組終了前にじゃんけんをする名物コーナーがあります。今回はそのじゃんけんで勝率を最大化する戦略を考えます。アプローチとしては、菅野真衣さんの出す手が従う法則性を仮定し、それに対して高い勝率の出る戦略を示します。2023年8月30日現在、ニコニコ動画には第30回までのアーカイブが上がっている為、そこまでの手を分析の対象とします。第25回はマイマイルド公録回で菅野真衣さんの口から出した手の情報が出ていませんが、一旦パーとして分析を行います。(イベントだしチョキ出すでしょ読みでグー出したら負けた記憶があるような...)
また、戦略の評価は第31回以降のじゃんけんの勝率とします。分析に使用するデータを表1に、(グー)=1, (チョキ)=2, (パー)=3 とした時の出した手の変化を図1に示します。

表1:菅野真衣さんの出した手のデータ

 

図1:菅野真衣の出す手の変化

 

ではこのデータを元に戦略を考えていきます。

 

アプローチ①:菅野真衣さんの手が同一の分布から独立に実現すると仮定

グーを出す確率 g_n、チョキを出す確率 c_n、パーを出す確率 p_n が予め決まっていて、そこからランダムに手を出してくると仮定します。この時、それぞれの手を出す確率は二項分布の最尤推定の考え方を用いるとデータから簡単に推定できて、 g_n = 37.9 \% , c_n = 27.6 \% , p_n = 34.5 \% となります。

よって、最適戦略は「パーを出し続ける」でこの時の勝率の理論値は  37.9 \% です。

 

アプローチ②:菅野真衣さんの手にマルコフ性があると仮定

マルコフ性があるとは、未来の状態は現在に依存し、それより過去の状態には影響されない性質のことです。つまり「今回はグーを出したから、次回もグーを出しちゃおっかなー(この菅野真衣はフィクションである)」という具合に、次回に出す手は今回出したじゃんけんの手に依存するということです。

この考え方の下で推定した確率推移行列 Pと定常分布 \piを下記に、マルコフモデルを図2に示します。確率の高い遷移を赤字で、確率の低い遷移を青字で書いています。定常分布がアプローチ①で求めた分布に近しいものになっているのは直感的でかつ興味深い結果ですね。(はてなブログの表記の都合上、行列にカンマが入っているのは許してください)(カンマちゃんだけに)

図2:菅野真衣さんの出す手のマルコフモデル(直前の手に依存)

この時の最適戦略は「1つ前の菅野真衣さんの手がグーorパーの場合はパー、チョキの場合はチョキ」です。勝率の理論値は  49.7 \% です。

また、じゃんけんの手は3つなので、3手前の手との関連性が高い可能性があるというモチベーションの下で、次回出す手が前々回に出した手に依存すると仮定した場合(N回目の手がN-3回目の手に依存するという仮定)の確率遷移行列 P、定常分布 \piマルコフモデルを図3に示します。

図3:菅野真衣さんの出す手のマルコフモデル(3手前の手に依存)

この時の最適戦略は「3つ前の菅野真衣さんの手がグーorパーの場合はチョキ、チョキの場合はパー」です。勝率の理論値は  53.8 \% で高い結果となります。

 

アプローチ③:機械学習モデルを当てはめて法則性を探る

機械学習を用いて多クラス分類を行い、次に出す手を予測します。今回は少ないデータに対して当てはめを行える非線形SVMを用います。また訓練データとテストデータの分割は行いません。(許して)余談ですがSVMについては点と直線の距離を用いて説明した記事が分かりやすいです。

説明変数には3個前までの手と、周期性があることを仮定して第3n回、3n+1回、3n+2回の時に1となるフラグをそれぞれ用意しています。実装したものを付録に置いておきます。一対一分類は「グーorチョキ」「グーorパー」「チョキorパー」の3つ分類器を用いて、一対他分類は「グーorグー以外」「チョキorチョキ以外」「パーorパー以外」の3つの分類器を用いて分類しています。訓練データに対するフィットは一対一分類が  0.461、一対他分類は  0.846 となっており、後者のほうが当てはまりが良いです。ですが、テストデータを用意していないので実際に手を精度良く当てられるかと問われたらNoでしょう。

一応記しておくと、このアプローチでの最適戦略は「一対他のSVM分類器を用いて次回の手を予測、それに対して勝てる手を出す」です。

 

アプローチ④:サザエさんとの関連性を仮定

菅野真衣さんはラジオの終わり際に「ふっふふっふふー!」などの発言をよくします。これは明らかにサザエさんを意識しているものです。つまり、サザエさんの出す手との関連性について検討する価値は十分にあると考えます。サザエさんとの勝敗について纏めたものを表2に示します。

表2:菅野真衣vsサザエさんの勝敗

現在の戦績は13勝8敗8分けです。...菅野真衣さん、順当にじゃんけんが強いですね。後出しをしているから勝率が高い可能性も否定できませんが、この勝率であれば関連性を仮定する価値がありそうです。よって、「菅野真衣さんの出す手は、ラジオの2日前に行われるサザエさんの出す手に高い確率で勝つ」と仮定すると、サザエさんの出す手に対して負ける手を出す」ことで菅野真衣さんに対する勝率の理論値は  44.8 \% になります。

 

各戦略の評価

※2023/11/29 ラジオ言及記念の追記。
第31回~第40回のデータを用いて、菅野真衣さんの手とそれに対する各アプローチが導き出した手を戦わせます。じゃんけんの勝敗について表3にまとめます。なお、ピースはチョキとして扱います。最も勝率が高いアプローチは手法②-2で、3手前の手に依存するマルコフモデルでした。特に第31回~第35回に目を向けると、4勝1敗で高勝率を収めています。一方で手法③-2については1勝もしておらず、モデルが過学習している等の原因が考えられます。
また、9/19 以降の勝敗を見ると明らかに負けが込んでいます。この記事の初回投稿が 2023/8/31 なので、 それ以降の収録で菅野真衣さんに対策を講じられたと考えるのが妥当でしょう。悪い女!!!!(嘘です、良い声優さんです)継続的に勝ち続けるには、対策を打たれた後の癖や傾向をさらに分析・モデル化する必要がありそうです。

表3:菅野真衣vs各戦略


 

終わりに:課題と今後の展望

課題としてやはりデータの少なさが挙げられます。菅野真衣さんの手のデータが30に満たないのがネックです。またタイムシフト期間を終えたラジオはすぐに動画で上がると嬉しいです(チュチュ、頼んだ!)。このラジオがずっと続いていくためにも会員さんがもっと増えたら良いなと思います。

 

付録:実装