ギャン・バギャム・ソルドン

一打粉砕に怒喝の心力を込め、万物を叩き割る剛剣の刃を生み出さん

風俗遊びと多腕バンディット問題について

ずっと思ってたんですけど、風俗のお店選びって多腕バンディット問題ですよね。分からない…?心配しないで下さい。説明します。

 

・多腕バンディット問題

多腕バンディット問題とは強化学習の領域で考えられてる問題の一つです。簡単なモデルを使って問題について説明するので、そこから多腕バンディット問題のエッセンスを感じ取ってくれたら嬉しいです。知ってる方は飛ばしても大丈夫です。

いま僕の目の前にスロットマシンが2つあります。このスロットマシンのレバーを引くと当たりorハズレを観測でき、当たった場合は100円貰えます。2つのスロットマシンの当たりの出る確率は異なりますが、どちらが当たりやすいかは分かりません。この状況で、100回など限られた回数スロットを回して貰える金額を最大化させる方法を考えます。

当たりやすい方のスロットを回し続ければ貰える金額を最大化することが出来ますが、ここで問題が発生します。そもそも、どちらのスロットマシンが当たりやすいか分かりません。どちらのスロットが当たりやすいかを検証し見極める為に、2つのスロットマシンをどちらも回す必要があります。貰える金額を最大化するには検証をした後、当たりやすい方のスロットを回し続ける必要がありますが、検証回数が不十分だと当たる確率が低い方のスロットマシンを選んでしまう可能性高くなります。かと言って検証を行いすぎると、それだけ確率の高い方のスロットマシンを回せなくなるので貰える金額が下がってしまいます。

多腕バンディット問題とは、検証を行い当たりやすい方のスロットを見極める事(探索)と、検証結果に基づいて当たりやすい方のスロットを回す事(活用)をどのようなバランスで行うと、貰える金額が最大化するのかのアルゴリズムを考える問題です。

余談ですが、私が大学を卒業する時の教授の最後の挨拶がこの「多腕バンディット問題」の話でした。要約すると、人生は常に勉強なので当たりやすいスロットマシンばかりを回すのではなく、色んなスロットマシンを回す方が人生においては得だよって話でした。学術的でありながら含蓄のある話でもあったので、少し感動した覚えがあります。

 

・風俗遊びと多腕バンディット問題

さて、ここまで読んだ人であれば薄々勘付いてると思いますが、風俗遊びにおける、良かった嬢をリピートする(活用)or まだ見ぬ店や嬢を探して流離う(探索)、の2つの選択肢を選ぶことは本質的に満足度を最大化させる多腕バンディット問題なのです。スロットマシンと違うところは1回回すのに25000円かかるところですね。

つい先日、ふと立ち寄ったソプで○達さ○り似の嬢と遊んでしまいました。それはもう最高でした。もし女性声優に顔が似てる人達ばかり集めたソプがあったら是非行きたいです。最高なので勿論リピートも考えました。ですが、やはりここで頭を過るのは多腕バンディット問題です。伊○○ゆ○似の嬢をリピートすればそりゃもう満足間違いないでしょう。更にソプはリピートするとそれだけサービスが良くなる傾向があります。スロットマシンはリピートしてもいつもと同じく100円しか貰えません。ですがソプの場合リピートする度に150円、200円と貰える金額が増えていくようになっています。これは確かに魅力的です。ですが、伊達にばかりかまけていたらいつまで経っても青○○ぎ○似の嬢は見付けられません。そういう事です。

嬢は突然お店を辞めてしまうことも少なくないので、お気に入りの嬢を複数人作っておく戦略もアリなはずです。リピートすると満足度が更に高くなる、お気に入りの嬢が突然居なくなる等、これらを踏まえて多腕バンディット問題としてモデル化すると、もしかしたら風俗嬢を選ぶ際の最適なアルゴリズムが分かるかもしれません。

次回、モンテカルロシミュレーションで最適な風俗嬢の選び方を決めてみた!(やるかもしれないしやらないかもしれない)