記事一覧

確変と実力の境界 いいとこ取りをした場合、平均順位はどの程度変動するか 

 今日のお話はとつげき東北(凸)が10年以上前に研究したものである。

 システマティック麻雀研究所・麻雀の成績比較の方法論
 http://totutohoku.b23.coreserver.jp/hp/SLtotu14.htm

 凸の考察は平均順位(安定RATE)を対象としているが、この考えを段位(安定段位)に応用させたい。
 応用させるにあたり、(自分自身の)予習・復習を兼ねて記事にする。


 まず、こんなケースを考えてみよう。
 とあるプレーヤーが(例えば、鳳凰卓で)100試合で平均順位2.0をマークしたとする。
 これは確変だろうか?
 多くの人間は「確変である」と述べると思う。
 私自身もこの成績に幸運が寄与していることは異論はない。

 では、そのフィールド(例えば、天鳳の鳳凰卓)で平均順位2.5の人間が100試合で平均順位2.0をマークすることが可能だろうか
 もし、その可能性が低い(具体的には2.5%以下)のであれば、「100試合で平均順位2.0をマークした」という事実は、「その人の実力は平均順位2.5よりも上(数値に換算するなら下)」ということを意味する(厳密には「可能性が高い」だが)
 そうなれば、「100試合で平均順位2.0をマークした」という事実について「短期だから確変、確変だから意味がない」と言うのではなく、「この範囲で意味がある」と言い換えることが可能になる。
 
 では、多数試合(ここでは10000試合とする)から最も成績の良い(平均順位の低い)100試合、1000試合を引き抜いた場合、実力と比較して平均順位はどの程度下がるだろうか?
 今回はそれについて調べてみたい。


 調べ方は次のとおりである。

 平均順位2.5(順位分布は全部25%)の者に10000試合打たせた結果を記録する。
 様々な試合数毎でいいとこ取りした場合(最も平均順位の低い場合)の平均順位を求め、2.5から差し引くことで、平均順位の減少分を求める。
 このシミュレーションを10000回行い、平均順位の減少分の平均と標準偏差を求める。
 平均順位の減少分の平均に標準偏差の2倍を加えた値を、平均順位の減少分の限界値とし、この数値をいいとこ取りをしたときの平均順位の減少分の最大値(限界値)とする。

 平均順位の減少分の平均に標準偏差の2倍を加えることで、平均順位の減少分がそれよりも増える可能性はかなり低くなる(2.5%以下)
 この数値をもって、平均順位の減少分の限界値、つまり、いいとこ取りによって平均順位が減る最大の値とする


 いいとこ取りをする際の試合数と平均順位の減少分の平均、平均順位の減少分の限界値は次のグラフのとおりである。

FC21612161.jpg 


FC21612162.jpg 


FC21612163.jpg


 グラフの読み取り方を説明する。

 青の曲線は平均順位の減少分の平均値をプロットしたものである。
 プレーヤーの実力は平均順位2.5としているので2.5からこの数値を引けば、いいとこ取りをした場合の平均順位の平均を求めることができる。
 次に、赤の曲線は平均順位の減少分の限界値(平均順位の減少分の平均に標準偏差の2倍を足した値)をプロットしたものである。
 多く見積もって平均順位の減少分がどの程度になるかを見積もる場合にはこの数値を用いる。

 具体的に数値を見てみよう。
 1000試合における平均順位の減少分の平均は0.080、限界値は0.121となった。
 つまり、非常に多い試合数(ここでは10000試合)からいいところ1000試合を引き抜いた場合の平均順位の減少分は平均で0.08、最大値は0.121となるということである
 1000試合といえば、ある程度長期の試合数になるが、これも10000試合からいいところを引き抜いたと考えると、平均順位は平均して0.08下がるわけである(極端な場合、0.121下がることもある)。
 平均順位0.08となるとかなりの変動である。
 また、このシミュレーション結果から「1000試合で平均順位2.37をマークした者」は、「仮に、その結果が成績のいいところ1000試合を引き抜いた場合のものであるとしても、その者の実力は2.5(厳密には2.491)よりも上(数値で言うなら下)になる」と言える(厳密に表現すれば「その可能性が97.5%以上ある」)。

 もう一つ例をあげる。
 100試合における平均順位の減少分の平均は0.36、限界値は0.45となった。
 これからいえることは、非常に多い試合数からいいところ100試合を引き抜いた場合の平均順位の減少分は平均で0.36、最大値は0.45となるということである
 ここから「100試合で平均順位2.0をマークした者」は、「仮に、その結果が成績のいいところ100試合を引き抜いた場合のものであるとしても、その者の実力は2.45よりも上(数値で言うなら下)になる」と言える(厳密に表現すれば「その可能性が97.5%以上ある」)。
 先程、「100試合で平均順位2.0をマークした」という事実を例に取り上げたが、今回のシミュレーション結果から、「100試合で平均順位2.0をマークした」という事実から「その者の実力は平均順位2.45よりも上(数値的には下)」と高度の蓋然性(97.5%以上)をもって推測できるわけである。

 その他の試合数の場合については適宜グラフから読み取って欲しい(細かい数値は下に掲げた)。
 この数値を用いることで「試合数が少ないから確変である」として切り捨ていたデータから「このデータからこのようなことが言える」に変換できるようになる
 もっとも、試合数が極めて少ない場合(例えば30試合以下)の場合、平均順位の上昇分が1.0を超えるようなところでは、平均順位2.5のケースをそのまま流用していいか疑問が残る。
 個人的には、平均順位の減少分の限界値が1.0を切るレベル、具体的には30試合以上から使用した方がいいのではないかと思う。


 ちなみに、これらの考えから生まれた概念が「最低保証安定RATE」である。
 これは、「成績の引き抜き方について自由にしていい(つまり、いいとこ取りをしてもよい)」とし、その点を考慮した上で最低どの程度実力が保証されているかを見積もったものである。
 従前述べた、平均順位等の標準偏差から実力の最低限のラインを見積もる場合、いいとこ取りは許されない。
 また、第三者から見た場合、それがいいとこ取りをしたのか否かを判別することができない(鳳凰卓のように総ての牌譜が公開されていれば、チェックをすることが可能だが、そのような環境は稀である、その場合、発表者の善意にすがるしかない)。
 他方、こちらは(求め方は異なるが)いいとこ取りをしても良い。
 その点で成績比較の方法として優れていると思われる

 そこで、これを安定段位に応用してみたい。
(もっとも、段位への応用は困難になることが予想され、途中で頓挫するかもしれないが)


 では、今回はこの辺で。


なお、グラフの数値は次のとおりである。
(試合数の間と間になっているところについては線形補完によって見積もって欲しい)
試合数 平均順位の減少分の平均 平均順位の減少分の限界値
50 0.53062875 0.646742625
60 0.478475625 0.587050875
70 0.438030938 0.539649188
80 0.40542375 0.502841813
90 0.378456563 0.470612438
100 0.35568 0.444683625
150 0.279421875 0.356751938
200 0.234563438 0.304521375
300 0.181890938 0.242747063
400 0.150973125 0.205377938
500 0.130337813 0.180513938
600 0.115328438 0.162536438
700 0.103793438 0.148773188
800 0.094525313 0.137631563
900 0.087023063 0.128699625
1000 0.080662031 0.121372031
1500 0.059325375 0.095214
2000 0.046870969 0.079973156
3000 0.03218925 0.062056313
4000 0.023436375 0.051447938
5000 0.017417813 0.044404313
6000 0.012934969 0.039100594
7000 0.009584625 0.03481275
8000 0.006812438 0.031077
9000 0.004202906 0.027548344
スポンサーサイト

コメント

コメントの投稿

非公開コメント

プロフィール

Meanin Gless

Author:Meanin Gless
 初めてこのサイトを訪れた方へ(出来る限り御読みください)

1 このブログで記載する内容と程度 

 このサイトは麻雀に関する調査結果・研究結果を調査過程・研究過程を含めて厳格に記述するサイトです。
 原則として、このブログの文章に「(数学・プログラムについて相応の知識・技術を持った人が)ここに書かれた文章の内容を再現し、文章の内容が正しいことを確認するために必要なこと」は総て記載していく予定です。
 もちろん、牌譜分析をした結果をそのまま表示する場合、重複する場合、後で細かく書く場合、他に書かれていて書く必要がない場合、情報の速報性を重視する必要のある場合は別ですが、それはあくまで例外です。

 このブログの文章の第一のターゲットは、後世の麻雀研究者になっております。
 次が、巷に流れる麻雀戦術が正しいのかを知りたい人、理由付きで麻雀戦術を知りたい人になります。
 申し訳ありませんが、麻雀戦術が使えるようになりたい、麻雀戦術を分かりやすく知りたいと思われる方は、このサイトの99%は役に立たないと思います。
 麻雀戦術について詳細に記したサイト、分かりやすく記したサイトは、たくさんありますので、そちらを読まれた方がよいかと思います。


2 分かりやすさへの配慮について

 なお、理想論としては、私は、このブログの文章の内容を分かりやすく説明するところまでもっていきたいとは思っております。
 しかし、それだけの余力は現在ありません。
 そのため、「この記事を理解すれば役に立ちそうだから、このブログの解説記事を作ってほしい」と思われた方は、コメント欄にてリクエストをしてください。
 リクエストされた時の私の状況にもよりますが、出来る限り対応したいと思います。


3 当サイトの目標

 当サイトは「科学する麻雀」の理論を発展させることを目的としております。
 もちろん、発展の中には、「細かい修正」も入りますが、できれば、天鳳の赤アリ麻雀の牌譜を分析し、必要であれば、抜本的な理論の改変も目標にしたいと思います。
 また、「科学する麻雀」には秋刀魚に関する記述が乏しいため、秋刀魚に関する分析もしたいと思っております。
 その辺の研究が一通り終わりましたら、数理的裏付けの取れたある程度分かりやすい麻雀戦術記事を書きたいと思っておりますが、、、それは1年以上あとの話になるでしょうね。

4 引用について

 基本的に、ネット上のブログに引用する際には、

 ① 私がシミュレーション又は牌譜解析したこと
 ② このサイトのデータである旨

を書いた上で引用する限り、自由に引用していただいて構いません
(ただし、あたかも私が行った牌譜解析・シミュレーションを自分がやったかのように記載して転載するのはやめてください)。

 しかし、

 ① 営利目的使用
 ② 紙媒体に使用する場合

 は、コメントにて、私にご一報ください。
「① 私がシミュレーション又は牌譜解析したことの記載、②このサイトのデータである旨の記載」さえあれば、拒否することは致しませんが、私に再試の機会を与えていただきたいと思っているためです。

 引用について、このようなことを書くのもはばかられますが、某所でちょっとありましたので、このようなことを認めさせて頂きました。
 ご理解いただければ幸いです。


 では、よろしくお願いします。

カテゴリ

アクセス数