記事一覧

保証安定RATE(平均順位)の長所と短所

 今回は私が知識を確認するために書いた備忘録のようなものである。
 そういうわけで、興味のない人は回れ右を。


 前回、保証安定RATEの概念を段位に応用するにあたり、いいとこどりをすることでどの程度平均順位は下がるのか(RATEや実力なら上がるのか)について再試した。
 この上昇する程度(数値)を用いた具体的な実力指標がとつげき東北の生み出した保証安定RATEである。

 保証安定RATEとは、その結果が長期成績(具体的には10000試合)からいいところを引き抜いたと仮定して、その場合の実力の最低値を求めたものである。
 簡単に言えば、保証安定RATEというのは「全体から一部を引き抜き、その成績が鬼のような確変(10000試合打ったうちで得られる確変レベル)を伴うものだったとしても、その成績を取るためにはこれだけの実力がなければならないと言える、その実力」である。

 やや簡単な説明になるが、「一番いいところを引き抜いた場合、100試合で平均順位nだった」という場合、保証平均順位はn+0.45である(天鳳RATEならいいとこ取りをした場合に得られたRATEから480引いた値)。
「一番いいところを引き抜いた場合、1000試合で平均順位nをマークしたときの最低保証平均順位はn+0.121」である(天鳳RATEならいいとこ取りをした場合に得られたRATEから129引く)。

 なお、今回はその人がとると考えられる最低ラインの実力を求めているが、逆方向に使えばその人の限界(最も高い実力)が判明する
 例えば、何試合か打ったがもっとも悪いところを引き抜いた場合、100試合で平均順位3.0だったとしよう。
 この場合、その人の実力は最低でも平均順位2.55よりも上(実力的には下)と言うことが出来る(つまり、平均以下ですな)。
 平均順位の場合、いいとこ取りをした場合と悪いところどりをした場合の平均順位の変動分は殆ど同じなので、同様に考えることができる(段位の場合はこうはいかない)。
 その数値の幅を用いて求めた値が保証安定RATEである(なお、保証安定RATEは上限と下限の両方について用いられるらしいが、ここでは下限のみに注目して述べる)。


 では、保証安定RATE等の長所と短所はどうか?

 この手法の最大のメリットは、成績提供者が「いいとこどり」をしたか否かについて検証する必要がないことである。
 例えば、全成績を使って、試合数の2σから実力の範囲(最大と最低)を見積もる方法がある。
 この方法ではいいとこどりをすることができない
 となると、「その成績がいいとこどりをしていない」ことを検証しなければならない
 しかし、そのような検証は事実上不可能である。

 また、ある人がある日までを打ち方Aを基準に打っていて、その後の打ち方Bに変えたとする。
 この場合、AとBの打ち方による成績の検証をするならば、AとBを分けなければならない。
 また、打ち方Bの成績の方がいい場合、その人の現在の実力は打ち方Bによって打った成績のみで検討するのが妥当であろう。
 しかし、その主張が本当かどうか、悪い意味でいいとこどりになっていないことを証明するのは難しい。
 自分で検証する分には自分に対して嘘をつく必要はないので問題はないが、第三者に対して「今の私は打ち方Bに変えたので、一部の成績は削除したい」といってもそれが本当であることの証明は難しい。
 他方、証明できないからといって無制限にこれを許すと、いいとこどりをしたい放題になって前提が崩壊する。
 以前、福地の成績を一定期間前と後とで比較し、そこに有意差があるか検証したことがあった(  http://meaningless777.blog.fc2.com/blog-entry-526.html )が、あれは私が福地の発言(この時期の前と後とで打ち方が変わった)を信じたから、そして、福地の成績同士の比較だからできたのである。
 例えば、福地の成績と誰かの成績の比較をする場合、「福地のみ前半を切り取って成績を比較する、もう一人は全数調査でやる」などと言ったら、判定方法が不公平だと思うだろう。
 全数調査の場合にはいいとこどりされてないかチェックできないという問題が生じるが、保証安定RATE等においては、「いいとこ取りはされているものとする、されていない場合、いいとこどりをした場合の成績を調べる」という前提なので、その問題は発生しない。

 次のメリットとして試合数による区分が必要ないということがある。
 現在、天鳳ランキングサイト・男冥利( http://otokomyouri.com/toppage.aspx )では安定段位等のランキングについて、1000試合以上、3000試合以上などの区分けがある。
 何故こんな試合数別の区分けがあるかと言うと、一定試合数以上という基準が一つしかないと、その試合数近辺の者が最も有利になってしまうからである。
 そして、その試合数について1個に統一することができない(多すぎればそのランキングに参加できる者の絶対数が減るし、少なければその試合数をこなす前に確変を引き、その後保存した者が有利になってしまう)。
 だからといって、「その試合数を超えたらサブキャラを作らせる」というわけにもいかない。
 その弊害を除くために、500試合以上、1000試合以上、2000試合以上、というように試合数毎に分けてそれぞれのランキングを用意しているのではないかと思われる(真意は知らないが)。
 他方、保証安定RATE等の概念を用いれば、試合数別のランキングを用意する必要はない。
 総てはいいとこどりをした場合の成績と試合数から一元的に求められる。
 これも保証安定RATEのメリットである。

 さらに、少ない試合数からでも実力を判定することができる場合があることもメリットになる。
 例えば、「100試合で平均順位2.27をマークした」というケース。
 いいとこ取りを許さない方法で平均順位の最高ラインを求めると2.50になる。
 じゃあ、その人の実力を平均順位2.50よりも上(数値的には下)と扱っていいか?
 この点、平均順位2.5の者が4000試合打ち、100試合毎に平均順位を求め、40個の平均順位を出した場合、この40個の数値のうち1つ以上が2.27よりも下になる確率は6割以上になる。
 だから、全数調査でやる場合、試合数があまりに少ないとあてにならない。
 これについて明確な基準はないが、検証しようと思っている実力を出した試合数(上の例なら100試合)の20倍の試合数(この場合2000試合)を打つことがある程度可能なのであれば、その数値を使うことはお勧めできない(「2σよりも外れた成績が出せる」というその可能性を引き当ててしまう可能性が高くなるから)。
 他方、最低保証RATEの場合、そのことは既に織り込み済みなので気にする必要がない。


 と、プレーヤーがいいとこどりをしているか気にする必要がない、試合数毎による複数の選抜基準が要らない、少ない試合からもある程度合理的な数値が求められるというわけでよさそうに見える保証安定RATE(平均順位)だが、もちろん欠点もある。

 まず、求めるためのコストが多いという点である。

 保証安定平均順位(RATE)等の求め方は次のとおりである。
 n試合うったうちの25試合を抜き出し、もっともよかった場合の平均順位(平均順位の最小値、RATEなら最大値)を求め、その数値に25試合における平均順位上昇分の限界値を足す(RATEなら引く)。
 n試合うったうちの26試合を抜き出し、もっともよかった場合の平均順位を求め、その数値に26試合における平均順位上昇分の限界値を足す。
 ・・・・
 n試合うったうちのn試合を抜き出し、もっともよかった場合の平均順位を求め、その数値にn試合における平均順位上昇分の限界値を足す。
 以上の求めた数値のうち、もっとも低い数値を最低保証の平均順位とする(安定RATEの場合最も高かった数値を採る)。

 なんとも手間のかかる方法である。
 この点、いいとこ取りを許さず全部のデータを使って実力(平均順位)の下限(数値的には上限)を求める際には、試合数から平均順位の標準偏差を求め、標準偏差の2倍を平均順位に足してやればいい(RATEであればRATEの標準偏差の2倍を安定RATEから引く)。
 試合数と平均順位が分かればいいので、実に簡単である。

 他方、最低保証平均順位になると、25試合からn試合までの総ての試合数について「その試合数でいいとこ取りした場合の最低保証平均順位」を求め、それぞれの数値のうち最小の値を求めなければならない。
 人間がやるには大変である(まあ、やるならプログラムにやらせることになるだろうが)。
 さらに、必要なデータも1位から4位までの順位をとった回数だけではなく、その履歴全部を要求される。
 そのため、最低保証平均順位(RATE)を求めるためには手続きが煩雑になる。

 他のデメリットとしては平均順位の上昇分の限界値が大きいため、出た数値に価値がないことがあるということである。
 いいとこどりを許さずに成績の下限を求める場合、100試合の平均順位の標準偏差は約0.11である。
 その2倍の値は約0.22である。
 他方、いいとこ取りをした場合の平均順位の上昇分の限界値は0.45である。
 両者は倍近く違う。
 1000試合で見た場合であっても平均順位の標準偏差の2倍と平均順位の上昇分の限界値は0.07と0.121であり、これも1.5倍以上違う。
 つまり、最低保証平均順位(RATE)が示す値は実際の平均順位(RATE)から大きくずれることが予想される。
 その結果、数値は出たが意味がないといったことが出てくる。
 例えば、100試合打った結果から「最低保証平均順位が2.75です」といわれたところで、その数値には何の価値も感じないであろう。
 少ない試合数からも数値が出せるとは述べたが、常にその数値に意味があるかは不明である。
    
 最後のデメリットとして、多く試合数をこなしたほうが有利になるという点もある。
 この指標は色々なパターンでいいとこ取りをさせ、そのうちもっとも良かったものを「10000試合からもっともいいパターンを選んだもの」として扱っている
 当然だが、100試合打つよりも1000試合打ったほうが、1000試合打つよりも10000試合打った方が、よい確変を引く可能性が増える。
 その結果、少ない試合の方が不利になるという現象が発生する。
 これも一つの特徴である。
 もっとも、「たくさん打った方が良質のデータが得られる」という価値観に照らせば、これはデメリットになるかどうかは分からないが・・・。


 以上、私なりに考えた保証安定平均順位(RATE)の長所と短所を挙げてみた。
 このように、(客観的に)実力を比較するというのは大変なのである。
 その辺を感じ取っていただければ幸いである。


 さて、私は段位にこの考え方を応用したい、と述べた。
「それが定着するか」という(極めて大事な)問題はさておき、最低保証安定段位を求めるにあたっては次の課題がある。
 それは、段位に関する諸々の標準偏差の指標は元の段位により大きく変動する、という点である。
「この考えを定着させることができるか」という問題はさておき、そもそも数値化できるのかという問題があるのである。
 まあ、できるところまでやってみるつもりではあるが。
スポンサーサイト

コメント

コメントの投稿

非公開コメント

プロフィール

Meanin Gless

Author:Meanin Gless
 初めてこのサイトを訪れた方へ(出来る限り御読みください)

1 このブログで記載する内容と程度 

 このサイトは麻雀に関する調査結果・研究結果を調査過程・研究過程を含めて厳格に記述するサイトです。
 原則として、このブログの文章に「(数学・プログラムについて相応の知識・技術を持った人が)ここに書かれた文章の内容を再現し、文章の内容が正しいことを確認するために必要なこと」は総て記載していく予定です。
 もちろん、牌譜分析をした結果をそのまま表示する場合、重複する場合、後で細かく書く場合、他に書かれていて書く必要がない場合、情報の速報性を重視する必要のある場合は別ですが、それはあくまで例外です。

 このブログの文章の第一のターゲットは、後世の麻雀研究者になっております。
 次が、巷に流れる麻雀戦術が正しいのかを知りたい人、理由付きで麻雀戦術を知りたい人になります。
 申し訳ありませんが、麻雀戦術が使えるようになりたい、麻雀戦術を分かりやすく知りたいと思われる方は、このサイトの99%は役に立たないと思います。
 麻雀戦術について詳細に記したサイト、分かりやすく記したサイトは、たくさんありますので、そちらを読まれた方がよいかと思います。


2 分かりやすさへの配慮について

 なお、理想論としては、私は、このブログの文章の内容を分かりやすく説明するところまでもっていきたいとは思っております。
 しかし、それだけの余力は現在ありません。
 そのため、「この記事を理解すれば役に立ちそうだから、このブログの解説記事を作ってほしい」と思われた方は、コメント欄にてリクエストをしてください。
 リクエストされた時の私の状況にもよりますが、出来る限り対応したいと思います。


3 当サイトの目標

 当サイトは「科学する麻雀」の理論を発展させることを目的としております。
 もちろん、発展の中には、「細かい修正」も入りますが、できれば、天鳳の赤アリ麻雀の牌譜を分析し、必要であれば、抜本的な理論の改変も目標にしたいと思います。
 また、「科学する麻雀」には秋刀魚に関する記述が乏しいため、秋刀魚に関する分析もしたいと思っております。
 その辺の研究が一通り終わりましたら、数理的裏付けの取れたある程度分かりやすい麻雀戦術記事を書きたいと思っておりますが、、、それは1年以上あとの話になるでしょうね。

4 引用について

 基本的に、ネット上のブログに引用する際には、

 ① 私がシミュレーション又は牌譜解析したこと
 ② このサイトのデータである旨

を書いた上で引用する限り、自由に引用していただいて構いません
(ただし、あたかも私が行った牌譜解析・シミュレーションを自分がやったかのように記載して転載するのはやめてください)。

 しかし、

 ① 営利目的使用
 ② 紙媒体に使用する場合

 は、コメントにて、私にご一報ください。
「① 私がシミュレーション又は牌譜解析したことの記載、②このサイトのデータである旨の記載」さえあれば、拒否することは致しませんが、私に再試の機会を与えていただきたいと思っているためです。

 引用について、このようなことを書くのもはばかられますが、某所でちょっとありましたので、このようなことを認めさせて頂きました。
 ご理解いただければ幸いです。


 では、よろしくお願いします。

カテゴリ

アクセス数