記事一覧

麻雀研究とは何か 3

(2016年7月23日 午前11時頃 記事公開

 2016年7月24日 午前2時頃 ツイッターにて指摘を受け、記事を訂正

 2016年7月27日 午前1時頃 一部具体例を追加する関係で、記事を訂正)


 今日は前回までの続き。


 前回までで、麻雀(戦術研究)について述べた。

 また、麻雀研究における数値の役割について述べた。


 確認しておくと、数値は主張(戦術論・麻雀に関する真実)を裏付けるための証拠である

 数値を使うことのメリットは、定量的比較を可能にすることと、他者による再現を可能にすること、である。


 今回と次回はその数値を求める手段について説明したい。

 今回は牌譜解析、次回がシミュレーションである。



 数値を求める方法の一つとして牌譜解析という方法がある。

 牌譜解析においてすることは牌譜のうち条件にヒットした局の数をひたすら数えることである。

 つまり、牌譜解析とは牌譜を検索し、条件に該当した回数を数えることで確率や期待値を求めることを言う。



 例えば、席順はどこが有利か調べるために、席順毎の平均順位を調べるとしよう。

 この場合、片っ端から牌譜を見て、

  チーチャの1位を取った回数、2位を取った回数、3位を取った回数、4位を取りった回数、

  南親の1位を取った回数、2位を取った回数、3位を取った回数、4位を取りった回数、

  西親の1位を取った回数、2位を取った回数、3位を取った回数、4位を取りった回数、

  ラス親の1位を取った回数、2位を取った回数、3位を取った回数、4位を取りった回数、

 をカウントする。

 これらの数字がはっきりすれば、席順毎の平均順位は求められる。

 同じように、席順毎の天鳳の段位ポイント期待値を求めることもできるだろう。



 例えば、6巡目におけるピンフのみ先制リャンメン聴牌におけるリーチ判断について考えるとしよう。

 この判断をするためには、様々なデータを集める必要がある

 (全部書き出すときりがないのでここでは書かない)が、

  6巡目における先制リャンメンリーチの和了率、放銃率は必要なデータに含まれる。

 そこで、牌譜を片っ端から調べて

  6巡目で先制リャンメンリーチした局の回数、

  6巡目で先制リャンメンリーチしてかつ和了した回数、

  6巡目で先制リャンメンリーチしてかつ放銃した回数、

 をカウントする。

 これにより、6巡目に先制リーチしたときの和了率・放銃率が得られる。

 同様のことを繰り返すことで、リーチ時の諸データ、ダマ時の諸データが得られる。

 それらの数値を組み合わせることで、リーチすべきか、ダマにすべきか、そのメリットはどの程度かが明らかにすることができる。



 なお、牌譜を数えるといっても、現在、私の持っている天鳳・四麻・クイタン赤ありの牌譜は

  実数で100万試合以上を超えるし、局数も実数で1000万局を超える

 また、実際に調べる数値は膨大であって何種類にもわたる。

 そのため、手で数えるということは到底無理である。

 そこで、牌譜解析プログラムを組んで実行、ということになる。



 さて、牌譜解析を用いることのメリットとしては次のようなものがある。 


 1個目は、理屈ぬきで真実に近い値(結果)を知ることができることである。

 牌譜解析結果は現実の調査結果そのものなので、

  統計誤差の問題、牌譜検索の条件設定の適切さという条件をクリアすれば

  その結果は真実に近いといえる

 (モデルを雑に作った場合、前提を雑に置いた場合の計算・シミュレーションに比べれば

  はるかに真実に近いといえよう)。

「よくわからないけど、結果はこうだ」と結果の部分を一足飛びに明らかにできてしまうのが、牌譜解析のメリットである

 (この点についてはデメリットもある、それはデメリットの欄で述べる)。


 2個目は「検索プログラムだけ書ければよく、コストが安いこと」である。

 これはシミュレーションとの対比になるが、シミュレーションの場合、自分でモデルを作り、

  必要に応じてそのモデルを具体化したシミュレーションプログラムを組まなければならない

 (シミュレーションをする際に、何をする必要があるかについては次回述べる)。

 その関係で、牌譜解析による場合は、そのコストが(相対的に)少ない。



 もちろん、牌譜解析のデメリットもある。


 1個目は大量の牌譜をかき集めなければならないこと、元になるデータが大量に必要になることである。

 今は、天鳳のつの氏が天鳳の鳳凰卓の牌譜を公開しているため、牌譜を集めることが容易であるが、かつては牌譜を集めるだけでも大変であった。

 例えば、とつげき東北氏は『科学する麻雀』を出版する際、知り合いから牌譜を集めて牌譜解析を実行しているが、そのとき集めた牌譜の数(試合数)は延べ数で約6万(実数だと約1万5千)である。

 この数値は、現在つの(天鳳の管理人)が公開している牌譜の数からすればかなり小さい。

 とつをしても管理者が公開しなければこの程度しか集められなかった。

 私だったらもっと集まらなかったことだろう。


 また、元になるデータが大量に必要になることもデメリットに含まれる。

 これは体感であって、合理的な根拠があるわけではないが、

  統計誤差・抽出するサンプル数の関係を考慮すると、牌譜は最低でも約10000試合は必要になる。

 その苦労は前述のとおりである。


 私が書籍(『神速の麻雀 堀内システム51』や『統計で勝つ麻雀』)において、

  牌譜解析結果を公開・利用する折、つのへの謝辞を怠らないようにしているが、これはそのためである。


 2個目は、レアケースや複雑な条件を設定すると

  サンプル数が足らなくなってしまい意味あるデータが出ないことである。

 牌譜解析においては現実に生じた牌譜を相手にするため、

  現実性のない条件を設定しても、ヒット数0になるだけで何も分からない。

 例えば、東1局0本場で役満をツモ和了した場合の試合終了時の平均順位を調べようと思っても、

  サンプル数が少なすぎて意味のあるデータは出せない。

 また、検索条件をたくさん付加した場合もサンプル数が少なくなってしまうことがある。

 例えば、先制両面立直で、待ちが14(69)待ちで、待ちのいずれかがドラであるケースは約5万ケースしかない

 (牌譜の延べ数は約4000万局、実数は約1000万局である)。

 巡目毎のデータなら序巡や終巡を除き出せるが、

  これに「待ちの枚数」という条件を付けてしまうと、

  枚数によってはサンプル数が足らなくなることも十分ありうるであろう。

 このように、レアケースや複雑な条件を設定したケースにおいては、

  意味のあるデータは出せないこと、これが牌譜解析のデメリットである。


 3個目は、牌譜解析結果だけからはその数値がそうなった理由を説明できないことである。

 例えば、リーチ宣言前に5が切られている場合、

  同色の無筋19の危険度は全体の無筋19の危険度よりも高くなることが牌譜解析結果からわかっている。

 しかし、牌譜解析結果をいくら見ても、そうなった理由(原因)がわかることはない

 別途、「リーチ宣言前に5が切られるケースでは235、578から5が切られるケースが多く、

  その結果として、14待ち、69待ちの頻度が全体よりも増えるため」というように、

  自分でそうなるロジックを考えなければならない。

 そして、場合によってはそのロジックが正しいか否かの牌譜解析やシミュレーションが必要になることもあろう。

 例えば、席順毎の平均順位を調べた結果、ラス親が平均順位が低い(数値的に)とする。

 しかし、その理由はその牌譜解析結果とにらめっこしても分からない。

「ラス親はオーラス和了やめ(聴牌やめ)ができるから」というロジックを自ら引っ張り出さなければならない。

 場合によっては、このロジックが正しいかチェックするために席毎の被ツモ時親割合を調べたり、あるいは、擬似麻雀シミュレーションで追試しなければならないといったこともあるであろう。


 これも牌譜解析のデメリットであるといえる

 (当初、これはメリットの側に加えていたが他人から指摘され、

  考え直したら確かにデメリットになるため修正した)。 



 以上のように、牌譜解析という手法には長所と短所がある。

 なので、その辺を踏まえた解析を行うこと、その辺を踏まえてデータを見ることが肝要である。



 牌譜解析のお話はこの辺で。

 次回はシミュレーションの話をしたい。

スポンサーサイト

コメント

コメントの投稿

非公開コメント

プロフィール

Meanin Gless

Author:Meanin Gless
 初めてこのサイトを訪れた方へ(出来る限り御読みください)

1 このブログで記載する内容と程度 

 このサイトは麻雀に関する調査結果・研究結果を調査過程・研究過程を含めて厳格に記述するサイトです。
 原則として、このブログの文章に「(数学・プログラムについて相応の知識・技術を持った人が)ここに書かれた文章の内容を再現し、文章の内容が正しいことを確認するために必要なこと」は総て記載していく予定です。
 もちろん、牌譜分析をした結果をそのまま表示する場合、重複する場合、後で細かく書く場合、他に書かれていて書く必要がない場合、情報の速報性を重視する必要のある場合は別ですが、それはあくまで例外です。

 このブログの文章の第一のターゲットは、後世の麻雀研究者になっております。
 次が、巷に流れる麻雀戦術が正しいのかを知りたい人、理由付きで麻雀戦術を知りたい人になります。
 申し訳ありませんが、麻雀戦術が使えるようになりたい、麻雀戦術を分かりやすく知りたいと思われる方は、このサイトの99%は役に立たないと思います。
 麻雀戦術について詳細に記したサイト、分かりやすく記したサイトは、たくさんありますので、そちらを読まれた方がよいかと思います。


2 分かりやすさへの配慮について

 なお、理想論としては、私は、このブログの文章の内容を分かりやすく説明するところまでもっていきたいとは思っております。
 しかし、それだけの余力は現在ありません。
 そのため、「この記事を理解すれば役に立ちそうだから、このブログの解説記事を作ってほしい」と思われた方は、コメント欄にてリクエストをしてください。
 リクエストされた時の私の状況にもよりますが、出来る限り対応したいと思います。


3 当サイトの目標

 当サイトは「科学する麻雀」の理論を発展させることを目的としております。
 もちろん、発展の中には、「細かい修正」も入りますが、できれば、天鳳の赤アリ麻雀の牌譜を分析し、必要であれば、抜本的な理論の改変も目標にしたいと思います。
 また、「科学する麻雀」には秋刀魚に関する記述が乏しいため、秋刀魚に関する分析もしたいと思っております。
 その辺の研究が一通り終わりましたら、数理的裏付けの取れたある程度分かりやすい麻雀戦術記事を書きたいと思っておりますが、、、それは1年以上あとの話になるでしょうね。

4 引用について

 基本的に、ネット上のブログに引用する際には、

 ① 私がシミュレーション又は牌譜解析したこと
 ② このサイトのデータである旨

を書いた上で引用する限り、自由に引用していただいて構いません
(ただし、あたかも私が行った牌譜解析・シミュレーションを自分がやったかのように記載して転載するのはやめてください)。

 しかし、

 ① 営利目的使用
 ② 紙媒体に使用する場合

 は、コメントにて、私にご一報ください。
「① 私がシミュレーション又は牌譜解析したことの記載、②このサイトのデータである旨の記載」さえあれば、拒否することは致しませんが、私に再試の機会を与えていただきたいと思っているためです。

 引用について、このようなことを書くのもはばかられますが、某所でちょっとありましたので、このようなことを認めさせて頂きました。
 ご理解いただければ幸いです。


 では、よろしくお願いします。

カテゴリ

アクセス数