記事一覧

毎週月曜日は

 アメーバからこちらに移ってきて、一ヶ月間以上放置してしまった。
 
 このままだと全く更新しないままとかなりかねない。
 さらに言うと、ブログの文章の書き方、とか、文章の書き方それ自体忘れてしまったかもしれない。
 ブログの書き方、文章の書き方を忘れてしまうなど一種由々しき事態でもある。

 そこで、毎週月曜日は研究行為(何を研究したか)について書こうと思う。
 こうすれば、「この人何やってんだろう」という質問に答えられると思うし。
 さらに言うと、「研究日誌」にもなるだろうし。


 今日は月曜日である。
 そこで、今日は「1月1日から今日までどんな研究をしていたか」を紹介したい。

 2016年1月1日から私は次のことをしていた。

・2015年1月1日から2015年12月31日までの牌譜のダウンロード
・新しい牌譜を加えた上での牌譜データベースの作成
・新しい牌譜データベースに基づく従前の牌譜解析

 天鳳では毎日鳳凰卓で試合がなされ、牌譜が生産されていく。
 とはいえ、1日毎に牌譜をダウンロードしてデータベースを作り直し、従前の牌譜解析結果を更新していたらきりがない。
 そこで、正月になってから去年1年分の牌譜をダウンロードすることにしている。

 去年1年間の牌譜は約25万試合である(天鳳鳳凰卓のクイタン赤アリの四麻東風戦・四麻東南戦・秋刀魚東南戦)。
 それを牌譜ダウンロードプログラムを作成して(とはいえ、作ったのは2年前)ダウンロードした。
 だいたい100試合1分ペースなので、これだけで凡そ2日間かかった。

 次に、牌譜データベースの作成について
 麻雀研究を始めた約2年前、私は「牌譜から直接調べる」よりも「牌譜のデータを配列化して、配列化したデータを解析したほうが、牌譜解析の効率はよくなるのではないか」と思った。
 そこで、mjlog形式でダウンロードした牌譜をmjscore形式に変換し、それらを1つのファイルに結合した上で、牌譜データベースプログラムを走らせて、牌譜データベースを作成した。

 ただ、この牌譜データベース作成時間はかなり長い。
 mjlog形式でダウンロードした牌譜をmjscore形式に変換し(ここは天鳳が出しているlogana.exeを利用する)、
  それらを1つのファイルに結合するだけで1日かかった。
 そして、牌譜データベース作成プログラムだけで1週間以上かかった。
 総ての対局者について最終形の手牌とそのときの周辺情報、聴牌判定と和了牌判定をする関係でシャンテンチェックを大量にかけているからであるが、現状を見ると、「牌譜のデータを配列化して、配列化したデータを解析したほうが、牌譜解析の効率はよくなる」というのが本当なのだろうかと思う。
(現状でも「まだそのほうがいい」と思っているが)
 できた牌譜データベースを見ても四麻が25.9ギガバイト、秋刀魚が5.9ギガバイトあるくらいだし。
 データを全部読み込むだけで結構コストがかかりそうである。

 牌譜データベースが出来てからは従前の牌譜解析のやり直しである。
 だが、これ自体が恐ろしく時間がかかった。
 というか、2月15日現在、まだ終わってない。

 なにしろ、天鳳四麻の牌譜解析プログラム・天鳳秋刀魚の牌譜解析プログラムだけで約570個あるのである。
 1個1時間としても約570時間、約24日かかる。
 実際は、35~40日かかりそうな雰囲気である。

 こうみると、来年は牌譜データベースや従前の牌譜解析結果を更新しようか悩みどころである。
 四麻に関してはいいかな、とさえ思っている。
 というのも、四麻に関しては約113万試合、約1010万局あるし。

 なお、年毎の牌譜の試合数と局数はこんな感じである。
 
Blog216021501.jpg


 秋刀魚はまだまだ数が欲しいな、と思うが、四麻に関してはそろそろいいかな、という気がする。
 これからは牌譜のダウンロード、牌譜データベースの更新自体は1年毎にやろうと思うが、牌譜解析結果の更新は2年おきにしようと思う。


 なお、今週末にはデータが揃うので、それからは牌譜解析結果を公開していこうと思う。
 アメーバブログに掲載されているデータは2013年までの牌譜しか利用されていないので(とはいえ、データの傾向が変わるとは思わないが)。


スポンサーサイト

コメント

投稿が初めてなので少し心配ですが書き込み出来てますかね?

純粋にMeanin Glessさんの記事にすごく引き込まれました(*´∀`*)ノ私は伝える作業が下手なもので心底羨ましいです!
良かったら悩みを打ち明けたいのでnameのとこから連絡貰えると嬉しいです(人´ω`*)

コメントの投稿

非公開コメント

プロフィール

Meanin Gless

Author:Meanin Gless
 初めてこのサイトを訪れた方へ(出来る限り御読みください)

1 このブログで記載する内容と程度 

 このサイトは麻雀に関する調査結果・研究結果を調査過程・研究過程を含めて厳格に記述するサイトです。
 原則として、このブログの文章に「(数学・プログラムについて相応の知識・技術を持った人が)ここに書かれた文章の内容を再現し、文章の内容が正しいことを確認するために必要なこと」は総て記載していく予定です。
 もちろん、牌譜分析をした結果をそのまま表示する場合、重複する場合、後で細かく書く場合、他に書かれていて書く必要がない場合、情報の速報性を重視する必要のある場合は別ですが、それはあくまで例外です。

 このブログの文章の第一のターゲットは、後世の麻雀研究者になっております。
 次が、巷に流れる麻雀戦術が正しいのかを知りたい人、理由付きで麻雀戦術を知りたい人になります。
 申し訳ありませんが、麻雀戦術が使えるようになりたい、麻雀戦術を分かりやすく知りたいと思われる方は、このサイトの99%は役に立たないと思います。
 麻雀戦術について詳細に記したサイト、分かりやすく記したサイトは、たくさんありますので、そちらを読まれた方がよいかと思います。


2 分かりやすさへの配慮について

 なお、理想論としては、私は、このブログの文章の内容を分かりやすく説明するところまでもっていきたいとは思っております。
 しかし、それだけの余力は現在ありません。
 そのため、「この記事を理解すれば役に立ちそうだから、このブログの解説記事を作ってほしい」と思われた方は、コメント欄にてリクエストをしてください。
 リクエストされた時の私の状況にもよりますが、出来る限り対応したいと思います。


3 当サイトの目標

 当サイトは「科学する麻雀」の理論を発展させることを目的としております。
 もちろん、発展の中には、「細かい修正」も入りますが、できれば、天鳳の赤アリ麻雀の牌譜を分析し、必要であれば、抜本的な理論の改変も目標にしたいと思います。
 また、「科学する麻雀」には秋刀魚に関する記述が乏しいため、秋刀魚に関する分析もしたいと思っております。
 その辺の研究が一通り終わりましたら、数理的裏付けの取れたある程度分かりやすい麻雀戦術記事を書きたいと思っておりますが、、、それは1年以上あとの話になるでしょうね。

4 引用について

 基本的に、ネット上のブログに引用する際には、

 ① 私がシミュレーション又は牌譜解析したこと
 ② このサイトのデータである旨

を書いた上で引用する限り、自由に引用していただいて構いません
(ただし、あたかも私が行った牌譜解析・シミュレーションを自分がやったかのように記載して転載するのはやめてください)。

 しかし、

 ① 営利目的使用
 ② 紙媒体に使用する場合

 は、コメントにて、私にご一報ください。
「① 私がシミュレーション又は牌譜解析したことの記載、②このサイトのデータである旨の記載」さえあれば、拒否することは致しませんが、私に再試の機会を与えていただきたいと思っているためです。

 引用について、このようなことを書くのもはばかられますが、某所でちょっとありましたので、このようなことを認めさせて頂きました。
 ご理解いただければ幸いです。


 では、よろしくお願いします。

カテゴリ

アクセス数