麻雀の打牌選択アルゴリズム(4)

麻雀の打牌選択アルゴリズム(3) - koba::blog、麻雀の副露判断アルゴリズム(4) - koba::blog までである程度の手作りはできるようになったが、和了打点を意識した手作りができていない。例えば

ドラ

でテンパイした場合、

となり、打が有利だが、現在のアルゴリズムは待ちの多さで評価するためを打ってしまう。

この問題を解決するために、テンパイ時に和了打点と待ち枚数から打牌を決定するようにする。和了打点は簡単のために

で計算することとすると、上記の例は

打
- 摸 : 2700 x 4 (20符3翻: 立直、門前清自摸和、平和)
- 摸 : 5200 x 1 (20符4翻: 立直、門前清自摸和、平和、赤ドラ x 1)
- 摸 : 2700 x 3 (20符3翻: 立直、門前清自摸和、平和)

→ 合計 24,100 点

→ 合計 32,000 点

となり、打が選択できる。

これを「牌姿の評価値」*1として以下に一般化する。

和了打点を評価値とする。

の場合、30符5翻(立直、門前清自摸和、三色同順、ドラ x 1)で 8000点。

向聴数の進む牌をツモった場合の評価値 x その牌の枚数の総和をその牌姿の評価値とする。

の聴牌形の場合、待ちは 4枚、ツモった場合の打点は8000点なので、評価値は 8000 x 4 = 32,000 となる。

向聴数が戻らない打牌を行った後の牌姿の評価値のうち最大のものを、その牌姿の評価値とする。

の場合、打は 24,100点、打は 32,000点なので、最大値の32,000点がこの牌姿の評価値となる。

これを再帰的に繰り返せば任意の牌姿の評価値を計算できる。*2

例えば以下の牌姿*3の場合

ドラ

とが打牌の候補となるが、その場合の聴牌形は以下のいずれかになる。

No.4 は幺九牌が暗刻になっているためテンパネし、No.3 と比べ打点が高い。No.5 でをツモしたパターンも嵌張待ちにとれるためテンパネする。

打、からそれぞれの上記テンパイに至る枚数は、

となるため、No.4 のテンパイがとれる打が最高の評価値となる。

電脳麻将 ver.0.9 にはこのアルゴリズムを採用する予定。具体的なプログラムについては次回説明する。

*1:確率を使用していないので「期待値」という言い方は避ける

*2:計算時間がかかるため、現実的に計算可能なのは2向聴から