麻雀の打牌選択アルゴリズム(6)

ドラ

から何を切るか？

打かでテンパイだが、三色、一通の可能性を残し、打でテンパイとらずが正解のようだ。今回はこのシャンテン戻しについて検討する。

麻雀の打牌選択アルゴリズム(4) - koba::blog、麻雀の打牌選択アルゴリズム(5) - koba::blog のアルゴリズムにしたがえば、打もしくはの評価値は以下となる。

No	聴牌形	待ち	枚数	打点	評価値
1			1	2000	6,000
1			2	2000	6,000

一方、打とした場合の聴牌形とその評価値は以下となる。

No	枚数	枚数	打点	評価値
1	3	2	2000	8,000
1	3	2	2000	8,000
2	3	3	2000	6,000
3	3	3	2700	21,400
		1	5200
		3	2700
4	3	2	2000	8,000
4	3	2	2000	8,000
5	1	3	5200	63,600
	1	4	12000	63,600
	3	3	2700	40,100
	3	4	8000	40,100
6	4	1	8000	31,700
6	4	3	7900	31,700
7	4	4	7900	31,600
8	4	4	8000	52,800
8	4	4	5200	52,800
9	1	0	2000	4,000
9	1	2	2000	4,000
10	4	4	5200	44,400
		1	8000
		3	5200
11	1	4	7900	31,600
11	3	4	4000	16,000
12	2	3	2000	12,000
12	2	3	2000	12,000

(赤牌を区別しなければ)12種39枚で再度テンパイとなり、ツモとの引き戻し以外で元の評価値を上回る聴牌形となる。テンパイとらずが有利なことは自明と思えるが、プログラム化するためには数値で比較する必要がある。

評価値の正規化

現在の評価値計算方法は単純に

（評価値 × 待ち枚数）の総和

を再帰的に繰り返しているため、テンパイから遠い(向聴数が大きい)ほど評価値が大きくなってしまう。これでは異なる向聴数の牌姿の善し悪しを比較できない。「待ち枚数」の部分を「ツモる確率」とすれば評価値は期待値と等価となるが、正確な確率を求めるのは難しい*2ため、適当な数値で除算し正規化することとした。具体的には、

0向聴(テンパイ): 12 で除算
1向聴: 12 × 6 (＝ 72)で除算
2向聴: 12 × 6 × 3 (＝ 216)で除算

としてみた*3。この方法で計算すると、冒頭の牌姿では打は評価値 500、打は 1231.13 となる。

これで異なる向聴数であっても牌姿が比較できるようになったので、1向聴以降についてシャンテン戻しを仮実装した。

#19 シャンテン戻しを仮実装 · kobalab/Majiang@190c731

ただしこの方法には問題があることが分かっているので、次回改善する。

*1:すでに続編の麻雀定石「何切る」301選が出ているが、中国では手に入らぬ😢

*2:巡目によって確率は変わるし、そもそも何巡目以内にツモる確率を求めればよいのか

*3:各向聴数ごとの待ち枚数を考慮はしたが、具体的な数値に根拠はない😁