流れる空の中で数学を。

とある数学好きの「手作りすうがく」と「気ままな雑記」。

【問Ⅱ】ぺるせんたげさんの数学コンテスト【近似解】

ぺるせんたげさんの数学コンテストの問Ⅱ

 今回はぺるせんたげさん(@percentage011)の数学コンテストの問Ⅱの「近似解」を作ったので、それを紹介したいと思います。問題文は、以下のツイートを参照してください。

  私の実力では近似解*1を出すだけで精一杯だったので、厳密な解き方がわかった方がいたらぜひ教えてください。

n個のサイコロと平均値

 n個のサイコロをふって、出た目の総和がnの倍数になるのは、総和がn,2n,3n,4n,5n,6nの6通りの場合である。よって、総和がそれぞれの値になる確率を見積もって、それらを全て足し合わせれば、それが求める確率P(n)になる。
 サイコロの個数が多い場合を考えて、総和の値を取り扱う代わりに平均値に着目することにする。つまり、サイコロの目の平均値がちょうど1,2,3,4,5,6になる確率をp(1),p(2),p(3),p(4),p(5),p(6)とすると、それらの和が求める確率になる。

P(n)=p(1)+p(2)+\cdots+p(6)……(1)

 1個のサイコロを多数回ふった時の期待値を\mu、分散を\sigma^2として、定義より計算すると、

\mu=3.5……(2)
\sigma^2=\frac{35}{12}……(3)

となる。各々のサイコロは独立同分布に従うとすると、中心極限定理より、サイコロの個数nが十分多いとき、サイコロの目の平均値Xの分布は正規分布で近似できる。その分布関数をf(X;\mu,\sigma^2)とすると、

f(X;\mu,\sigma^2) \simeq A \exp(-\frac{(X-\mu)^2}{2\sigma^2})……(4)

と近似できる。ここで、Aは確率分布関数の規格化定数である。ただし、nが有限である限り、平均値は

1 \le X \le 6……(5)
の範囲になければいけないので、正規分布の定義域を本来のX \in (-\infty,\infty)からX \in (1,6)に制限しなければいけない。この意味で、いくらかの任意性の残る近似をする必要があり、ここでは規格化定数の値を変更することにした。*2すなわち、規格化定数A

\int_1^6 f(X;\mu,\sigma^2) \mathrm{d} X = 1……(6)

によって定める。数値計算でこの値を求めると*3

A \simeq 1.36……(7)

 となる。

平均値がちょうど1,2,3,4,5,6に一致するとは

 n個のサイコロの目の平均値がとりうる値の場合の数は、目の総和の取りうる場合の数に等しい。*4すなわち、

6n-n+1=5n+1……(8)

通りの場合がある。これより、1 \le X \le 6区間5n+1等分して取り扱う。すなわち、ある1つの区間は、平均値がある1つの値になる場合に相当し、各区間の幅の値を\deltaとおくと、

\delta=\frac{6-1}{5n+1}=\frac{5}{5n+1}……(9)

となる。そして、1,2,3,4,5,6の値を含む区間におけるf(X;\mu,\sigma^2)積分値を用いて、p(1),p(2),\cdots,p(6)と見積もることができる。すなわち、k=1,2,3,4,5,6として、その確率は、

p(k) \simeq \int_{k-\delta/2}^{k+\delta/2} f(X;\mu,\sigma^2) \mathrm{d} X……(10)

 nが十分大きいとき、分布関数が連続なため、ある1つの着目した区間内におけるf(X;\mu,\sigma^2)の値は一定値と見なして近似できる。つまり、

f(X;\mu,\sigma^2) \simeq f(k;\mu,\sigma^2) \quad (k-\frac{\delta}{2} \le X \lt k+\frac{\delta}{2} )……(11)

と近似できる。したがって、(10)(11)式より、

p(k) \simeq \delta f(k;\mu,\sigma^2)……(12)

が得られる。これらの値を数値計算で見積もると、

f(1;\mu,\sigma^2)=f(6;\mu,\sigma^2) \simeq 1.99 \times 10^{-16}……(13)
f(2;\mu,\sigma^2)=f(5;\mu,\sigma^2) \simeq 2.71 \times 10^{-6}……(14)
f(3;\mu,\sigma^2)=f(4;\mu,\sigma^2) \simeq 0.316……(15)

と見積もられらた。*5従って、(1)(12)式より、nが十分大きいとき、求める確率P(n)は有効数字3桁で、

P(n) \simeq \frac{3.16}{5n+1}……(16)

に漸近する。このままでいくと、この式はnが十分大きいときに良い近似となるが、nが小さいときは値が大きくずれる可能性がある。そこで、この式にある適当な補正の因子をかけてみることにした。*6具体的には、3つのパラメータa,\kappa(\gt 0),\gammaを導入して、

P(n) \simeq \frac{3.16[ 1 + a \exp (-\kappa (n-1)^\gamma) ]}{5n+1}……(17)

と近似してみた。これらのパラメータをnが小さいときの値、つまり、P(1),P(2),P(3)から決定し、最終的な近似式とする。

nが小さいときの確率P(n)

(i)n=1の場合、明らかにどの目が出ても1の倍数なので、

P(1)=1……(18)

(ii)n=2の場合、具体的に全ての場合を書き出すことで、

P(2)=\frac{1}{2}……(19)

とわかる。

(iii)n=3の場合、サイコロを2つふった時点での目の総和が、①3の倍数になるとき、②3で割ったとき1余るとき、③3で割ったとき2余る確率はそれぞれ等しいことが、具体的に全ての場合を書き下すことでわかる。①の場合、3つ目のサイコロの目が3か6ならば、3つのサイコロの目は3の倍数になる。同様にして、②③の場合も、3つ目のサイコロをふったとき、それぞれ2,5と1,4がでれば、目の総和が3の倍数になる。以上をまとめると、

P(3)=\frac{1}{3} \cdot \frac{1}{3}+\frac{1}{3} \cdot \frac{1}{3}+\frac{1}{3} \cdot \frac{1}{3}=\frac{1}{3}……(20)

であることがわかる。

近似パラメータの決定

 (17)式のパラメータをn=1,2,3の時の値を求めて決定する。
 n=1のとき、(17)(18)式より、数値的に見積もって、

a \simeq 0.899……(21)

となる。次に、n=2のとき、(17)(19)式より、数値的に見積もって、

\kappa \simeq 0.194……(22)

となる。最後に、n=3のとき、(17)(20)式より、数値的に見積もって、

\gamma \simeq 0.465……(23)

となる。以上をまとめて、最終的な近似式を書き出すと、

P(n)\simeq \frac{3.16 [ 1+0.899 \exp( - 0.194 (n-1)^{0.465} ) ] }{5n+1}……(24)

となる。

P(6)の見積もりとP(n)の漸近的なふるまい

 得られた近似式を用いて、試しにn=6の場合を見積もってみると、

P(6) \simeq 0.163……(25)

となり、\frac{1}{6}\simeq 0.167に非常に近いことがわかる。
 これより、P(n)は、nが小さいときは、おおよそ\frac{1}{n}となるが、nが大きくなるにつれて\frac{1}{n}からずれていき、(16)式の値に近づいていくことがわかる。n \rightarrow \inftyでの漸近的なふるまいを評価すると、

P(n) \simeq \frac{0.632}{n}……(26)

となる。言い換えると、次のような1より小さい極限値が存在することが予想される。

 \lim_{n \rightarrow \infty } nP(n) \simeq 0.632 (\lt 1) ……(27)

*1:本来の問題が組み合わせ論の問題であったのに対して、今回の近似的な解き方では統計学的な取扱いになっている。

*2:任意性が残るときに、なるべく単純なものを選ぶというのは1つの良い選択肢だと言えるだろう。

*3:この記事では、数値は有効数字3桁まで計算することにする。

*4:全て1が出た時の総和がnで、全て6が出た時の総和が6nとなる。

*5:正規分布で近似しているので、当然、平均値に近い方が値が大きくなる。

*6:この補正の仕方は、単なる思い付きであり、ある種の力技であるが、全くのでたらめというわけではなく、nが大きくなるとき補正でかけた因子がきちんと1に近づくようにしてある。