2024年1月28日日曜日

中心極限定理と正規分布について、適当に語る (スラド日記 2018-08-30)

 ちょい前の日記の続き。

;;絶不調で気力がゼロになったのでグダグダ。

正規分布と中心極限定理についての、簡潔な説明で気に入っているのは、 『コルモゴロフの確率論入門』https://www.amazon.co.jp/dp/4627095112/ のおしまいの部分(句読点変更):

ラプラスとガウスの誤差理論における研究は、かなり一般的な条件のもとで、 多数の小さな偶然誤差の和として得られる全体的な誤差の分布が、 近似的には正規分布であることを明らかにした。 こうして、ド・モアブル−ラプラスの漸近式は、 十分に普遍的な確率法則から得られる結果であることがわかった。 確率論とその応用において正規分布が果たす役割は、 中心極限定理によって確定したのである。 確率変数 X 1X 2, ..., Xn 中心極限定理にしたがうとは、 任意の実数α, βと和 Sn X 1 + ... + Xn に対して、n→∞のとき

P{α≦(Sn -E(Sn ))/√(V(Sn ))≦β} 〜 ∫[α,β]e -u 2/2 du

が成り立つことである。 この公式は、確率変数列 X 1X 2, ..., Xn に対する非常に広い条件下で成り立つ。

ここの「非常に広い条件下で」というのが大事なのだけど、 この本には書いてない。つか、たぶん書きようがない。

たぶん 2段階に分けて考えるのがいい。

中心極限定理を説明している教科書などでは、 「独立同分布」と平均、分散があるという条件をつけていることが多いが、 「同分布」は要らない(Wolfram Mathworld)。 途中の見積りがちょっと面倒になるけど。

つぎに「独立」なんだけど、実際の現象だと、 確率変数を、独立でないものと、独立なものの和と考えられることが、 けっこうある。 例えば、オムニバス科目の試験で、各問の点数を、一般的な学力 + 各先生独自の評価、 のようにみなせるようなら、件のベルカーブが出てくる。 けど、この部分は数学というより経験科学になるのだと思う。

いろいろな現象が、かなりの数のちょい従属ぐらいの要因の和とみなせることがあって、それで正規分布で近似できる。
;; まあ、面倒なので先例踏襲でパラメトリックにしていることも多いみたいだが……。

言語がらみだと、要因が掛け算で響いていくので正規分布で近似できないものも、それなりにある。

あと、歴史変化でS字カーブ (累積分布) が出てくることが多いけど、 これが何かの論争がないわけではない。 僕はロジスティック分布になるモデルの方が現実みがあると思うけど、 正規分布の人も根強い。 けど、僕たちの使えるデータだと、どちらの当て嵌りがいいかなんて言いようがないので、ほっとくしかない。

0 件のコメント:

コメントを投稿