2024年1月29日月曜日

確率を"起こりやすさ"と説明するのやめれ (スラド日記 2017-08-28)

 素朴展開するときに、確率ってどう「定義」したらいいんだろう。

適当にググると「起こりやすさ」がけっこうある。 けど、これはまずい気がする。 「起こりやすさ」という表現だと、 物理的な世界の側のものと誤解されてしまう。 そうすると、 できごとについて知識が増えると確率が変わる、条件付き確率が、 理解できなくなる。

あと「確からしさ」? これ確か probability を翻訳するための造語だったはずで、 何も言っていないのではないかと。 あと、主観でも感覚的なものと誤解されやすい。

今のところ思いついたので、一番ましそうなのは:

  1. 最初の段階における起きやすさについて、
  2. 今の段階の知識で、可能なばあい全ての起きやすさの合計の中での、 アタリあつかいするばあいの起きやすさの合計の割合。

条件付き確率だろと言う人もいるかもしれないけど、 確率は、全部が条件付き確率にしても問題がない。 確率空間の公理をもとにするしかないけど、 そうすると上のような感じにどうしてもなるはず。

んで、有名問題 (早稲田の過去問) の表現を変えたやつ:

ジョーカーを除いたトランプ 52枚をよくシャッフルし、 最初の1枚を裏にして、次からは表にして 4枚並べた。 2枚めから4枚めは全てダイヤだった。 1枚めがダイヤの確率を求めよ。

分かってる人は即座に 10/49 だけど、1/4 だという粘着でるよね。 上の素朴定義の2が抜けてると、1/4の気がするはず。

地道にやってみる。1枚めを置いた段階では 13/52 = 1/4。

2枚めがダイヤだった段階で、可能性があるは (ダ、ダ)、(ハ、ダ)、(ス、ダ)、(ク、ダ)という並べ方で、 (13×12)/(13×12+(13×3)×13)=12/51。

3枚めがダイヤだった段階で、可能性があるのは (ダ、ダ、ダ)、(ハ、ダ、ダ)、(ス、ダ、ダ)、(ク、ダ、ダ)という並べ方で、 (13×12×11)/(13×12×11+(13×3)×13×12)=11/50。

4枚めがダイヤだった段階で、可能性があるのは (ダ、ダ、ダ、ダ)、(ハ、ダ、ダ、ダ)、(ス、ダ、ダ、ダ)、(ク、ダ、ダ、ダ)という並べ方で、 (13×12×11×10)/(13×12×11×10+(13×3)×13×12×11)=10/49。

もちろん、地道にやる必要はない。2〜4枚めがダイヤという知識があるなら、 上の素朴定義にそって、等確率の49枚中、10枚がアタリで 10/49。

ピンとこなかったら、シャッフルのときに神様がしこみをするイメージ するといいかも。 2枚めこと1番にダイヤを、3枚めこと2番にもダイヤを、4枚めこと3番にもダイヤを しこむ。1枚めこと4番では純粋にクジびき。

あと、逆に素朴定義の1が抜けてる人もいるけど、 こっちは別タイプの粘着になる。 確率を計算しようがないものに確率があると言い張る人たち。

念のためだけど、「起こりやすさ」は別に主観的であってもいい。 大切なのは、確率空間。 ただ、個人的には、主観的なやつは現実推定用のモデルと考えた方が楽だと思う。

0 件のコメント:

コメントを投稿