2024年1月30日火曜日

スラドから自分の日記の一部をコピペ

2024年1月31日に閉鎖が予告されているスラド https://srad.jp/ から自分の日記の一部をこちらに移しました。 主に数学と教育関係のものです。 その他のもの、言語学やマイノリティ関係の映画に関するものなどは、消えるにまかせることにします。

日記間のリンクは、重要そうなものは置き換えていますが、そうでないものは置き換えていません。

「知る=出来る=分かる」という病 (スラド日記 2007-04-26)

 教育関係者がときどき持ってる強迫概念の一つが 「知る=分かる=出来る」というモノだと思う。 これを看破したのは、板倉先生@仮説研 (いいリンク知らないから仮説社http://www.kasetu.co.jp/)だったはず。 この強迫概念と「教師が全部説明しなければならない」という強迫概念が相俟って、 真面目タイプの教師と生徒を不幸にしていると思う。

「知る」「分かる」「出来る」の別を 大学初級の数学で例を出しとくと、 「実数の完備性」は知ってればいいことで、 「4次以上の行列式」は出来なくても分かってればいいこと、 「変数分離形の微分方程式の解法」は分からなくても出来ればいいこと、 って具合である。

「知る」だけでいいのなら「これ読んどいて」でいいのだと 開き直っていいじゃないか、と思う。 教科書以外を読むのも勉強だし、 それも楽しいんだと知ってくれればいい。

「分かる」はちょいと置いといて、 「出来る」が問題なのだと思う。 「出来る」ようになるには「やってみる」が前提にある。 「やってみる」うちに 勘をつかんで「分かなくても出来る」ようになったりしていたのだが、 その「やってみる」をなかなかしてくれなくなってきている。 その前に「分かる」を求める生徒が増えてきている。

これ自体は良いことのように聞こえるが、 生徒の「分かる」が「納得」で、 教師の「分かる」が「理解」と異なるものだったりする。 これが教師と生徒の関係の傷口を拡げていく。 対人関係で「納得」の度合いが変るんで、 ボクたち「変なヒト」にはこれが響いてくる。

で、まあ、人間関係苦手な身としては、 多少反発あってもしようがないやと開き直りつつ、 この説明は研究した身としては許せんと思いつつ、 なんとなくそれっぽいのを使うしかないと思うんだな。 例に出して悪いかもしれないけど、 英語記号付けhttp://www1.gifu-u.ac.jp/~terasima/なんかいい感じ。

# だめだ。こんなの書いても眠気がとれない。 未明の電話って一日響く。 家帰って、仮眠してから明日の準備しよう。

[読書] 英語教育が亡びるとき (スラド日記 2011-12-31)

 寺島隆吉. 2009. 『英語教育が亡びるとき: 「英語で授業」のイデオロギー』 明石書店. http://www.amazon.co.jp/dp/4750330620

記号研」の寺島先生による、 下から目線の言語教育政策批判。 ほとんど虚構である「憧れのアメリカ」の言語として英語を教えるのが「国際理解教育」なのかという話と、 中下位校の現実を無視して指導要領を決めるなという話。

うーん。タイトルでこんなに煽らなくてもいいのに。 細かいツッコミどころはいろいろあるし、 〈俺たちは知らなかった〉から〈俺たちは騙されてた〉に 飛んでしまう危ういところもあるけど、 寺島先生の本はもっと読まれていいと思う。

僕が寺島先生の存在を知ったのは、 記号研が出来る前だったりする。 志望学科を決めたときに受けた忠告 〈あんなところを出て教員になったら底辺校にまわされるぞ〉 に遡る。その具体例として出されたのが寺島先生。 けど、底辺校でも普通の教員が英文読解をさせることができる 指導法を作ってきた。 底辺の厳しい現実を踏まえての批判、その重さを無視してはいけない。

それが人間というものかもしれないが (スラド日記 2016-11-18)

 教育に一家言をお持ちの方々の中には、 配当学年で理解できないので暗記で乗り切り、 学年が進んでなんとなく理解できるようになったことがけっこう多かったことを お忘れの方もかなりいらっしゃるのでは、 という気がする。

微分のことは積分をもって (スラド日記 2016-12-18)

 森一刀斎 先生がどこかで、 「微分のことは微分でしよう」(「自分のことは自分でしよう」)、 「微分のことは積分をもって」(「自分のことは責任をもって」) と書いていたと思う。

それはさておき、http://togetter.com/li/1059561 のような話。 こういうのを読むと、 《高校の数学教育に問題があることのかなりの責任は、 大学の数学教育の失敗のせい(残りのかなりは文科省のせい)だろうが》みたいな気分になる。

dy=f'(x)dx のような書き方や、解析学の他分野への応用については、 数教協系の高校検定教科書、 「の」つきシリーズ(『高等学校の〜』ちくま学芸文庫で、指導書と合本で再刊)で やろうとして、 検定意見でポシャったむねが、 教科書ガイドに載っていたはずである。
;; 微分演算子にDを使うのは、通っていた気がするけど、 大昔なので自信がない。

解析学だと、19世紀半ばまでの雑な展開から ヴァイアーシュトラウスなどが厳密化をしてという流れがある。 雑な時代だと dy = …… のようなのは書きやすかったんだけど、 厳密化の輸入と中途半端な美意識がドッキングしたのか、 国会図書館のデジタルライブラリーだと、 1910年代のものから、dy/dx のみで、dy = …… と書かないものが、 増えているようだ。

dy = f'(x)dx の形での展開を 超準でなくて、 標準できちんとやろうとすると、 ただでさえ学生に苦手意識のある関数に加えて、 不等式、絶対値、概数と嫌われているものが天こ盛りで、大変。 とはいえ、大学の理系では教えているはずである (そうも言えないのは他大の実践例から知っているけど)。

それにもかかわらず、 高校数学がずっと前からの受験数学の再生産になっているのは、 どういうことよ、と受験産業にいたころから、 ものすごく不満。

数学における文脈と文化への依存 (スラド日記 2016-12-27)

 例の 3.9+5.1 だけど、2つに問題を分けて理解して欲しい。

  1. 普通の等号と誤差があるときの等号は別ものなので、 〈=〉の意味は文脈依存。 意味が違うので、ごっちゃにしないこと。
  2. 普通の等号を使うときに計算しろと言われたら、 「一番簡単」にするのが「マナー」だけど、 何か簡単か、どこまで許容範囲なのは、実は明確な根拠がない。

前段について。

有効数字って、測定値から出てきて、 それが影響しているものだけにある。 つまり、この問題、そもそも有効数字なんて無関係。

有効数字や誤差ありの算術での「等号」を別のに 例えば〈≈〉にしとけば、よかったのに。 ぶつぶつ。 有効数字のような中途半端なものから教えるのは止めて、 誤差範囲から教育しようよ。

後段について。

前段を理解してもらえれば、 単なる表現の問題で、 筋的には 18/2 や 9/1 でもオッケーにするのかという話と同じだと 分かるはず。 なんだけど、18/2や9/1に△つけて、9.0に○つけたい奴が出る。 それはそれでいいけど、 その境界線に主観的でない根拠はあるの? 整数と小数を無意識にひいきしていない?

こういうのって簡単すぎて、 感覚で反発するような奴が出てくるから、 問題を難しくしておく。

例えば、x>0でx^2=2 の解は何? これについて「2乗すると2になる正数」と答えられたとき、 どうよ。これって本質的には√2と同じだけど、 前者でも○をつける? 前者が何もしていないので×なら後者はどう? この差って「空気」じゃないか。 ついでだけど、 x-1=1/{2+(x-1)} から x = 1+1/(2+1/(2+...))=[1; 2, 2, ...] って連分数表示だとどうよ。 分数に比べて「√2が簡単」というのは、 代数的数をひいきする「文化」に「毒された」主観じゃん。

和算用語って何を調べればいいんだろう (スラド日記 2017-01-14)

 橋爪 松園 (編). 1871. 『英算独学』 東京: 雁金屋清吉. http://dl.ndl.go.jp/info:ndljp/pid/826594/41?viewMode=

明治の頭まで来ると、算数に動員されたのが和算の人たちなので、 用語が変わる。

旧漢字を新漢字に、旧仮名カタカナを新仮名ひらがなに。 「、。」は補った。

乗法は俗に云う掛算にして数を倍する法なり。 又、此の倍したる数を積と云う。 又、乗する数に大小ありて其大数を乗実と称し、 其小数を乗法と称す。 且つ此大小の総称を因数と云う。 又、乗算の記号に於ては英国常に×符を用ゆ。

前の時代に教育を受けた人たちが、教員をやるので、 建前の文書を読んでいるだけでは、 教育現場を絶対に誤解するわけやんか。

和算+西洋初級算術のごちゃが出発点で、 これを整理しようとしていた人たちに いろんな人がいるのをイメージしないと。

矯正と教育 (スラド日記 2017-08-08)

 ;; 気分が乗らないので、半分ヨタ。

伝統的な箸の持ち方はマナーの問題にされやすいが、 むしろ進化論的方法で最適化された、箸での作業のしやすい持ち方だと 考えた方がいいのだと思う。

箸の持ち方が「変」な人も多い。 困ったことに、箸はどう持つといいかを明確にはアフォードしてくれないことだ。 そのせいで「小さな山」を登ってしまったのが「変」な持ち方をしている人と 考えられる。

最適解に近くするには「小さな山」の近傍からズレないといけない。 そうするために、 指の位置をえぐることでアフォードする 三点支持箸という製品がある。 「ダメ」な持ち方になじんでいると、 最初のうちは筋肉がちゃんと動かないが、 1週間ぐらいで、なんとかなる(らしい)。

不思議なことに、これを使っていると、 普通の箸でも「正しい」持ち方をするようになる (と通販サイトのコメント欄にはある)。 「小さな山」より最適解の方が楽だし、 アフォーダンスも分かるようになったからだろう。

ただ、こういうのが機能するのって、 矯正した方がずっといい場合。 最初の「小さな山」を降りることを拒否する人もそれなりにいるし。

板書の色づかい (スラド日記 2017-09-15)

 ちょっとびっくりしたまとめ:

昔の小学校に「赤色や緑色のチョークで文字を書くな、使うのは白か黄色」というルールがあった理由 https://togetter.com/li/1150741

「ユニバーサルデザイン」「インクルーシブ」のような用語が教育関係でも、 よく使われるようになっていきたのに、 逆に色覚の問題が忘れ去られているのか。

チョーク芸人だったころ、 板書での色の使い方は小中教師向けの本で読んだ記憶がある。 現場であまり教えてくれないのなら、 研究室の教育実習用棚に板書 の本を探して置いておかないと。

僕の使い方は:

  • 黒板: 白 -- 文字、黄 -- 重要(下線・枠など線)、朱 -- 注意(下線・枠など線)
  • 白板: 黒 -- 文字、青 -- 重要(下線・枠など線)、赤 -- 注意(下線・枠など線)

他の色は原則として使わないように努力。 ただ、ややこしい話を図に描くときには、もう1色、欲しくなるけど。

プレゼンソフト使うときは、 時間が足りないせいもあるけど、 だいたい白黒。 白地に黒文字、重要は太字、注意は※や×で補うぐらい。

あ、ぼつぼつ学生にプレゼンさせる時期なので、 教室持ち込みの方の iPad mini に色シミュレーションアプリを入れておかないと。

昭和初の教員向け本 (スラド日記 2019-05-30)

 

このちょい前に黒表紙(藤沢の作った算数の教科書)の3次改定。 塩野直道が主導した。

立式と九九の対応が問題。上の pp.188-189:

(1) 九九の呼声

算術書の総九九に於ては、 常に「乗数」「被乗数」「積」の順序に九九を唱える。例えば

4銭×2 = 8銭 ………… 二・四 8
2銭×4 = 8銭 ………… 四・二 8
5×3 = 15 ……………… 三・五 15
3×5 = 15 ……………… 五・三 15

の如く、其の呼声の合理的ならしめて居る。然るに一部総九九主張者の中には、

4銭×2 = 8銭 ………… 四・二 8
2銭×4 = 8銭 ………… 二・四 8
5×3 = 15 ……………… 五・三 15
3×5 = 15 ……………… 三・五 15

の如く、常に「被乗数」「乗数」「積」の順序に唱え、 之を以て順九九に比し合理的であると称して居った。 而し之は文部省のとは正反対の呼声である。

以上は「乗数」「被乗数」に依って其の呼声も決定し、 乗法と九九とを合理的に結合しようとしている。

古い立場の説明、p.189:

更に順九九に於ては

4銭×2 = 8銭 ………… 二・四 8
2銭×4 = 8銭 ………… 二・四 8
5×3 = 15 ……………… 三・五 15
3×5 = 15 ……………… 三・五 15

呼声は「被乗数」「乗数」の中、数の小さな法を先に呼び、 乗法から抽象され器械化されたものであっても乗法とは全く別なものである。 総九九が何れも呼声八十一箇あるのに反して、 順九九に於ては四十五箇の呼声で足りて居る。 而して呼声は三・五15でも 5×3 と 3 × 5 とは同一とは考えなく、 乗法に於ては乗数、被乗数を明瞭に区別する。

文部省の立場というのは修正趣意書。本当はこれを拾ってくるべきだけど、 めんどうなので、下から。pp.191-192:

私の考えを述べるに先だって文部省編纂の修正趣意書の中から、 総九九校正についての部分を抜粋すれば次の如くである。

総九九を唱うるに当り、被乗数と乗数とは何れを先に唱うべきかを実地教授者につきて検せるに、 一定され居らざるが如し。 例えば「二三6」とは「2の3倍は6なり」という意とすべきか、 或は「3の2倍は6なり」という意とすべきか。 本教科書に於ては之を「3の2倍は6なり」との意とし 即ち乗数・被乗数・積の順序に於て九九を唱うることとせり。 3×2=6なる式は「3ノ2倍は6なり」という意なるを以て、 式に於ける順序よりいうも、 又思考上の順序よりいふも、九九を唱えるに被乗数・乗数・積の順序に唱うるを適当とするが如く見ゆれど、 2の掛算九九とは乗数2なる場合の九九なりと見るを正当なりとし、 斯かる見地よりして本書に於ては九九を唱うるには乗数・被乗数・積の順序を以て呼ぶこととしたり。 且斯く定むるときは筆算の乗法に於ても甚だ便利にして、其の場合に乗数を脳裏に記憶し思けば、 被乗数の各桁の数字を見つつ其の乗数の掛算九九を用いて計算を行い得べく、 又筆算の除法に於ても常に法を冒頭に置く掛算九九を用うるを以て商を書き誤る憂なし。

なお、下の著者は、文部省の立場に反対で (p.193):

…… この見地より見て現今多くの算術教育者は、

「掛算九九の構成は累加法により被乗数先唱とする。」

と云う様に一致している様である。

…… 即ち累加に依って九九を構成して行く方が便利であると信ずるので、 唱え方にしても被乗数・乗数・積の順序に唱えて行った方が便利である。

ICMI Study の解説論文 (スラド日記 2020-01-08)

 

中国と米国での算数教育の違いが、 中国側が19世紀の欧米の算術教育の流れによるせいと説明した上で、 19世紀の体系を説明している。 何度も書いているけど、日本もそっちの流れの中にある。

18.7.1.2 の The Rule of Like Numbers of Multiplication のところが、 いわゆるサンドイッチの説明。

2024年1月29日月曜日

標準スコア (スラド日記 2020-03-05)

 

単なる標準化で、意志決定の材料にすぎないんだけどねえ……。 しかも「輪切り教育反対」という人に「偏差値の定義は?」と尋くと大方の人が答えられないというワケワカなことがあったりする。

上の記事でも、次の式は書いてある:
偏差値 = 10×(個人の得点 - 平均点)/標準偏差 + 50.

これは個人の偏差値。予備校が出す学校の偏差値は何かというのは、上の記事でも明確に書いてない。

偏差値を縦軸にして、合格者のヒストグラムを左側に、不合格者のヒストグラムを右側に描く。 このヒストグラムが滑らかでそれぞれ山が1つだとうれしい(実際にはなかなか)。 合格者のヒストグラムの方が山が上で、不合格者のものが下になっているはず。 合格者と不合格者の割合が 6:4 のところが、学校の偏差値 (80% をA判定、60% をB判定にしていることが多い)。

塾や予備校で教えていたときには、この偏差値のせいで「神学部行けそう」とか「美大行けそう」とか言われて、 「そこは学力以外で決まるから、成績の山がフラットなせいなんだよ」と説明するはめになったことが何度か (低くても受かるけど、高くても落ちる)。

データにもとづかずに、えらい人の勘だけで決めたがるのは本当に嫌。

;;まあ今は、えらい人の勘である内申点や評価書を重視せいとか、 文化資本・社会関係資本におもいっきし左右されるポートフォリオ使えとか、 「多様性」の美名のもとに、実際には正反対の社会弱者軽視の「入試改革」が進んでいるので、偏差値より「生まれ」になりつつあるけど。

このネタ、やり方がもったいない (スラド日記 2014-11-05)

 PortalZ に 「1キログラムは何キログラムか」 http://portal.nifty.com/kiji/141104165536_1.htm という記事があがっている。 単にネタ記事のつもりで書いてるみたいだけど、 これ、いい統計教育のネタなので、もったいないなあ。

内容量表示、例えば100.0g、を下回る製品を減らすには、 平均を100.0g より少し上げないといけない。 どれだけ上げるかといえば、標準偏差と不良品率のかねあいで決まる。 標準偏差が 5.0g で不良品率が 0.1% (3.1σぐらい)なら、 平均が115.5g ないと不安。 標準偏差を 1.0g まで小さくできれば、 平均を 103.1g まで下げられる。 約10%原料減らせるのは、すごい利益の差になる。

記事に出ている「たけのこの里」が、 平均 78.5g で四捨五入で半々が78gと79g というのは、 品質管理すごいね。 ポテトチップスの袋サイズが小さいほど、 平均の相対的な割増が大きいのは標準偏差が大きくなるから。

探すとどっかに教案がないかなあ。

19:05 制度についてのメモ

2つの封筒問題における交項級数 (スラド日記 2018-01-06)

 「2つの封筒問題」でググったら「無限や極限値にまつわる問題ではないか」というブログが上位にあった。

「2つの封筒問題」は確率の問題として実は3タイプある。 この人が問題にしているのは、僕が単なる極限の問題だからと、 コメント欄でふられない限り言及しないやつ。

問題を確認しておく。

2つの区別できない封筒があり、 片方にはもう片方の倍の金額が入っている。 交換したときの増減の期待値で交換するかを決めるとする。

  • 【基本型】未開封で決定し、未開封で交換する。
  • 【開封型改】未開封で決定し、開封して交換する。(意図はともかく、リンク先で検討しているのは、このタイプ)
  • 【開封型】開封して決定し、交換する。

手抜きで説明する。 基本型だと、次のように期待値の計算をしている。 ただし、(pn)が確率、(an)が増減の列。

p1{a1+(-a1)} + p2{a2+(-a2)} + p3{a3+(-a3)}+...

つまり、波かっこ内が0なので、和も0というのが、基本型。

開封型改だと、次のような計算になる。

p1a1 + {p1(-a1)+ p2a2} + {p2(-a2)+p3a3} + {p3(-a3) + p4a4} + ...

足し算の順番を変えただけなのだけど、ここで無限がからんでくる。

  • 胴元の入れる金額が有限なら、有限級数なので、順番を変えてよく、基本型と同じで、増減の期待値は0。
  • 胴元の入れる金額に上限なくても、その期待値が有限なら、 増減の期待値の級数は絶対収束するので無条件収束する。 つまり、順番を変えてよく、基本型と同じで、増減の期待値は0。
  • 胴元の入れる金額に上限がなく、その期待値も発散するなら、 和の順番は変えられない。これ以上は、具体的な確率分布による。 増減の期待値が正の有限値になる分布も、無限大になる分布もある。

これらに対して、開封型は、 p1a1 /p1 か {pk(-ak) + pk+1ak+1}/(pk+pk+1) を計算するだけ。 これの正負は分布に依存。

ちなみに開封型改は開封型の平均(期待値)なので、 胴元の入れる金額の期待値が有限のときには、 一部の人が言うような「開封型の期待値が常に正」ということはありえない。

あとは、おまけ。 2つの封筒問題はひっかけの誘導がやはり秀逸。

手元の封筒に x円が入っていたとする。 このとき、もう片方は x/2 円か、2x 円である。 封筒が区別できないので、これらが等確率となり、 交換後の増減の期待値は (x/2 - x) * 1/2 + (2x - x) * 1/2 = 0.25x 円。 これが正なので、交換した方が得である。

これのどこかひっかけなのかを、できるだけ素朴に説明する。

未開封の段階だと 未知数aを用いて、目の前にある封筒内の金額は a円か2a円のいずれか。

  • 手元がx=a円のとき、もう片方は、x/2=a/2円がありえず、2x=2a円のみ。
  • 手元がx=2a円のとき、もう片方は、x/2=a円のみで、2x=4a円がありえない。

つまり、未開封の段階だと x/2 と 2x はxの中にある数が別のときなのだから、 同じ式の中で使ってはだめ。

開封した段階だとxの中の数は同じになる。 ただし、 胴元が持ってきたのが x/2円とx円なのか、x円と2x円なのかは、分からない。 合計金額が 3x/2 円か3x円かは、胴元の気持ち次第で、 等確率とは限らない。

なんの深い話もなく、我々の頭がバグっているだけ。

確率空間なくして確率なし (スラド日記 2017-12-29)

 風邪で寝込んでいたあいだにまた「2つの封筒問題」がどこかで話題になったらしいので、 前にもほぼ同内容を書いたけど、また書く。

;; 年内に片付けたいことが終らない……。

未開封型:

区別できない2つの封筒があり、 片方にはもう片方の2倍の金額(ただし、正)が入っている。 片方を選んで、1回だけ交換できる。 交換した方が得か、否か。

ひっかけの誘導(強調部が誤り):

仮にx円が入っていたとする。 このとき、もう片方が x/2 円か、2x 円で、 封筒が区別できないので、これらが等確率となり、 交換後の増減の期待値は (x/2 - x) * 1/2 + (2x - x) * 1/2 = 0.25x 円。 これが正なので、交換した方が得である。

条件つき確率の問題にするので、 その前にもとになる確率空間 (Ω, E, P) を作っておく。 標本空間として、合計金額と、金額が上の封筒 or 下の封筒かのフラグの対のものを考える。Ω = {(3x, s) | x は金額、s は上か下}。 事象の集合となる完全加法族は E = Pow(Ω)。 確率測度についての制約は P((3x, 上)) = P((3x, 下)) と合計 ΣP(ω)=1。

そうすると「x円が入っていたとする」ときの条件つき確率の標本空間は、 Ω'={(3x, 下), (3x/2, 上)} で、
P((3x, 下)|x円入ってた) = P((3x, 下)) / (P((3x, 下)) + P((3x/2, 上)))、
P((3x/2, 上)|x円入ってた) = P((3x/2, 上)) / (P((3x, 下)) + P((3x/2, 上))) = 1 - P((3x, 下)|x円入ってた) 。

P((3x, 下)|x円入ってた) を q と置くと、増減の期待値は、 (2x - x) * q + (x/2 - x) * (1-q) = x(3q-1)/2 円。……(*)

つまり、qが分からないので未定。 ということで、「仮にx円を引いた」と仮定する方針は筋が悪い。

とはいえ、未開封のときには、別ルートで楽に解答ができる。

合計金額が 3x 円とすると、 Ω''={(3x, 上), (3x, 下)} で、P((3x, 上)|合計3x) = P((3x, 下)|合計3x) = 1/2。 交換したときの増減は、 (x - 2x) * 1/2 + (2x - x) * 1/2 = 0円なので、損得なし。 これはどの合計金額でもそうなので、結局、損得なし。

つぎに開封型:

区別できない2つの封筒があり、 片方にはもう片方の2倍の金額(ただし、正)が入っている。 片方を選んで、1回だけ交換できる。 選んで開けてみたら x円だった。 交換した方が得か、否か。

このときの増減の期待値は (*) なので、不定。

例えば、開けて1000円のばあい、 Ω大尽={(3000, 上), (3000, 下)} でも、 Ω吝嗇={(1500, 上), (1500, 下)} でも、 問題と両立する。 大尽(q=1)なら交換で得、吝嗇(q=0)なら交換で損。

問題と両立するモデルが複数あって、それぞれ答えが違うので、 これは条件が足りない不定問題。

上の説明を理解する気がない人たちで多いのは、 「理由不十分の原理」《分からないものは等確率》をもちだす人たち。 問題なのは、 確率空間の公理を満たすような、 主観的確率の確率測度の決め方が「理由不十分の原理」だということを理解しないこと。 仮にP((3x, 下))=P((3x, 上))=P((6x, 下))=P((6x, 上))=P((12x, 下)))=……=ε>0 とすると、nε>1 となる自然数nがある(アルキメデス性)ので、 下から合計していくと、いずれ 1を越える。 つまり、ΣP((3x, s)) = 1 を満たさないので、 そういう確率測度がない。だから、そういう確率空間もない。

重なることも多いけど、理解する気がない人たちには、 上の説明が勝手に確率分布(確率測度)を決めているが、 自分は全部のばあいの「確率分布」を考えていると思い込んでいる人たちもいる。 けど、イメージできるのと、実際に作ることは別で、 条件を足さないと確率空間を作ることはできない。 ベルトランの逆説と同じで、 問題と矛盾しないで足せる条件がいろいろあることを理解して欲しい。 そのときに通常するのが《文字を使った一般化》で、 実際にやったのが(*)。

確率の問題は、 直感と反することが多いので、 数学や論理が得意な人でも確率だけ苦手という人はそれなりにいる。 だからこそ、念のために基本に戻って計算しなければならない。 それでも不安なら シミュレーションすべき。 とくにシミュレーションを実装するための条件が欠けていないかはチェックすべき。

確率を"起こりやすさ"と説明するのやめれ (スラド日記 2017-08-28)

 素朴展開するときに、確率ってどう「定義」したらいいんだろう。

適当にググると「起こりやすさ」がけっこうある。 けど、これはまずい気がする。 「起こりやすさ」という表現だと、 物理的な世界の側のものと誤解されてしまう。 そうすると、 できごとについて知識が増えると確率が変わる、条件付き確率が、 理解できなくなる。

あと「確からしさ」? これ確か probability を翻訳するための造語だったはずで、 何も言っていないのではないかと。 あと、主観でも感覚的なものと誤解されやすい。

今のところ思いついたので、一番ましそうなのは:

  1. 最初の段階における起きやすさについて、
  2. 今の段階の知識で、可能なばあい全ての起きやすさの合計の中での、 アタリあつかいするばあいの起きやすさの合計の割合。

条件付き確率だろと言う人もいるかもしれないけど、 確率は、全部が条件付き確率にしても問題がない。 確率空間の公理をもとにするしかないけど、 そうすると上のような感じにどうしてもなるはず。

んで、有名問題 (早稲田の過去問) の表現を変えたやつ:

ジョーカーを除いたトランプ 52枚をよくシャッフルし、 最初の1枚を裏にして、次からは表にして 4枚並べた。 2枚めから4枚めは全てダイヤだった。 1枚めがダイヤの確率を求めよ。

分かってる人は即座に 10/49 だけど、1/4 だという粘着でるよね。 上の素朴定義の2が抜けてると、1/4の気がするはず。

地道にやってみる。1枚めを置いた段階では 13/52 = 1/4。

2枚めがダイヤだった段階で、可能性があるは (ダ、ダ)、(ハ、ダ)、(ス、ダ)、(ク、ダ)という並べ方で、 (13×12)/(13×12+(13×3)×13)=12/51。

3枚めがダイヤだった段階で、可能性があるのは (ダ、ダ、ダ)、(ハ、ダ、ダ)、(ス、ダ、ダ)、(ク、ダ、ダ)という並べ方で、 (13×12×11)/(13×12×11+(13×3)×13×12)=11/50。

4枚めがダイヤだった段階で、可能性があるのは (ダ、ダ、ダ、ダ)、(ハ、ダ、ダ、ダ)、(ス、ダ、ダ、ダ)、(ク、ダ、ダ、ダ)という並べ方で、 (13×12×11×10)/(13×12×11×10+(13×3)×13×12×11)=10/49。

もちろん、地道にやる必要はない。2〜4枚めがダイヤという知識があるなら、 上の素朴定義にそって、等確率の49枚中、10枚がアタリで 10/49。

ピンとこなかったら、シャッフルのときに神様がしこみをするイメージ するといいかも。 2枚めこと1番にダイヤを、3枚めこと2番にもダイヤを、4枚めこと3番にもダイヤを しこむ。1枚めこと4番では純粋にクジびき。

あと、逆に素朴定義の1が抜けてる人もいるけど、 こっちは別タイプの粘着になる。 確率を計算しようがないものに確率があると言い張る人たち。

念のためだけど、「起こりやすさ」は別に主観的であってもいい。 大切なのは、確率空間。 ただ、個人的には、主観的なやつは現実推定用のモデルと考えた方が楽だと思う。

画鋲投げ実践やってみたい (スラド日記 2016-12-06)

 確率・統計関係でやってみたい教育実践の1つが、 画鋲投げである。 「二重画鋲」と呼ばれる、 金属製で丸い板の下に針がついているものを用いて、 投げたときに表が出る確率、裏が出る確率が何かを問いかけるものである。 私が受験産業にいたころは、教員向けの実践集にあるぐらいだったはずだが、 最近では中学校の教科書にも載っているようだ。

この実践の意図は、根源事象にあたるものが、 2つでも「同等に確からしい」ということがなければ、 それぞれ 1/2 にならないというものであるが、 もうちょい、付け足したい。

実は、画鋲って、二重画鋲に絞っても、 いろいろなものがある。 例えば、針長が 7mm, 8mm, 11mm のものがある。 11mm の足長タイプと、7mmのものでは板の半径と足の比が異なるので、 表裏の確率がかなり違いそうである。

画鋲の種類ごとに確率はあるけど、 どの画鋲か分からない段階で確率とか言われても困るじゃんということは、 やっておきたい。

リテラシーの話ということにして、 表計算の使い方のところにでも入れられるかなあ。

ベイズより大豆の方がおいしいぞ (2016-11-29)

 2つの封筒問題の 未開封型の方に 問題があるのだけど、こっちツッコミ入らないね。 胴元が投入金額を無限大に発散させると、 あの展開ではまずいことがあるのだけど。 有限ならあれでオッケー。

それはさておき。

ベイズ派が気軽に「主観確率」を使うのが、僕は好きじゃない。 特に確率分布がどういうものかを理解していない 自称ベイズ派だと、確率の問題でほいほい間違えるから。

開封型で「事前確率」を1/2, 1/2とするのは、 まずい(金額無視でそう考えているのなら、 範囲のない「一様分布」という確率論で扱えない怪物を召喚する) けど許せないわけではない。 ただ、情報が開いたあとの「事後確率」で計算しないと、 胴元にボラれる可能性があると考えないのが、 許せない(どう考えても、僕みたいなイジワル爺ならボるだろ)。 だから、 《情報が何も開かないから事後確率なんか分かるかあ》という 反応になってもらわないと困る。

「主観確率」と考えるより、 分からないかもしれないけど客観確率があって、 それのもとでの条件付き確率の推定値と考えた方が幸せだと思う。 そこで、僕の展開はだいたいこっち。

モンティ・ホール問題、またたび (スラド日記 2015-03-09)

 Rosenhouse, Jason. 2013. 『モンティ・ホール問題』 [The Monty Hall Problem: The Remarkable Story of Math's Most Contentious Brain Teaser] 松浦 俊輔 訳. 青土社. http://www.amazon.co.jp/dp/4791767527/

週末体調が悪く、逃避がてらに読んだ。 モンティ・ホール問題についての確率論の話から認知まで。 著者は数学の人。 難しくはないけど数式を追う必要がある。 直感/直観にうったえる部分が少ないこともあり、 分からない人には分からないし、 認知的不協和が発生していくので、 一部の人には不満がたまると思う。 訳はいつもの松浦さん通り。

帯から引用:

挑戦者の前に3枚の扉がある。1枚の扉の向こうには車が、 残りの2枚の扉の向こうにはヤギがいる。 挑戦者は、車の隠れている扉を当てれば勝ち。 挑戦者が扉を1枚選択した後、司会者のモンティ・ホールは、 残りの扉のうちヤギがいる方の扉を開けてヤギを見せる。 そして挑戦者に、最初に選んだとびら を、残った開けられていない方の扉に変更するかを尋ねる。 さて、車を当てる確率を高くするには、挑戦者は扉を変更するべきだろうか?

だいぶ前にも投稿したけど、 変えないと当たりは 1/3、変えると 2/3。

念のために古典的に解いておく (無駄のある解き方だけど、全部区別して並べるの方が失敗しない)。

ディレクターが、車、ヤギ太、ヤギ子を扉の順に並べて、 しかもコイントスで最初に当てられたときに開ける扉を表で若い番号、 裏でそうでないと指示する(当たっていないときは使わない)ことにする。 この並べ方は、 車太子表、車太子裏、車子太表、車子太裏、 太車子表、太車子裏、太子車表、太子車裏、 子車太表、子車太裏、子太車表、子太車裏 の12通りで、これらの確率は同じ。

挑戦者が1の扉を選び、モンティが2の扉を開けるばあいは、 車太子表、車子太表、 太子車表、太子車裏、子太車表、子太車裏 の6通りのいずれか。 そこで、変えないと 2/6 = 1/3、変えると 4/6 = 2/3。 以下、同様なので略。

通常はこう解かずに、条件つき確率で解く。

1を挑戦者が選んでいるとする。 P(「1が当たり」かつ「2を開く」)= 1/3 * 1/2 = 1/6. P(2を開く)= P(「1が当たり」かつ「2を開く」)+P(「3が当たり」) = 1/6 + 1/3 = 1/2. そこで、P(「1が当たり」|「2を開く」) = (1/6) / (1/2) = 1/3. 以下、面倒なので略。

まあ、この手の問題は、数式だと説得されても、納得しないんだけどね。

イメージ操作ができれば、少しは納得するはずなのだけど、 条件つき確率の場合にこれがいいのがない。 というより、確率一般にいいのがない。 個人的にいいかなと思うのは、 パラレルワールドが織機の縦糸みたいに一定幅で並んでいるもの (実際には枝分かれ図で確率を書き込んであるものと同じ)。

面倒なので、挑戦者が扉1を選ぶことにしておく。 車が置かれて時点でパラレルワールドが3分割される。 さらに司会者が扉を開けるときに、 3分割のうちの扉1が正解がさらに2分割される、 残りの2つはその中の全てで開ける扉が決まるので分割されない。 扉2が開いたとき、自分がいる世界は★のどちらかの帯にいる。 ★に限ると、変えなければ、(1/6)/(1/6+1/3) = 1/3, 変えれば (1/3)/(1/6+1/3) = 2/3。

    ┌─────┐
    │     │1当り2開く★
    │    ─┤
    │     │1当り3開く
    │  ───┤
    │     │
    │     │2当り3開く
    │     │
    │  ───┤
    │     │
    │     │3当り2開く★
    │     │

確率の問題は印象ではなく計算で答えるように (2016-11-28)

 意志決定問題としては、好きにすればいいけど、 期待値は勘でなく計算で出そう。

得はどうかはおいといて、開封したときの期待値の問題にする。

2つの区別できない封筒があり、片方にはもう片方の倍の金額が入っている。 開封後に一度だけ交換できる約束のとき、X円入っていた。 もう片方の期待値は何円か。

期待値の定義を確認すると、 確率関数がp(x)のとき、 f(x)の期待値はΣf(x)p(x)。 つまり、当然だけど、期待値は確率分布に依存する。

ところが、この問題には確率分布が書いてない(ここで、アレって思うこと)。

こういうばあい、数学の問題のお約束としては、 可能なすべての答えを出さなければならない。 つまり、全部の確率分布における答えを出さないといけない(この時点で、解が複数あったり、不定だったりすることを覚悟)。

例えば、 X円、X/2円の封筒が1つずつしかないときに、 「片方にはもう片方の倍の金額が入っている」と言われても嘘ではないし、 開封したらX円入っていることはありうる。 そこで、答えの中に、このときの期待値 -X/2円が含まれていないと困る。

同様に、X円、2X円の封筒が1つずつしかないときに、 「片方にはもう片方の倍の金額が入っている」と言われても嘘ではないし、 開封したらX円入っていることはありうる。 そこで、答えの中に、このときの期待値 X円が含まれていないと困る。

こういうふうに全部の確率分布を調べていくわけにはいかないので、 確率分布を文字式で処理する。

胴元が封筒にx円を入れる確率をp(x)する。 X円が入っているとき、 胴元が 3X/2円入れていれば、増減は -X/2円。 3X円入れていれば、増減は +X円。 前者の条件つき確率が p(3X/2)/(p(3X/2)+p(3X))、 後者の条件つき確率が p(3X)/(p(3X/2)+p(3X)) なので、 期待値は ((-X/2)p(3X/2)+Xp(3X))/(p(3X/2)+p(3X))。

このままだと評価しにくいので、p(3X)/(p(3X/2)+p(3X))=q とおく。 そうすると、期待値は X(3q-1)/2。 0≦q≦1 なので、-X/2≦期待値≦X。

この問題が混乱しやすいのは、 確率分布が与えられていない不定の問題にもかかわらず、 確率分布が1つあるような気がしてしまうから。 そうすると、 《わからないから一様分布だ》バイアスが炸裂するので、 q=1/2のときの期待値 X/4 円だと思い込んでしまう。

《いろいろなばあいを考えている俺は正しいはずだ》と ここまで説明しても思っている人はいるだろうけど、 その思いうかべたものは、 複数の確率分布をごっちゃにしたもので、 数学的にはあつかえないからね。

念のために2つの封筒問題を数式で説明しなおしておく (2016-11-27)

 2つの封筒問題の日記 を念のためにもう少し丁寧に説明しなおしておく (深くなると、あとで思い出して検索するとき、めんどいねん)。 ついでだが、そこに貼っておいた Google Appsの表計算によるシミュレーション(手抜き)

2つのパターンがある。上がオリジナルの未開封型。下が開封型。

  • 2つの区別できない封筒があり、片方にはもう片方の倍の金額が入っている。 開封前に一度だけ交換できる約束のとき、交換した方が得か。
  • 2つの区別できない封筒があり、片方にはもう片方の倍の金額が入っている。 開封後に一度だけ交換できる約束のとき、X円入っていた。交換した方が得か。

未開封型から説明しておく。 なお、説明の流れの都合上、計算を最適化していない。

胴元が入れる金額が x円である確率を p(x)とする。

選んだ封筒にX円が入っているとき、交換したばあいの得の期待値は、 ((X/2-X)p(3X/2)+(2X-X)p(3X))/(p(3X/2)+p(3X)) =(-(X/2)p(3X/2)+Xp(3X))/(p(3X/2)+p(3X))。...... (*)

X/2円か2X円の2択なので等確率と素朴に思ってしまう人がいるが、 それはp(3X/2)=p(3X) ということなので、期待値 +X/4 になってしまう。 そこで、交換した方が得と考えてしまう。これが、最初の引っ掛けである。

しかし、実際には確率関数 p(x)が未知なので、 これの正負は不明である。

封筒のX円は仮だったので、得の期待値はこれの平均を取ることになる。

Σ(p(3X/2)+p(3X))/2 * (-(X/2)p(3X/2)+Xp(3X))/(p(3X/2)+p(3X)) = Σ(-(X/2)p(3X/2)+Xp(3X))/2 = Σ(-Yp(3Y)+Xp(3X))/2 (ただし、Y=X/2)。

前項と後項が順番が変わるけどキャンセルしてなくなるか、 p(x)がもともと0なので、 任意の確率分布において、 期待値は0円となる。

これの意味するところは、 胴元がケチでもお大尽でも無関係に、得の期待値が0円ということである。 ケチ、お大尽、みんな均した結果で期待値が0円になるのではないことに 注意されたい。

次に、開封型である。

開封してX円のばあいに交換したときの得の期待値は、 すでに計算ずみの (*) である。

つまり、p(x)が不明なので、数学的にはこれ以上どうしようもない、不定の問題になる。

胴元がケチで p(3X)=0 と知っていれば、期待値は -X/2だし、 お大尽でp(3X/2)=0 と知っていれば、期待値は X。 コイントスで 3Xか3X/2かを決めているのを 知っていれば、期待値は +X/4。 だけれども、p(x) が分からないので、 如何ともしがたい。

なお、ざっくりと検索した範囲で、 開封型をいちばんきちんと説明しているのは、 西三サークルにある瀬山士郎先生の解説である。

あとは、愚痴。

このばあいに、 p(3X/2)=p(3X)と思い込んだ 解説がいくつかある。 校閲を潜り抜けて出版もされているらしい。 論理が成立していないので意味不明となり推測するしかないのであるが、 どうも胴元がケチ、お大尽、あれこれのばあいを均すことができると 考えているのものもあるようだ。 その結果を半々と考えてしまうのは、バイアスのせいとはいえ、うーん。 もちろん、経験的なデータが必要なので、 数学だけでは、そこまで行くことはできない。 仮にできたとしても(*)に均した確率を入れられるとは限らないのだけど。

さらに任意のX で p(3X/2)=p(3X) だと、 「範囲のない一様分布」という怪物を呼びこむことも理解できてない模様。 逆にこれから問題が成立していないという論法のもあって、 どうしたものなのだろう。

つか、開けて金額を確認するだけで、 それが任意の値でも期待値が25%増えるから交換する予定なら、 いつでも交換なので、 最初から別の方を選べばいいよね。 現実的に可能な分布だと、 金額が増えてくると確率減るので、胴元と読みあいだ、 みたいな方向になるはずなのに。

意志決定論の話にしたいにしても、のっけの確率の初歩が何だと何だよねえ。

2つの封筒問題 (2016-11-23)

 Two envelopes problemというものがある。 基本の問題は次のようなもの:

区別のできない封筒が2つある。 片方にはもう片方の2倍の金額が入っている。 どちらか片方をもらえるが、 受けとったあと開封する前に一度だけ交換ができる。 交換した方が得か否か。

これ、交換してもしなくても確率的には同じ。 だけれども、 例えば10_000円入っているとしたら、 もう片方は5_000円か20_000円なので、 期待値が12_500円となり交換したら得なのかも と考えてしまうことがあるようだ。

とりあえず単純に片付けとく。 胴元がx円合計で入れる確率関数をp(x)とする。 このときΣp(x)=1. x円を入れたときに、x/3円の方をもらう確率も、2x/3円の方をもらう確率も 1/2なので、胴元がx円を入れカツ交換した方が得な確率は、p(x)/2. これを全部足したものが得な確率で、Σp(x)/2=(Σp(x))/2=1/2.

引っ掛けポイントは、仮に10_000円が入っていても、 もう片方が5_000円の確率、20_000円の確率は不明なので、 期待値が分からないというところ。

念のためだが、封筒内の金額らでも、もちろん同じ答えにいきつく。 受けとった封筒に y円入っていたときに得する確率は、 p(3y)/(p(3/2y)+p(3y))だけど、これはとりあえず無関係。 y円入っていてカツ得する確率は、 胴元が3y円つぎこんで、y円の方をもらったときなので、p(3y)/2. これも全部足せばいいので、やっぱり、Σp(3y)/2=(Σp(3y))/2=1/2.

ちょっと問題をかえる:

区別のできない封筒が2つある。 片方にはもう片方の2倍の金額が入っている。 とりあえずもらった方に10_000円入っていた。 このあと、一度だけ交換ができる。 交換した方が得か否か。

こっちは条件が増えているので、決めやすくなった気がするけど、 逆に不定になる。 胴元が15_000円つっこんだことを知っていればキープ、 30_000円つっこんだことを知っていればチェンジ。 とはいえ、確率関数が分からない、 つまり、どっちか推測する情報がないので決められない。

;; 追記: 念のためだけど、確率関数が不明なところがポイント。 胴元がサイコロを投げて、入れる金額を決めようなばあいもありうることに注意。

事前に確率が分からないときに仮に等配分して、 繰り返して推定値を改善していくことはできるけど、 1回だけなら、それも無理。 ということで、心理学や経済学の問題になって、 数学はあくまでも参考。

;; 単なる逃避。とくに意味はない。

p値ではなく、例えば効果量(effect size) (スラド日記 2015-03-05)

 タレこまれてるBASP誌の p値(と帰無仮説による有意性テスト)も95%信頼区間も禁止の話。 元ネタは:

Traffimow, David, and Marks, Michael. (2015). [Editorial]. Basic and Applied Psychology, 37(1), 1-2. http://www.tandfonline.com/doi/full/10.1080/01973533.2015.1012991

p値は、帰無仮説でもデータ以上の偏りがでる確率。 5% で有意なら、 適当にデータを集め続ければ、20回に1つぐらい有意がでるはず。 僕が言語についての論文で他の分野の人が書いたものに ブツブツ言うのは、このタイプにみえるもの。

加えて、伝統的な手法にも問題がある。 例えば、適当な作例だけど、下の表で よくある2×2分割表の独立性検定をすると、 chi^2 = 0.53, d.f. = 1 なので、p値は 0.46 で有意ではない。

27, 33; 31, 29;

これは10倍したものだと、 chi^2 = 5.3, d.f. = 1 なので、p値は 0.02 で有意になる。

270, 330; 310, 290;

だけれども、効果量 effect size として phi相関係数を使えば、いずれも 0.067 になって、両方ダメだよね ということになる。

分野は違うし、統計はあまり使わないものの 感想としては、 方向性は賛成だけど、 いきなりは厳しい。 一般化線形モデルが下々まで降りてきて、 ユーザー向けの教科書が変わらないと難しいと思う。[追記 16h48] あとベイズも。いわゆる New Statistics の方向。

確率とオッズ (2014-11-16)

 チラ裏……。

(確率) = (着目) / (全部)、(オッズ) = (着目) / (他) で、 同じ現象を2通りに数値化できる。 例えば、4個中 1, 2, 3個が当りだと、 確率が 1/4 = 0.25, 1/2 = 2/4 = 0.5, 3/4 = 0.75, オッズが 1/3 = 0.33..., 2/2 = 1/1 = 1, 3/1 = 3.

オッズを分数で書いて 1/3, 1/1, 3/1。 これが「等間隔」なのは分かりやすいのだけど、 小数で書いて 0.33..., 1, 3 ってのは、やだなと。 対数 (面倒なので底 3) で -1, 0, 1 なら、すっきり。

つーことで、オッズの変化は対数グラフを描くのが筋。

[ヨタ] 情報は運命を変えない (スラド日記 2010-08-12)

 逃避中なので、確率についてのヨタ話。

確率論では、標本空間Ωの部分集合が事象なのだが、 その要素は どうでもいい。 これが確率のウサンクサさの 1つの原因なのかとも思う。 例えば、“コインを投げて表が出る”という事象を A とする。 この A は集合だ。だから ∩ とか ∪ とかを使う。 で、集合というなら、要素は何なのだろう。

ということで、様相論理の意味論で使われる可能世界を使ってみよう。 様相論理というのは、可能性や必然性を含めた論理体系で、 可能世界意味論で考えると、 全ての可能世界で真であれば〈必然〉であり、 ある可能世界で真であれば〈可能〉である。 このノリで確率を入れてみる。 例えば、コイン投げをする。可能世界の集合は、 コイン投げをすると、半分ずつに分かれる。 イメージとしては、可能世界が糸であり、確率的な現象により 糸の束がある割合で分かれる。 こういう風に考えることで、可能世界の集合は事象であり、確率を持っていると言い張ってしまおう。

このとき「客観確率」は、 何度やっても同じ割合で分かれる割合だ。 分かれかたがランダムであるなら、確率的に多くの可能世界では相対頻度と大数の法則で決められる。 いっぽう「主観確率」は、 (分母の中で条件にあてはまる可能世界の量)/(手持ちの情報で可能性がある可能世界の量) ということになる。 コイン投げの「客観確率」は、多くの可能世界においては繰り返すことで相対頻度が 1/2 に収束する。 「主観確率」は、ある 1回の投げについて、表裏が同じくらい確からしいという情報があるので、 結果が未知の状態だと 1/2になり、既知の状態では 1 か 0 になる。

で、例の火曜日の男の子問題。 私たちが使うのは「主観確率」だ。 ここで、自分がどの可能世界にいるかは分からないが、 どの可能世界でも子どものでき方は決まってしまっていることに気をつけよう。 やることは、可能世界の量を推測することだけだ。

〈2人子どもがいる〉という情報があるところで考えられる可能世界の量を Q とすると、 「2人とも男の子の確率」は、(1/4 * Q) / Q = 1/4。

〈(少くとも)片方は男の子だ〉という情報が加わると、 可能性がある可能世界の量が (3/4 * Q) に減るので、 「2人とも男の子の確率」は、(1/4 * Q) / (3/4 * Q) = 1/3。

〈その子は火曜生まれだ〉という情報が加わると、 可能性がある可能世界の量が (27/296 * Q) に減り、 この中で条件を満すものも (13/296 * Q) に減るので、 「2人とも男の子の確率」は、(13/296 * Q) / (27/296 * Q) = 13/27。

※ 〈(少くとも)片方は火曜生まれの男の子だ〉を加えても、 〈その子は火曜生まれだ〉を加えても、絞り込まれる可能世界の量は変わらない。 「その子」は文脈のものを参照していて、具体的な指示対象を確定していない。

なお、情報を絞り込むときに 具体的な子どもを示して、〈この子は男の子だ〉という情報を加えると、 可能性がある可能世界の量が (1/2 * Q) に減ってしまっているので 「2人とも男の子の確率」は、(1/4 * Q) / (1/2 * Q) = 1/2。

さらに〈この子は火曜生まれだ〉という情報が加わっても、 可能性がある可能世界の量が (1/14 * Q) に減り、 この中で条件を満すものも (1/28 * Q) に減るので、 「2人とも男の子の確率」は、(1/28 * Q) / (1/14 * Q) = 1/2。

で、結局 Q はどうせ消えるから考えなくてよい。つまり単なる条件つき確率になってしまう。

まあヨタ話。分かってるヤツはいちいちツッコまない。 分からない人は騙されよう。

言語学者なら (スラド日記 2010-07-02)

 次の会議までの空き時間が、書類を読み込むには短いので、 前の日記と表の記事へのコメントを斜め読みしての、 タイプの分類。

  1. 文脈依存が分からない。

    『窓際のトットちゃん』の小学校退学理由ですね。僕も発達障碍なのでよくやらかします。 この問題では、元記事からの流れで、 男女の性別の確率、曜日ごとの出生の確率が、それぞれ等しいとされていることが 分からない。つまり、文脈ごとに約束事が変わることが分かっていない。
    ;; これは職によってはツッコミ能力のプラスになるから。 僕もこれのおかげでご飯食べられるのだと思う。

  2. フレームが邪魔をする。

    外界についての知識として、性別と曜日は無関係ということを持っているので、 確率も独立だと思ってしまう。 ところが、ここで問題になっているのは、 既知の情報により変化する主観確率なので、独立ではないというのが、この問題のミソの部分。 この辺は、説明が面倒だし、言語学の範囲じゃないから、 一番下の図で説明終了。

  3. 人間中心主義に負ける。

    考察の対象物が人間だとそこに視点を移ししてまう傾向が人間にはある。 そこで、この問題でも〈自分が火曜生まれの男の子だったら〉と考えて、 1/2 から抜けだせない人がいたようだ。 視点を移すにしても 〈自分か片割れが火曜生まれの男の子だったら〉と考えないといけない。

  4. 語用論的規則にだまされる。

    文の字義通りの意味と、それを読んで人が思い込む意味には違いがある。 その原因は語用論的規則で、 この問題だと「グライスの量の格率」でひっかかった人がいたようだ。 下の 2つの例文で反応がちがうはずだ。

    • 子ども二人いてて、片方が男の子なんです。ああ、もう片方も男の子なんですけど。
    • 子ども二人いてて、片方だけが男の子なんです。ああ、もう片方も男の子なんですけど。

    上はみなでコケる。下は張り扇でツッコミ。 「量の格率」というのは、〈必要な情報が全部でていて、残りは推定できるはず〉 というもので、日常生活だと非常に役に立っている。 しかし、論理パズルと詐欺でひっかけとして使われることも多い。

フレームが邪魔をする例として、高校までの通常の数学教育のやり方と 僕の説明がちがうせいで、ひっかかった人もいるようだ。 まあ、これは意図的に変えてるからしようがない。 大体の教科書や参考書の流れが、 確からしさが等しい根元事象を考えるのに向いてるように作られていない。 それが、嫌いなもので。

長\末=男\男  男\女     女\男     女\女
 日月火水木金土 日月火水木金土 日月火水木金土 日月火水木金土
日●●◎●●●● ●●●●●●● ●●○●●●● ●●●●●●●
月●●◎●●●● ●●●●●●● ●●○●●●● ●●●●●●●
火◎◎◎◎◎◎◎ ○○○○○○○ ●●○●●●● ●●●●●●●
水●●◎●●●● ●●●●●●● ●●○●●●● ●●●●●●●
木●●◎●●●● ●●●●●●● ●●○●●●● ●●●●●●●
金●●◎●●●● ●●●●●●● ●●○●●●● ●●●●●●●
土●●◎●●●● ●●●●●●● ●●○●●●● ●●●●●●●

おお、この問題は感動的だ (スラド日記 2010-06-30)

 


タレコミ
されてる 本家で話題の 問題:

I have two children, one of whom is a son born on a Tuesday. What is the probability that I have two boys?

直感に反するので、感動的に混乱しますね。とりあえず高校範囲で解いておきましょう。

問題: 2人子どもがいて、片方は火曜日生まれで男の子である。2人とも男の子の確率は?

等確率となる根元事象として、 性と曜日を結びつけたものを、生まれた順に並べる対を使ってみます。 〈男火, 男[日-土]〉 が 7個、〈男[^火], 男火〉 が 6個、 〈男火、女[日-土]〉 が 7個、〈女[日-土], 男火〉 が 7個のうちの、 最初の 2つのタイプだから、(7 + 6) / (7 + 6 + 7 + 7) = 13/27。

本家でも下の 2つと混同している人がいるようです。 無駄ですが、比較のために上と同じような根元事象をとってみます。

類問: 2人子どもがいて、年長の子が男の子

〈男[日-土], 男[日-土]〉が 49個, 〈男[日-土], 女[日-土]〉 が 49個のうちの 〈男[日-土], 男[日-土]〉 の 49個なので、 49/(49 + 49) = 1/2。

類問: 2人子どもがいて、片方が男の子である。2人とも男の子の確率は?

〈男[日-土], 男[日-土]〉が 49個, 〈男[日-土], 女[日-土]〉が 49個, 〈女[日-土], 男[日-土]〉 が 49個 のうちの 〈男[日-土], 男[日-土]〉 の 49個なので、 49/(49 + 49 + 49) = 1/3。

;; これから週後半のしんどいモードに突入なので、日記に書いて逃げる。

;; [21h50付記] おっちゃん、余裕ないから、タレコミの方で遊んでね。 やっつけだけど、おまけにシミュレーションつけたげるから。

<html>
<body>
<script>
var times = 4 * 49 * 1000;
var numerator = 0;
var denominator = 0;

var senior = { sex: 0, day: 0};
var junior = { sex: 0, day: 0};

// 0 = Male, 1 = Female.
function set_sex(obj) {
    obj.sex = Math.floor(Math.random() * 2);
}

// 0 = Sun, 1 = Mon, 2 = Tue, ...
function set_day(obj) {
    obj.day = Math.floor(Math.random() * 7);
}

function is_the_case() {
    return ((senior.sex == 0 && senior.day == 2) || (junior.sex == 0 && junior.day == 2));
}
function are_both_male() {
    return (senior.sex == 0 && junior.sex == 0);
}

function one_trial() {
    set_sex(senior); set_day(senior);
    set_sex(junior); set_day(junior);
    if (is_the_case()) {
        denominator++;
        if (are_both_male()) {
           numerator++;
        }
    }
}

// the main loop
for (var i = 0; i < times; i++) {
    one_trial();
}
alert(numerator + "/" + denominator + " = " + (numerator/denominator)
                + " (expected: " + 13/27 + ")");
</script>
</body>
</html>

いやー、確率って分かんないもんですね (スラド日記 2009-11-26)

 某氏のブログのコメント欄でモンティ・ホール問題について 若干粘着している人がいる。 ちゃんと対応している某氏はえらい。 仕事ができる人ってやっぱり人間に対応する能力があるなあ。 ってのはおいといて、こういう問題。

  1. 3つドアがあり、等確率でそのうちの 1つの後ろに景品を置く。
  2. プレーヤーがドアを選ぶ。
  3. ホストは、そのドアがアタリなら 2つのハズレのドアから等確率で 1つ選んで 開け、ハズレならもう 1つのハズレのドアを開ける。
  4. プレーヤーは、この時点で変更する権利がある。

ドア 3つを A, B, C とする。 プレーヤーが A を選んで、ホストが開けてない状態だと、 A がアタリの確率は 1/3 で、B か C がアタリの確率は 2/3。 ここでホストが B を開けるとする。A がアタリの確率は変化しない。 C がアタリの確率は B の分ももらうから、2/3。 だから、変更した方が得。

ところで、ホストが開ける前に偶然 B が開いてしまって それがハズレの場合はどうなるだろう。 B の分の確率は A と C に等しく配分されるので、A と C はともに 1/2。 どっちでもいい。

;; 非常に手抜きの説明なので、 気になる人は条件付き確率で地道に計算してください。 後段は、どのドアが開くかの確率を適当に決めても大丈夫なんで、 1/3 ずつだと楽かな。 それから受験数学の格言「確率は時間を超越する」を忘れずに。

;; 計算しても納得しない人はなぜ強調されている 部分があるのかを考えて、それでも納得しない場合は、 丁寧に対応してくれそうな人がいそうな数学掲示版を探してください。 某氏が誰か推定しておしかけるのは迷惑なのでやめましょう。

ヒトの頭はバギーなので、 意図的にハズレと知っていて B を開けたときの C がアタリの確率と、 たまたま B を開けたらハズレだったときの C がアタリの確率が ちがうことに違和感を感じる人が結構いるらしい。

で、3 のところでプレーヤーが意識が朦朧として気付いたときには、 B が開いていてハズレだった。 会場がざわめいているのは AD が転けて B を開けちゃったせいなのか、 プレーヤー自身が倒れたせいなのか分からない。 このとき C がアタリの確率はどうなるのか。 傍の人は 2/3 か 1/2 か決められるけど、 プレーヤー本人は決められないとするのが古典的。 けど、人間はこの状態で確率を推定しないといけないこと多いよね っていうのは別の話。

2024年1月28日日曜日

ニュートンにおける「量」のかけ算 (スラド日記 2019-12-13)

 

ニュートンの講義ノートがもとになっている『普遍算術』。

「量と量のかけ算」をどう扱うかということについて。 私訳。

ところが加えて以下のような慣行がなされている。 ある線分の上に直角をなす他の線分を動かすことによる面積の生成あるいは描写は、それらの線分の乗法と言われるのである。 なぜなら、いかにしても乗法された線分は面積となることができず、 それゆえやはり線分からのこの面積の生産は乗法からほど遠いのに、 それなのに、次の点で一致するからだ。 一方の線分の単位の数がもう一方の線分の単位の数で掛けられたものは、 もし面積の単位が、通常そうであるように、その辺が線の単位である正方形で定義されていさえすれば、 これらの線分で包まれた面積における単位の不名数[単位のつかない数、つまり個数]を生じるのである。

人々は「量と量をかけ算する」と言っているが、 ニュートンにっては厳密にはそうではなく、一種の糖衣構文。

[idea] なぜ反証で理論は倒れないか (スラド日記 2007-01-06)

 というより 「ノーマル・サイエンティストに反証主義が大切な理由」 について考えたメモ。

ここでは理論を、 対象レベルの仮説(以下、雑魚仮説)と パラダイムのあり方を決めるメタレベルの仮説(以下、ボス仮説)の 二種類の仮説がある体系と考える。 例えば、 言語学の最適性理論では、 制約は破られうる、制約には序列がある、 という2つのものがボス仮説で、 他は雑魚仮説である。

我々ノーマル・サイエンティスト(以下、雑魚キャラ)がやっているのは、 雑魚仮説を反証し、 ボス仮説に従うよりよい雑魚仮説を提案することである。 これにより理論を改善し続けている。 雑魚キャラにとって、 反証主義とは、 パラダイムを強化するためのものであり、 パラダイムを乗り越えるためのものではない。

ボス仮説の反証は仕組み上、難しい。 雑魚仮説の修正で補うことができることが多いからである。 新しいパラダイムは、 反証によるのではないと思う。 無理に修正した雑魚仮説のスパゲッティに 嫌気が差して単純化しようとして出てきていた気がする。

ところで、 ボス仮説が反証されたとしても、 すぐにかわるパラダイムが出てくる訳ではない。 その間、 雑魚キャラは、 どこに上手く行かないものがあるのか意識しつつ旧理論の枠組みで 研究を続けるしかない。 また、すべきである。 いずれ新理論が出てきたときは、 理論的に共約不可能であったとしても、 旧理論に制限を加えることで、 近似的には共約可能なサブシステムになるはずだからである。 例えば、 特殊相対性理論とニュートン力学は共約不可能であるが、 後者は前者の、速度が小さいときの近似理論になっている。

このような場合、 新理論が出てきた時点で、 我ら雑魚キャラは、近似理論をやっていると言えばいいだけである。 やることを変えていなくても、 意識を変えたんだと言えばいい。 そして、 反証されたのは旧理論の雑魚仮説ではなく、 対応する、新理論の雑魚仮説ということになる。

だから、我ら雑魚キャラは、反証主義でやっていく。 たとえ根本が反証されたって、 それを避けながら元のパラダイムの中が反証主義で仕事する。

[メモ] ネタの在り処 (スラド日記 2011-03-08)

 John J. McCarthy (2008) Doing Optimality Theory: Applying Theory to Data, Blackwell, http://www.amazon.co.jp/dp/1405151366, p.163 から [強調 tagga]:

Often, a good way to balance novelty and familiarity is to look for problemes in some recent article or manuscript on an interesting topic. Pay particular attention to the foot notes and the conlcusion. Footnotes often disclose holes in the analysis, and conclusions are where authors often concede the limitations of their analysis. Phrases like "this is a topic for further research" or "this is a problem for any theory" are beacons guiding you toward potential research topics. You will be building on previous work, but at the same time you will have something new to say. A warning: Don't be satisfied with just raising objections. Better work couples the negative argument with a positive proposal.

ああ、書いちゃうね。うん。 他の OT 独自の助言は〈別の言語でやてみよう〉。 これは OT 独自というより言語学一般だと思うけど。 その他の抽象度の高い助言 (pp.163-164):

  • 因習的な知恵を逆転する。

    既存の説で結果あつかいされているものが、実は原因なのかもしれない。

  • 基礎となる想定を捨てる。

    当然視されている前提条件は必要ないかもしれない。

  • 明言されてない問題に立ち向かう。

    当然と思われていること、否定されていることでも考え通してみる。

  • 暗黙の了解を明示化する。

    きちんと形式化して、抜けてる部分がないか確認する。

  • 同等以上のことを少ない道具立てでやりとげる。

    何か削っても同じことができないか試す。

  • 統合する。

    複数の概念を混ぜてみる。

  • あきらめる。

    実はその分野内で説明ができない。他の分野のせいと言う。

p.165 からも引用。これは大事:

A final piece of advice. It's better to be wrong than to be trivial. Ideas that are interesting but wrong are the main engine of progress in this field. This is another reason to be careful in how you frame criticisms.