今日は確率の話

「量子が変える情報の宇宙」から「第9章、確率を見積もる」。


この章では、確率による情報の定量法、と言う事で、シャノンの情報単位ビットを思い出します。しかし、このビットは情報の意味、価値とは直接関係ありません。情報の基となる物理パターンの一つですから。

シャノンは確率を情報と考え、対数変換しビットに書き換えたのです。


この章が面白いのは、そのようなものではなく、モンティ・ホール問題に代表されるような、虚をついた確率の話があるからです。


確率とは、ありそうな可能性の事で、単位は無次元。英語ではProbability。

コインを投げた時の裏の出る確率は、表が出るのと同じで0.5です。コインを投げれば、コインが立つ場合も考えられますから、厳密な回答ではありませんが。


それでは有名なモンティ・ホール問題。

アメリカのテレビ番組での話し、「司会者のモンティ・ホールが挑戦者に、1から3までの番号が書かれた3つのボックスを見せる。一つのボックスには新車が隠されているが、各ボックスの中身はカーテンで覆われて見えないようになっている。新車がどの箱にあるかを言い当てれば、その車が手に入るというわけだ。今、挑戦者が当てずっぽうで1番のボックスを選んだとしよう。車が本当はどこにあるかを知っている司会者は、2番のボックスのカーテンを開けてそれが空だと示し、そして気前よさげに尋ねる。「最初に予想した1番のボックスで行きますか?それとも3番のボックスにかえますか?」」とあります。


結論は、

直感的に判断すれば、車は二つのボックスのどちらかに隠されているのだから、どちらにしても正解の確率は50%であり、選んだボックスを変えようと変えまいと同じだろうと思われる。しかしそれは間違いなのだ。」と。

なぜなら、

もし3番のボックスに変えれば、正解の確率は3分の1から3分の2に増えるんだ」そうです。


分かりますよね。

ボックスが1千個でも、百万個でもあれば、誰でも気が付きます。


そこで、著者は更にもうひとつ例をあげてくれます。

モンティ・ホール問題は理解しにくいので、その要点だけを、次のようなもっと単純な例で考えて見るとよいだろう。ある父親が言った。「私には子供が二人いる。二人は3歳違いで、1人は男の子である。」さてもう1人の子供も男の子である確率は?あなたはきっと「もう1人の子供は男か女かのどちらかなので、確率は2分の1だ」と思ったことだろう。しかしそれは間違いである。車を手に入れ損なった不注意な判断が、再びあなたを欺いたのだ。実は正解は3分の1となる。2人の子供は、上から男・男、男・女、女・男のいずれかである。そしてこの3つの可能性の中で、最初のものだけが答えの条件に当てはまるのだ。

さらに父親が、「2人の子供のうち背の高いほうは、男の子である」という追加条件を付け加えたとしよう。すると可能な組み合わせは、「背の高い男の子と背の低い男の子」と「背の高い男の子と背の低い女の子」の二通りに減り、もう1人が男の子である確率は、3分の1から、2分の1へと変化するのだ。」と。


後者の例は、著者の言うようにモンティ・ホール問題より分かり易かったですか?

私は、よく分からない上、なにか騙されたような雰囲気で、気分がもやもやとしましたが、これを読まれた皆さんはどう感じられました?


どうしてもやもや感がおきたのかと考えて見ました。するとなんとなく分かったのは、著者の問題設定と、私が持った問題意識が異なっている事に気が付いたのです。


私は、ある父親とは、知人をイメージして考えたのです。すると子供が二人いて、一人が男の子であっても、二人目が男の子であるか女の子であるかは独立して考えられますから、半分半分の確率で答えが得られます。1回目の出産と、2回目の出産は独立した事象になります。

「私には一人の男の子がいます、さて次に生まれてくる子供は男の子でしょうか、女の子でしょうか。」と考えたのです。この場合は2分の1です。


しかし、著者の問題設定は以上のような状況ではなく、たとえば町全体にいる、子供を二人持ったお父さんを母集団にし、子供が生まれるという事象を独立事象扱いにしない設定にしての、問題としています。

多くの2人は既に生まれた後での話。すると、その2人はそれぞれ50%の率で男女比が決められているのです。男・男、男・女、女・男、女・女と。

つまり、1回目の出産と2回目の出産が独立ではなく、条件付に変えられたのです。


クイズ問題はよく読まないと、確かに引っ掛かります。


それで、イギリスの首相であったディスレリーの言葉を思い出します。

There are three kinds of lies: lies, damned lies, and statistics”「世の中には3つの嘘がある。一つは嘘、次に大嘘。そして統計である」


この言葉は統計ですし、ディスレリーがどういう状況のもとで発言したのか知りませんから、感覚的な判断しかできませんが、

確率の問題もだまされ易いのです。


それと、老婆心ながら、

probability は確率

statisticsは統計

stochasticは確率的な

と間違わないように。

私はかつて、statisticsstochasticこんがらがっておぼえていました。