期待値の怪について
受け売りの受け売りですが、木村先生から聞いたと竹中先生から聞いた話です。
○ 一方が他方の二倍の金額が入っている2つの封筒があります。
(解っているのはこれだけ。)
そのうち一方を勝手に選んで開けてみたら1万円入っていました。
それをそのまま貰ってもいいのだけれども、取り替えて他方を選んでもよいと
します。
そのままならば1万円のままですが、取り替えれば5000円に減ってしまう
か、2万円に増えるかということになります。
取り替えた方が有利でしょうか。 という問題です。
解答1
Aの封筒を選んでBに取り替えるのと、最初からBを選んだのと違いはない。
逆でも同じ。
ランダムに選んだのだから、取り替えても意味がない。
解答2
選んだ封筒から1万円出てきたのだから、他方には5000円か2万円入って
いることは確かである。
2つの封筒のうち、多い方を選ぶか、少ない方を選ぶかの確率は明らかに1/2
ずつである。
多い方を選んだとすれば他方には5000円、少ない方を選んだとすれば他方
には2万円入っている訳だから、他方に5000円入っているか2万円入って
いるか、確率は1/2ずつである。
そこで取り替えた場合の期待値を計算すると、
1/2×5000円+1/2×20000円=12500円 となる。
取り替えなければ10000円のままだから、取り替えた方が有利である。
というのである。
ランダムに選んだのに、取り替えた方が有利になるなんて納得できない。
だけど、解答2に反論しようと思っても、誤りや矛盾が発見できない。
はてはて
----------------------------------------------------------------------
以下は、西三サークルで議論した結果を私なりにまとめ、群馬大学の瀬山氏に送った
メールそのものです。
----------------------------------------------------------------------
一応の結論が得られましたので報告します。
今後の議論の材料にしていただければ幸いです。
○ 取り敢えず結論
確率を計算するための前提となる条件に欠落しているものがあり、取り替えた
ほうがよいかどうか判定できない。
○ 観点1
封筒を選ぶとき、さいころを振って偶数・奇数で選ぶなど、無作為な方法が
あるので、どちらの封筒を選ぶか、の確率を1/2とすることに問題はない。
そのことから、他の封筒に入っている金額が選んだ封筒より多いか少ないか
の確率も1/2である。と考えるのは、欠落している条件を無視した錯覚で
ある。
*** 他の封筒の金額が5000円であるか、2万円であるか、
の確率は、1/2ずつとはかぎらない! ***
2つの封筒を用意し、お金を入れた人がどのような考えで、あるいは方法で
金額をきめたのか、という条件が欠落している。
なんとなくとか無作為に、という場合は観点2に回し、ある意識を持って
金額を決めた場合を考える。
例1 錯覚(不穏当ながら敢えてこう呼ぶとして)と一致する場合。
まず3つの封筒を用意し、それぞれ5000円、1万円、2万円入れる。
つぎに1万円の封筒をどけておき、他の2つの封筒から1つを確率1/2
で選ぶ。
この選んだ封筒と、どけておいた1万円の封筒を私の前に差し出した。
このように用意された封筒であれば、1万円の封筒を選んでしまった私に
とって、他の封筒に入っている金額が選んだ封筒より多いか少ないかの確
率は確かに1/2ずつである。
この場合、期待値は確かに12500円であるので、「この方法で用
意されたと知らされているならば」迷わず取り替えたい。
例2 常識(取り替えても意味がない、の方)と一致する場合。
まず4つの封筒を用意し、それぞれ5000円、5000円、1万円、
2万円入れる。
つぎに1万円の封筒をどけておき、他の3つの封筒から1つを確率1/3
で選ぶ。
この選んだ封筒と、どけておいた1万円の封筒を私の前に差し出した。
このように用意された封筒であれば、1万円の封筒を選んでしまった私に
とって、他の封筒に入っている金額が選んだ封筒より多いか少ないかの確
率は、1/3 と 2/3 である。
この場合期待値は、5000×(2/3)+20000×(1/3)=10000 であるので、
「この方法で用意されたと知らされているならば」取り替えても取り
替えなくても変わりがない。
例3 その他の場合
5000円の確率が上の例 (2/3) より高い場合は取り替えない方が、
低い場合は取り替えた方がよい事になる。
いずれにしても「この方法で用意されたと知らされているならば」と
言うのがポイントである。しかも封筒の数だけでなく金額についても知
らされている必要がある。
というのは、10000円、20000円、40000円、とか、
2500円、5000円、10000円で用意された場合も有り得る
からである。
この事は等比的に決めたか等差的に決めたかは関係ありません。
等差的に決める問題のときには錯覚が矛盾を起こさないだけで、本質
的には同様なのです。
結局、「条件が欠落していては判断できない。」
○ 観点2
「無作為に」金額を決めた。と知らされた場合はどうであろうか。
「無作為にxを決め、x円と2x円を封筒に入れた。この場合である。
この問題の本旨はここにあるのでしょう。
この「無作為に」というのが曲者であった。
結論からいうと、
「無作為」というときの「確率の一様性」がどのような「測度」の下で考
えられているのか。という「測度」の問題である。
例1 有界・離散的な場合
現実の問題として1兆円と2兆円を入れる。などは考えられないので
すが、取り敢えず上限と下限を決めて公表する場合を考える。
しかも正の自然数に限っておく。
簡単な例として「1から100万までの自然数から無作為にxを選び
x円と2x円を封筒に入れた。」場合を考える。
もちろんこの「無作為」というのは、どの数値も1/1000000
の確率で選ばれる事が保証されている、という意味である。
やはり「この事が知らされているならば」判断が可能です。
(1) 100万円を越える金額がでてきた場合には取り替えない。
(2) 100万円以下の奇数の金額ならば取り替える。
この2つは自明に近いですね。
(3) 100万円以下の偶数が出てきた場合は取り替える。
例えば1万円が出てきた場合、xは5000か10000のど
ちらかである。どちらも1/1000000の確率であったわ
けであるので、他の封筒が5000円であるか1万円であるかの
確率は等しく1/2ずつである。
この場合は正確に期待値が計算でき、12500円となります。
その他、たとえ一様でなくても確率が確定しているような選び方であ
るならば、同様に判断が可能になります。
例2 有界・連続的な場合
金額の問題としては不適切ですが、「点数」と置き換えて、ある実数
の区間で無作為にxを選ぶ事にしましょう。
負の数を許すと、有利・不利が逆転してややこしくなるのでやめてお
きましょう。
例として区間[0,100]から無作為に実数xを選び、x点と2x
点を(紙にでも書くか、表現が定義されていない実数かもしれません
から、1m以内のヒモとその2倍の長さのヒモにしますか。)を封筒に
入れておく。これで問題の一般性は失われていませんね。
この場合の「無作為」についても、一様性が確保できる選び方を(少
なくとも抽象的には)考える事ができるとします。
(長さ1mの線分の上に、かなり上空から小さな物を落とす、など。)
やはり「この事が知らされているならば」判断が可能です。
(1) 前の例と同様、100を越えるヒモが出てきたら取り替えない。
その確率は、xが50を越え、かつ2xの方の封筒を選んだ場
合だから、 ( 1/2 )×( 1/2 )= 1/4
(2) 100以下のヒモが出てきた場合、このヒモが
xそのものである確率は1/2。(封筒の選び方である。)
2xである確率は、xが50以下であり、かつ2xの方の封筒を
選んだ場合だから、 ( 1/2 )×( 1/2 )= 1/4
(全部合わせてちゃんと1になる。)
この二つの確率比は 2:1 である。
条件付き確率の計算により他方の封筒の方がx(つまり短い方)
である確率は1/3、他方の封筒の方が2x(つまり長い方)で
ある確率は2/3である。
期待値は、X × ( 1/3 ) + 2X ×( 2/3 ) = 5X/3
よって取り替えたほうが有利である。
この例では一様性に対する直感を信じて計算しましたが、正確にはΔx
の幅のxの近傍の値が選ばれる確率が Δx/100 であることから
キチンと計算する必要があるかもしれません。
例3 有界でない場合(連続でも離散でも)
実は、この場合が1番厄介なのです。
前例と同様に負の数を排除するとしても、無限大まで一様な「無作為な」
(連続でも離散でも)選び方、というのに疑問を感じたのです。
想像を越える大きな数まで含めて一様な確率で無作為に数を選ぶという
ことはどんなことなのだろう。自分がオーダーの違う無限小の世界に落
ち込んで行くような、逆に自分自身(の感性)を無限大に拡大して、数
直線全体が線分に見えるような位置に立たなければ、などと、めまいが
しそうになります。
100歩譲って、有界連続のときのように、kΔx のkが定数である
ことが一様性なのだと自分を言い聞かせても、区間が無限である以上k
は0(無限小)でなくてはならないのです。
有界であればkは有限値だったのですが、有界でない無限の場合はもう
1段階高いオーダーの無限小を考える必要があるようです。
もう一度例2に戻って考えます。
区間[0,100]でxを選ぶとき、近傍Δxが選ばれる確率が一様で
あるとは、任意の幅のΔxについて確率が Δx/100 であることです。
(この有界な区間にも点は無限にあって、1点xを選ぶ確率とい
うものは定義できない。無理すれば0となってしまう。)
そこで2xの方を考えると、変域は[0,200]です。
xの近傍Δxに対応するのは2Δxです。この微小区間が選ばれる確率
も同じな訳で、2xの近傍Δxの確率は Δx/200 で、xの場合の半分
です。
言い換えると、変域が2倍に引き伸ばされたので「同じ幅のΔx」の確
率は半分に薄められてしまうのです。
このことを更に言い換えると、xと2xとでは「測度」が異なるわけで
す。
どちらの封筒を選ぶのかの確率、つまり開けた封筒の中身がxのほうか
2xの方かの確率は1/2と考えて構わないとしても、その値がxの場
合と2xの場合では、用意する段階での確率の測度が異なっているので
す。
オリジナルの問題でも、10000円という金額をみて他方を推測する
のに、この10000円がxの方である場合と2xである場合とでは、
「用意する段階での」数値としての選ばれ方の確率の測度が異なってい
たのです。それを無意識のうちに同一の測度での確率と感じてしまうと
ころに錯覚の原因があると考えます。
もっとも、通常「測度」なんて意識しませんからねぇ。
しかし、一つの問題を異なる測度から眺めて、違う確率結果がでて悩む
というパラドックスは昔から紹介されていますね。困るのは各々の問題
においてどの測度が正しいのか、を定義できない場合がある(らしい)
ことの方ですが。
本題に戻って、有界でない無限の区間での話ですが、
区間[0,∞)で無作為にxを選ぶ場合を考えます。
一様性を保証する無作為さ、というのはこの場合やはりピンとこないの
ですが、想像力を逞しくして、可能であるとしましょう。
この場合でもxと2xでは測度が異なります。厄介なのは、半直線なの
で拡大しても縮小しても測度の違いを実感できない事です。
(有界の場合は区間が2倍になるのが目に見えた。)
*** xと2xを同一の測度でみる事はできないか。 ***
等差的な2数の場合は問題ありませんでした。そこでその理由を考えて
みたところ、等差的な2数は当然ながら間隔が一定なわけです。
そこでその2数が両方とも入るようなΔxを考えると、その半直線上で
の位置にかかわらず、同じΔxで考える事ができます。
つまり「2数をペアとして考えて」そのペアが半直線上で占める位置の
確率の一様性を考える事が可能なのです。
(半直線の無限性を考えれば、ペアを含むΔxなんて微小区間と考えて
も一向構わない。)
ところが、本題のような「等比」的な場合には困ります。
同じようにペアとして考えると、そのペアを含む区間Δxは、半直線全
体から見てやはり微小区間と考えてもよいのですが、位置によってその
幅が変わってしまうのです。
位置によって連続的に測度が変化している!
通常の数直線の半分としての半直線ではまずいという事で、位置によっ
ても一様性を崩さない測度はないかと考えたところ、ありました!
対数目盛りの直線(左側もある)です。
これだと等比的な2数のペアの間隔は一定になります。
本題のxと2xの場合、間隔は Log2 で一定です。(底は問わない)
この場合、この2数を含む区間Δxの位置の確率の一様性は確保されま
す。
ということは、期待値を計算するのにx/2と2xでは測度が異なるので
結果は保証されないが、Log(x/2)とLog2xで計算すればよいはずにな
ります。
( 1/2 )Log5000+( 1/2 )Log20000=( 1/2 )Log100000000=LOG10000
となり、取り替えても同じであることになります。
Logのままで計算してもなんとなく釈然としないので、通常の半直線
にスケール変換してみます。
通常の半直線上ではxの近傍Δxの確率と、2xの近傍2Δxとが対応
して測度が一致するるので、同じ幅のΔxで考えるには2xの方を半分
と考えなくてはなりません。2xと4xでも同じく半分です。
つまりxと4xならば1/4、xと8xならば1/8です。
結局、xとrxの場合は1/rになります。つまりr:1です。
出てきたのは1万円です。封筒の選び方は1/2ずつですが、用意すると
きに出題者(?)がxとして5000円を考えたのか10000円を考
えたのか、その確率の比は 2:1 だったことになります。
つまり他の封筒に5000円入っているか、20000円入っているかの
確率の比は 2:1 である、ということです。
つまり、2/3と1/3です。
よって期待値は、観点1の例2と同じ形の
5000×(2/3)+20000×(1/3)=10000 となり、取り替えても意味がない、
という直感に素直な結論が得られました。
○ まとめ
半直線上、無限の彼方まで一様である。という「無作為性」を信ずるよりも
天文学的に大きな数よりも日常生活感覚の範囲内の数を考える確率が高いと
いうのが私の素直な直感です。
大きい数を考える確率が小さくなるという上の結果は、その意味では納得で
きないでもありません。
また、人間の感覚は対数的に変化を感ずるという心理学の通説とも合致する
ような気もします。
Δx/x と、その積分としての Logx ・・・。
対数目盛り上で正規分布となるような確率分布関数かな? とか、
区間[1,∞)で積分して1であるような1/xに比例する確率分布関数、
(到るところ0だ!)とか、色々考えを巡らせてみました。
しかし、1/xに比例するといったような明快な確率分布関数に従って一つ
の数を考える、と割り切れるような感じ方を人間はしているのでしょうか。
日常生活感覚の範囲内、という漠然とした区間の中では、結構一様に数を思
い付いているような気もします。
そして、天文学的数の数の中から思い付くのと、日常生活感覚の範囲内から
思い付くのとを比べれば対数的に偏っている。というのも感覚的に納得でき
てしまうのです。
これだけの長文を読んでいただいて申し訳ないのですが、やはり結論は
--------------------------------------------------------------------
封筒を用意した人がどんな意識で金額をきめたか。「無作為」としても無限
の半直線上でその人が感じている一様性とはどんな測度の下なのか、という
判断材料が(期待値を計算可能な形で)得られない限り判定できない。
--------------------------------------------------------------------
というのが妥当な線ではないかと思います。
乱文にお付き合い頂き有り難うございます。
議論の材料にしていただければ大変幸いです。
1997 10月25日
補足です。
今一つピンとこないところがありますので、一部を整理しなおします。
無限の半直線から1つの数を選ぶ、というのが私にとってイメージ困難なので、
「半直線上から、ある有限幅の(漠然としていますが)区間を(無意識に)選び、
その区間から一つの数を選んでいる。」という仮説をたてます。
1 区間内で1つの数(の近傍)が選ばれる確率
任意の実数値(素直に考えて)G、Kについて区間(G,G+K]を考え、
この区間内に限定して「無作為に」実数xを選ぶ。
これならば一様性をイメージすることができます。
区間幅はKなので実数xの近傍ΔXの確率は (1/K)ΔXです。
2 正の実数全体をいくつかの区間に区切ります。
まず区間を選ぼうと言う発想です。
どの区間が選ばれる確率も一様であるような区切り方を考える必要があります。
○ (kG,(k+1)G] k=0,1,2,3・・・ というような等間隔の区切り方。
最初に思い付きますが、これの無作為な一様性には無理を感じます。
100から110までの区間と1000000から1000010までの区間
を同様には感じられません。後者の方が狭く感じます。
天文学的数MからM+10までの区間なんて塵です。
○ やはり心理学の定説のように、対数的に、
100から110までの区間と1000000から1100000までの区間
の方が同様な広さと感じます。
((r^K)G,(r^(K+1))G] k=0,1,2,3・・・ というような等比的な区切り方。
例えば、10進数の桁数に対応する、
[G,10G)、[10G,100G)、[100G,1000G)、[1000G,10000G)、
これの方が対等な「広さ」を感じます。
(0,G]についてはここでは考えません。
あとでGを小さくすることで(0,∞)をカバーします。
3 まず、r=2として ((2^K)G,(2^(k+1))G] k=0,1,2,3・・・ と区切ります。
つまり、(G,2G]、(2G,4G]、(4G,8G]、(8G,16G]、・・・
です。これらの区間の一つを選ぶときの確率が一様であると考える訳です。
1つが等確率で選ばれ、その中で実数xを選ぶと考えればやはりΔXで考えて、
確率はその区間幅に反比例するわけです。
KGで始まる区間の幅はKGですから確率は、(1/KG)ΔXとなります。
ここでGを小さくすれば一つ一つの区間幅は微小となり、その中のxは、x≒KG
と考えて良いので確率は、(1/x)ΔXとしてよいことになります。
ここでG→0とすれば、(0,∞)をカバーし、連続的に1/xに比例した確率分布
関数のイメージが出来上がります。r=2以外でも同様です。
結局 (1/x)ΔX とその総和としての Logx これが一つの測度を与えます。
そしてこの考えで計算した期待値は、本文で試みたように直感にも合います。
4 以上の考えは、比較的大きな数(感覚の問題ですが)に対しては結構説得力を持ち
ますが、小さい数に対しては却って感性に矛盾します。
ミクロ的小さい数を考える確率がどんどん大きくなってゆく、というのはやはり変
です。極めて小さい正の実数というのも、そのオーダーに従って確率が下がる、と
考えたいところです。
人間の感じている一様な無作為さとは、どんな測度を考えればよいのでしょうか。
「正規分布」も話題になりました。
正規分布も魅力的ですし、対数も捨てがたい。
と言うわけで、対数目盛り上での正規分布が気になっています。
日常生活感覚範囲内でもっとも思い付きそうな平均的x、を考えようと思うのです
が、どう定義してよいか解りません。もちろんその気になれば統計的に平均らしき
ものを考える事は可能かもしれません。「何でもよいから実数を1つ言ってくださ
い」と、アンケートでもとりますか。「あんまりこの辺の数ばかりでもいけないか
らとんでもない大きい数でも言っておこうか」などと考えたら、はたして無作為と
言えるでしょうか。表現の定義されていない無理数はだれか言うでしょうか。
無理を承知で、無作為に思い付くxの平均と標準偏差が得られる、としましょう。
これを材料にして、正規分布を考える事ができます。
対数的な感じ方も捨てがたいので、これを対数目盛りの直線上でやるのです。
(一寸短絡的に飛躍した感じもありますが、1つの例です。)
そうすれば対数目盛り上で、1を中心とした(規格化しました)左右対称な正規分
布曲線を考える事ができます。そうすれば、通常の数直線での区間 (0,a)
[aは対数の底、xの平均値]つまり平均の左側でも、0に近づくにつれて確率が
下がってゆくようになります。
そして、通常の数直線にスケールを戻した上で(0,∞)での定積分の値が1にな
るように係数をきめる。・・・・・・!!?
まとめ
結局仮説にすぎないのです。
「測度の問題である。」との確信は深まりましたが、なんとなく自分の感じ方をうま
く説明している、とは言えても、これが正しいなどと言えるものは考えられません。
コンピューターでシミュレートするのでも同じです。一様性をイメージして式を与え
るのは人間ですから。だいたいコンピューターは「無限に広がる連続した実数全体」
などは扱えない、極めて有限かつ離散的な道具なのですから。
区間(0,∞)で一様な無作為性、などと言うのは幻想であって定義できないのかも
しれない