紅茶の真相
「ワトソン君、近頃ハドソン夫人の様子が少しおかしいと思わないかね?」
ホームズの唐突な問いに、私は新聞から顔を上げた。「おかしい、とは? いつも通り、我々の世話を完璧にこなしてくれているじゃないか。」
「そこだよ。」ホームズは天井を仰いだ。「完璧すぎるんだ。特に、昼下がりの紅茶だ。最近、彼女が紅茶を運んでくる頻度が以前より増している。あれは単なる親切心だけでは説明がつかない。我々の様子をうかがう口実…何か心配事でもある兆候かもしれん。」
ホームズの驚くべき観察眼にはいつも感心させられる。言われてみれば、確かに最近、午後のひとときにハドソン夫人が顔を見せることが増えたような気もする。しかし、私はその「気もする」という曖昧さを鵜呑みにはできなかった。
「なるほど…。しかし、ホームズ、それは我々の主観的な印象、つまり“気のせい”ということはないだろうか?その変化が偶然の範囲を超えていると、どう証明する?」
私の問いに、ホームズの目が面白そうに細められた。「面白い問いだ、ワトソン君。では、科学者である君の手に委ねるとしよう。君の几帳面な日記があれば、この謎は解明できるはずだ。」
その挑戦的な言葉に、私は奮い立った。「よし来た。それならば私の出番だ。私の記録を使って、その“変化”が統計学的に意味のあるものなのか、客観的に検証してみせよう。」
ワトソンの科学的検証~2 つの比率の差の検定~
1. 証拠の整理(ワトソンの日記より)
私はまず、比較のために 2 つの期間を設定した。一つは夫人が穏やかだった時期、もう一つはホームズが異変を指摘した最近。ハドソン夫人が午後に紅茶を運んできたかどうかを私は丹念に数え上げた。
(1)基準値となる母比率 𝑝0
(昨年の記録):
・観察日数:90 日
・紅茶が運ばれた日数:33 日
・平時の比率 𝑝0 = 33/90
次に、この「平時の基準」と比較するために、ホームズが異変を指摘した最近 90 日間のデータを標本として整理する。
(2)検証対象の標本比率 p^
(最近の記録):
・観察日数 :90 日
・紅茶が運ばれた日数 :42 日
・最近の比率 p^ = 42/90
机上の計算用紙に並んだ数字を眺める。確かに比率は増えている。しかし、その差は約 10%。この違いが、果たして意味を持つのか。検定してみる。
2. 捜査方針の決定(仮説の設定)
統計的検定とは、まず 2 つの対立する仮説を立てることから始まる。
帰無仮説 H0 (偶然説): ハドソン夫人が紅茶を運ぶ頻度に差はない。最近の増加は、単なる偶然の揺らぎである。
対立仮説 H1 (ホームズ説): 2 つの期間で、紅茶を運ぶ頻度が増えた。この変化は偶然とは考えにくい。
そして、判断の基準を設けねばならない。
私は、科学の世界で広く受け入れられている基準、有意水準 α=0.05 を採用することにした。これは、「もし偶然説が正しいにもかかわらず、『頻度は増えた』と間違って結論づけてしまうリスクを 5%までは許容する」という捜査方針を意味する。
3. 検証の実行と判定
まず、最近の比率(p^ )が、基準となる母比率(p0)からどの程度離れているかを、標準化され
た指標である Z 値として算出する。
さて、この Z 値「1.97」をどう評価するか。ここで「棄却域」という考え方を用いる。標本平均の分布図の中で、「確率 5%(有意水準)以下でしか起こらない、極めて稀な領域」をあらかじめ設定しておく。これが棄却域だ。
今回は「増えた」ことを検証する片側検定なので、分布図の右端 5%の領域が棄却域となる。そして、その棄却域が始まる境界線は、 Z = 1.645 となる。
つまり「計算した Z 値が、臨界値である 1.645 よりも大きければ、それは偶然とは考えにくい“棄却域”に入ったとみなし、帰無仮説を棄却する。」ということ。
そして、我々が算出した値は、Z=1.97。 これは、境界線である 1.645 を明確に上回っている。つまり、ハドソン夫人の行動の変化は、偶然の揺らぎの領域を飛び出し、統計的に意味のある“棄却域”へと足を踏み入れたのだ。
4. 結論(ホームズへの報告)
私は、計算用紙を手にホームズに向き直った。「ホームズ、結論が出た。数字が明確な答えを示している。」
「ほう。続けてくれ、ワトソン君。」
私は一息おいて続けた。「これは偶然ではない。彼女の行動は、統計的に“有意に増加した”と断言できる。我々の知る日常は、確かに、そして客観的に変化したのだ。」
我が友人は深く、そして満足げに頷いた。「見事だ、ワトソン君。これで我々の進むべき道がはっきりと示された。」
ホームズの瞳には、既に次なる謎への光が宿っていた。私の統計学の知識が、偉大な探偵の確かな一歩を支えたことに、私は静かな誇りを感じていた。
5.おわりに
さて、ここまでシャーロック・ホームズの物語を通して、統計学の一手法である「比率の検定」を見てきた。これは、「ある集団の行動や意見の比率が、基準となる比率から意味のある差をもって変化したか」を客観的に判断するための手法である。
物語の中では、ハドソン夫人の行動が「平時」という基準から逸脱したかを検証した。その検証プロセスは、以下の手順で行われた。
1. 仮説の設定: まず、証明したいことと、その反対の立場の 2 つの仮説を立てる。
a. 帰無仮説 (H0): 「差はない(今回は、増えてはいない)」という、基本となる立場。
b. 対立仮説 (H1): 「差がある(今回は、増えている)」という、証明したい立場。
2. 検定統計量の計算: 次に、データから現状を示す証拠となる数値、 検定統計量(今回はZ 値)を計算する。これは、観測された比率が基準からどれだけ離れているかを、標準化して示した値である。
3. 棄却域との比較による判定: そして、その Z 値を「棄却域」と呼ばれる領域と比較して判定を下す。
a. 棄却域とは、「もし帰無仮説が正しい(=変化がない)としたら、めったに起こらな
いはずの極端な結果が出る領域」のことである。この領域は、あらかじめ有意水準(今
回は 5%)によって定められる。
b. 棄却域の入り口を示す境界線の値が臨界値である。今回の物語では、Z=1.645 がその境
界線であった。
c. ワトソンが算出した Z 値(=1.97)は、この臨界値を超えて棄却域に入った。そのた
め、彼は「こんなことは偶然ではめったに起こらない」と判断し、帰無仮説を棄却(=
変化はなかった、という説を否定)したのである。
このように、比率の検定は、ビジネスの世界(例:新商品の支持率は目標の 40%に達したか)、医療研究(例:ある病気の発生率は過去のデータと比べて変化したか)、世論調査など、私たちの身の回りの様々な場面で、主観や印象に流されず、データに基づいた客観的な意思決定を行うために活用されている。