検定とは
検定とは、立てた仮説の有意性を判定するものである。まずは、実験の結果などから自然的・社会的な現象に関する法則の仮説を立てる。ここで立てた仮説と実験の結果などのデータの間にはズレが生じるものであるが、このズレが誤差として認められるものか、誤差以上の意味があるものかを判断するのである。後者の場合を仮説からのズレは有意であるといい、仮説は棄却されることになる。検定においては、この仮説は棄却されることが前提とされている。いわば背理法のようなものである。そのため、検定における仮説は帰無仮説と呼ばれる。仮説が棄却されなかったとしても積極的に支持されるわけではなく、標本が帰無仮説と矛盾しない程度のことが言われただけであることに注意が必要である。
帰無仮説を棄却するか否かの判定の際には、誤差がどの程度稀少であるかを判断する。この稀少性を判断する水準が、有意水準と呼ばれるものである。標本を標本の確率分布から見ることで、その標本が得られる確率を得ることができる。これが有意水準以下であれば、標本が得られる確率は稀少であり、帰無仮説は誤っていると判断されて棄却される。反対に、これが有意水準以上であれば、標本が得られる確率が稀少であるとは言えず、帰無仮説を棄却することはできない。この有意水準はαで表わされ、一般的に5%に設定される。
比率の検定
今回は、比率の検定について考える。これは、母集団の分布が正規分布かどうか分からない区手も、標本が近似的に正規分布に従うことを想定することで行える検定である。標本が近似的に正規分布に従うことは、中心極限定理から説明できる。中心極限定理は、標本の和の確率分布について、標本が十分に大きい場合には正規分布であると考えることができるという定理である。比率の検定では、標準化変数Zが、
と求められる。標準化変数は、あらゆる確率変数を同じ指標(標準正規分布表など)で扱えるように変換したものであり、一般に
で表わされる。ここで、比率の検定を考える際はこのデータが二項分布に従うことを踏まえると、
で求められる。また、中心極限定理から考えることから、標本の値は標本の和として考える必要があるから、
をXに当てはめる。以上を考えると、
となる。右辺の分子分母をnで割ることで、
となり、①式が導かれた。
本拠地開催の有利性
比率の検定を用いて、「プロ野球の勝率は本拠地の方が高い」という仮説を考える。プロ野球の試合は年に143試合あり、その半分が本拠地で、残りの半分が敵地で行われる。基本的には本拠地開催の試合の方がファンの数は多く、球場の雰囲気は本拠地開催側のチームに流されやすい。また、本拠地での試合数と敵地(同リーグ5球団)での試合数は5:1:1:1:1:1となるため、本拠地球場のグラウンドに慣れやすく、プレー面で有利であるともいえる。「プロ野球の勝率は本拠地でも敵地でも変わらない」という仮説を棄却することで、本拠地と敵地での勝ちやすさの違いについて考察したいと思う。ファンが熱狂的で、本拠地での試合に強いイメージがある埼玉西武ライオンズと、私自身がファンである北海道日本ハムファイターズの2球団について、2022年度シーズンの勝敗を用いて検定する。有意水準は5%とする。相対頻度について、埼玉西武ライオンズでは本拠地の勝敗は41勝29敗2分、北海道日本ハムファイターズでは34勝35敗3分であることから、
となる。標本数nについては、引き分けの試合を除いて、
となる。帰無仮説については、本拠地・敵地合わせた勝率を用いればよいから、埼玉西武ライオンズでは72勝68敗3分、北海道日本ハムファイターズでは59勝81敗3分であることから、
となる。以上を用いて各球団についての標準化変数を求めると、
となった。正規分布表より、Z0.025=1.96であることから、ZL、ZFともに仮説は棄却されないという結果になり、本拠地で強いという印象は誤差の範囲内であることが分かった。
本当の本拠地有利とは
本拠地で強いとはどういうことなのか探るために、2010年の中日ドラゴンズの結果についても検定する。私自身は知らなかったが、この年の中日ドラゴンズは強かったということを古参の中日ファンは繰り返し口にする。実際、本拠地での勝敗が53勝18敗1分であること、本拠地・敵地合わせた勝敗が79勝62敗3分であることから、
Z0.025=1.96を越えていることから、2010年の中日ドラゴンズは「プロ野球の勝率は敵地でも変わらない」という仮説を棄却できることが分かる。これほどに圧倒的な印象を残すほどでなければ、勝率が本拠地の方が高いとは言えないことに驚いた。
参考文献
・松原望, 統計学入門, 東京大学出版会, 1991
・統計WEB, 25-1.母比率の検定(https://bellcurve.jp/statistics/course/9488.html)
・NPB, シーズン成績(https://npb.jp/bis/2022/stats/std_p.html)