★期待値からどれだけ離れてるか,統計で考える.
■分割表の分布に関連があるかを調べたい.
|
男 |
女 |
喫煙あり |
10 |
5 |
喫煙なし |
10 |
15 |
■期待度数を求め,χ2値を計算する
|
男 |
女 |
計 |
喫煙あり |
10 |
5 |
D |
喫煙なし |
10 |
15 |
C |
計 |
A |
B |
E |
ここで,
●「女,喫煙なし」の期待度数=B×C÷E(=20×25÷40=12.5)
⇒χ2値は,
「(実際値-期待度数)2÷期待度数」 の和
ex. 女,喫煙なし→(15-12.5)2÷12.5
⇒4つのカラムで計算,全て足すとχ2値=2
●中の数字をいろいろ変え,χ2値とそれが出る確率をグラフにした
⇒χ2分布
…これは,自由度により形が異なる
※自由度=表の(横の項目数-1)×(縦の項目数-1)
→上の例だと,(2-1)×(2-1)=1
※縦軸=確率,横軸=χ2値
⇒χ2値をプロットして作っているので,χ2分布は連続なグラフでないことが重要.
●χ2値が大きい所=珍しい
⇒危険率(α,0.05%など)で範囲が定められる
…例えば,自由度1でα=p=0.05⇒χ2値=3.84(片側検定.カイ2乗分布表を見ればわかる)
⇒上の例でχ2値=2より,3.84より近い
=p>0.05となり,有意差なし
⇒男と女の喫煙率には有意差なし,となる
参照 SPSSで学ぶ医療系データ解析,http://staff.aist.go.jp/t.ihara/chi2.html