★期待値からどれだけ離れてるか,統計で考える.

分割表の分布に関連があるかを調べたい.

 

喫煙あり

10

5

喫煙なし

10

15


■期待度数を求め,χ2値を計算する

 

喫煙あり

10

5

D

喫煙なし

10

15

C

A

B

E


ここで,
 ●「女,喫煙なし」の期待度数=B×C÷E(=20×25÷40=12.5)
χ2は,
   「(実際値-期待度数)2÷期待度数」 の和
    ex. 女,喫煙なし→(15-12.5)2÷12.5
   ⇒4つのカラムで計算,全て足すとχ2値=2

●中の数字をいろいろ変え,χ2値とそれが出る確率をグラフにした
χ2分布
 …これは,自由度により形が異なる
  ※自由度=表の(横の項目数-1)×(縦の項目数-1)
   →上の例だと,(2-1)×(2-1)=1


※縦軸=確率,横軸=χ2
χ2値をプロットして作っているので,χ2分布は連続なグラフでないことが重要.

χ2値が大きい所=珍しい
危険率(α,0.05%など)で範囲が定められる
 …例えば,自由度1でα=p=0.05⇒χ2値=3.84(片側検定.カイ2乗分布表を見ればわかる
 ⇒上の例でχ2値=2より,3.84より近い
  =p>0.05となり,有意差なし
  ⇒男と女の喫煙率には有意差なし,となる
 

参照 SPSSで学ぶ医療系データ解析,http://staff.aist.go.jp/t.ihara/chi2.html