未分類

正規性の検定はなぜ必要か;連続/名義変数の組み合わせによる分析法のまとめ

★平均の比較は正規性を前提としているため。

■変数の種類
名義変数:基本的に0か1
連続変数:連続的な値

■正規分布
・左右対称の釣り鐘型の分布(連続変数の話)
平均と分散がわかれば再現できる
⇒正規分布同士の比較であれば、平均で比較すべき(パラメトリック検定)

・群のどれかが正規分布でなければ、平均で比較すべきでない
中央値で比較すべき
⇒用いる検定方法が違ってくる(ノンパラメトリック検定)

正規分布かどうか;Shapiro-Wilk検定(p<0.05なら正規分布でない)


■分析法まとめ
●分け方が名義変数、アウトカムが連続変数の場合

①1つの集団(1標本)での比較
パラメトリック:paired t検定
ノンパラメトリック:Wilcoxonの符号付順位検定

②2つの集団の比較
パラメトリック:等分散→t検定、不等分散→Welchの検定
ノンパラメトリック:Mann-Whitneyの検定
等分散性の検定=Levene検定(p<0.05なら不等分散)

●分け方、アウトカムとも連続変数の場合
③相関
パラメトリック:Pearsonの相関係数
ノンパラメトリック:順位相関係数
※順位=値を順位に変換して行うこと

●分け方、アウトカムとも名義変数の場合
④分割表の検定
・χ2検定
※20%以上のセルの期待値<5:Fisherの正確確率検定
(連続変数でないので、正規性は関係ない)

●3標本以上の差の比較
⑤分散分析
パラメトリック:等分散→1元配置分散分析(one-way ANOVA)、不等分散→Welchの検定
ノンパラメトリック:Kruskal-Wallis検定

参照 SPSSで学ぶ医療系データ解析

-未分類