未分類

多変量解析の簡単な理論、やり方、結果の書き方/解釈

★統計ソフトで簡単にできるが、結果の解釈が大事。

■多変量解析の種類
重回帰分析アウトカム(従属変数)が連続変数の場合
多重ロジスティック回帰分析アウトカムが名義変数の場合
※因子(独立変数)は、連続変数でも名義変数でもよい
 …名義変数の0,1は、そのまま連続変数の数字として適用される(ダミー変数)


■独立変数の選び方

●何を解析するか、という視線が最も重要
基本的には解析者自らが選んで良い
⇒一般的な流れは、
「解析する因子を選ぶ→単変量解析で有意だったものを、多変量解析の因子とする」

多重共線性(マルチコ現象)に留意する
独立変数間に相関係数がほぼ1となるような変数がある(CreとeGFRなど)
 or 独立変数が標本と比較し多すぎる(一般的に標本数÷10程度までで、標本数÷30が理想)
⇒モデルの信頼性が悪くなるため、除いて解析する


■重回帰分析
●理論

・基本的に従属変数、独立変数とも正規分布に従うことが原則
⇒独立変数が非正規分布の場合、標本が十分大きければ、必要な変数を対数変換する

・用いる独立変数を選択する
=基本的にステップワイズ法;変数増加法、減少法、増減法など
 …基準(F=2, p=0.05など)に応じて逐次選択行われる
 ⇒変数増減法が良い(適切なモデルが作られる可能性が高い)
⇒結果をみて、変であれば強制投入法で構築し直す

※ステップワイズ法と比較し、総当たり法は計算時間が非常にかかるため、用いる事は少ない

●結果の判断

・最後に構築されたモデルでの確認事項
ANOVAでp<0.05であることを確認
 …帰無仮説:使用した独立変数で従属変数を説明できない、という設定となっている
 ⇒p≧0.05であると、そのモデルは使えない
②残った独立変数の標準偏回帰係数(β)が全てp<0.05となっていることを確認
 ⇒p≧0.05があるときは、その因子を除いて再解析する
 (事実からして残すべきと判断された場合は、その限りでない)
③重相関係数R>0.7, R^2>0.5であることを確認(よく適合したモデルである確認)
 (これより小さくても、極端に小さくなければ良い)
④分散インフレ係数(VIF)≧10となる因子がないことを確認
 …VIF≧10であるとマルチコ現象に関連する因子と考えられ、除いて再解析する
⑤Durbin-Watson比が2に近いことを確認
 =残差の異常がないことの証明
⑥残差の異常が大きかった症例(外れ値)の確認
 ⇒一例ずつ、何が原因だったかを確認
 ⇒必要であれば、除外して再解析

・これらをクリアした!
結果は、非標準化係数(B)、又は標準化係数(β)である
 …「y=ax1+bx2+・・・」のa, bなどの係数を表す(βは1に近い程影響力が大きい)
※SPSSではβの95%CIがでない事に注意
 結果を書く時は、「Bの値 [95%CI: ●-●], p=●」, 若しくは「βの値, p=●」とする

 
■多重(二項)ロジスティック回帰分析
●理論

・アウトカムが名義変数の場合の多変量解析
⇒基本的な注意事項は重回帰分析と同様
・結果はオッズ比が出ることが特徴

●結果の判断

尤度比検定のモデルχ2値で、モデルの有意性(p<0.05)を判断
 (重回帰分析のANOVAにあたる)
②残った変数の調整オッズ比が全てp<0.05であることを確認
 (重回帰分析のβにあたる)
Hosmer-Lemeshowの適合度検定
 ⇒p≧0.05であればよく適合したモデル(帰無仮説:よく適合したモデル)
 (重回帰分析のRにあたる)
④残差の解析
 ⇒Cock統計量が大きい、てこ比>0.5の時、外れ値の可能性あり
 ⇒除外することを検討

・これらをクリア!
⇒結果は、「OR [95%CI: ●-●], p=●」とする
 

参照 SPSSで学ぶ医療系データ解析 

-未分類