ブログトップ

EARLの医学ノート

drmagician.exblog.jp

敗血症をメインとした集中治療,感染症,呼吸器のノート.Stop Sepsis, Save Lives.

多変量解析の落とし穴 ~ランダム関数を用いたシミュレーション~

■特定の変数が生存・死亡といったアウトカムとどれくらい関連があるかを調べる研究は多い.その際,生存群と死亡群で各変数を有意差検定していく方法がある(単変量解析).しかし,アウトカムは複数の変数の影響を受ける場合が多々ある.複数の変数がどのようにアウトカムに影響するかを見出すためには,より巧妙な統計学的方法がデータ解析に必要となる.2つまたはそれ以上の独立変数を持つ回帰モデルを適合させる方法は,重回帰(multiple regression)と呼ばれ(多変量解析とも言う),いくつかの種類がある.学会や論文で多変量解析と聞くと何かすごそうで非常に正確な統計解析手技に感じるかもしれない.

■生存,死亡という2つのアウトカムが存在する場合,これに関連する独立因子となる変数を検出するための重回帰はロジスティック回帰解析(logistic regression)である.今回,以下のシュミレーションを行った.

■EXCELで0から1までの数値をランダムにとりうる関数「=RAND()」を用い,患者数160例に対して20個の検査値(x1~x20)を想定したモデルを作成した.さらに,アウトカムとして,生存(=0),死亡(=1)を,0か1かをランダムにとりうる関数「=TRUNC(RAND()+0.5)」を定義した.この場合,死亡率50%モデルとなる.

■多変量解析を行うと以下のような結果であった.
e0255123_23303164.png
■症例数は160例であるため,変数20個をすべて独立変数として扱うことはできない(過剰適合overfittingとなってしまうため).そこで,一般的に行われている,全変数からもっとも関連性が低い変数を逐次的に除外(ここではp値が大きいものから除外)していく変数減少法(backward stepwise selection)を用いて変数を絞る操作を行う.この場合,症例数をN,変数の個数をMとすると,N>40×Mが一般原則であるため,変数を3つまで絞った結果が以下の通りである.
e0255123_23294172.png
■この3つの変数x8,x13,x15はすべてp値が0.05未満であり,有意水準5%の慣例に従えば,すべて「死亡に関連した有意な独立危険因子」ということになる.

■これらがランダム関数によるまったく関連のないシミュレーションデータをもとにした解析であることを知らなければ,非常によいデータであると勘違いしてしまうだろう.しかし,ランダム関数を用いているため,アウトカムと変数の間には関連性がないことは明らかである.つまり,これらの3つの変数が死亡に関連する独立危険因子であることは,p値が0.05を下回っていても単なる偶然に過ぎない.

■多変量解析において,変数を組み込むときに,まったく関連性がないものを組み込んでも偶然が生じる可能性があることが上記シミュレーションでも分かる.優れた解析に見える多変量解析といえども,使用する変数は解析者により恣意的に選ばれたものであることに注意が必要である.統計学的関連性は因果関係を保証するわけではなく,前提として,因果関係を示唆する根拠が必要である.

■近年は医療においてもpropensity score matching analysis(傾向スコアマッチング解析)が用いられるようになってきており,「観察研究,コホート研究をRCTっぽくする解析法」という触れ込みであたかもエビデンスレベルをかなり高めるかのように主張する人もいる.この解析は,各症例について,0から1までの傾向スコアを定めてペアをつくり,比較検討を行う解析であるが,これも多変量解析の1種であり,その変数選択は恣意的であることに十分注意が必要である.加えて,ペアマッチングを行う際にかなりの症例が脱落するため(集中治療領域の研究ではほとんどがN数が半数程度まで削られる),全集団のうち限られた層の評価しか行えない.逆に言えば,この層以外の集団においては,ここで得られたアウトカムがあてはまるとは限らない.

■2013年に重症急性膵炎への動注療法,敗血症へのPMX-DHPに関して,日本からDPCデータを用いた大規模なpropensity score matching analysisが報告され,いずれも死亡率を改善させなかったとしている.しかし,DPCデータはAPACHEIIやSOFAなどの重症度,検査値等の詳細は教えてくれない.ましてや病名のアップコーディングも多数含まれている可能性があり,解析に用いられた変数も恣意的となれば,まずあまり意味をなさない結果ではないかと思われる.
[PR]
by DrMagicianEARL | 2014-03-10 00:00 | 論文読み方,統計 | Comments(0)

by DrMagicianEARL