多変量解析の落とし穴 ~ランダム関数を用いたシミュレーション~
■生存,死亡という2つのアウトカムが存在する場合,これに関連する独立因子となる変数を検出するための重回帰はロジスティック回帰解析(logistic regression)である.今回,以下のシュミレーションを行った.
■EXCELで0から1までの数値をランダムにとりうる関数「=RAND()」を用い,患者数160例に対して20個の検査値(x1~x20)を想定したモデルを作成した.さらに,アウトカムとして,生存(=0),死亡(=1)を,0か1かをランダムにとりうる関数「=TRUNC(RAND()+0.5)」を定義した.この場合,死亡率50%モデルとなる.
■多変量解析を行うと以下のような結果であった.
■これらがランダム関数によるまったく関連のないシミュレーションデータをもとにした解析であることを知らなければ,非常によいデータであると勘違いしてしまうだろう.しかし,ランダム関数を用いているため,アウトカムと変数の間には関連性がないことは明らかである.つまり,これらの3つの変数が死亡に関連する独立危険因子であることは,p値が0.05を下回っていても単なる偶然に過ぎない.
■多変量解析において,変数を組み込むときに,まったく関連性がないものを組み込んでも偶然が生じる可能性があることが上記シミュレーションでも分かる.優れた解析に見える多変量解析といえども,使用する変数は解析者により恣意的に選ばれたものであることに注意が必要である.統計学的関連性は因果関係を保証するわけではなく,前提として,因果関係を示唆する根拠が必要である.
■近年は医療においてもpropensity score matching analysis(傾向スコアマッチング解析)が用いられるようになってきており,「観察研究,コホート研究をRCTっぽくする解析法」という触れ込みであたかもエビデンスレベルをかなり高めるかのように主張する人もいる.この解析は,各症例について,0から1までの傾向スコアを定めてペアをつくり,比較検討を行う解析であるが,これも多変量解析の1種であり,その変数選択は恣意的であることに十分注意が必要である.加えて,ペアマッチングを行う際にかなりの症例が脱落するため(集中治療領域の研究ではほとんどがN数が半数程度まで削られる),全集団のうち限られた層の評価しか行えない.逆に言えば,この層以外の集団においては,ここで得られたアウトカムがあてはまるとは限らない.
■2013年に重症急性膵炎への動注療法,敗血症へのPMX-DHPに関して,日本からDPCデータを用いた大規模なpropensity score matching analysisが報告され,いずれも死亡率を改善させなかったとしている.しかし,DPCデータはAPACHEIIやSOFAなどの重症度,検査値等の詳細は教えてくれない.ましてや病名のアップコーディングも多数含まれている可能性があり,解析に用いられた変数も恣意的となれば,まずあまり意味をなさない結果ではないかと思われる.