人気ブログランキング | 話題のタグを見る
ブログトップ

EARLの医学ノート

drmagician.exblog.jp

敗血症をメインとした集中治療,感染症,呼吸器のノート.医療におけるAIについても

【AI】PMXが有用な敗血症患者特性の機械学習による抽出

■近年,機械学習により,特定の治療介入が有用なサブグループを検出する研究が人気である.日本の救急集中治療領域でも,多施設大規模コホート研究であるJSEPTIC-DICのデータセットを用いた機械学習アプローチの論文が出始めている.今回紹介するのは,Crit Care誌に6月21日にpublishされた,JSEPTIC-DIC[1]のデータセットで機械学習を行った上で,それをEUHRATES[2]のデータセットで妥当性検証を行った論文である.この機械学習では,PT-INR>1.4または乳酸>3 mmol/Lの患者がPMX-HAの有益性を享受しやすいという結果であった.以下にAbstractとその解説を掲載した.今後も機会学習の論文は増えていくが,機械学習といえども前提条件を踏まえなければ質は落ちる.その手法と強み&弱みを知っておかないと論文の解釈も難しくなるため,機械学習について知っておくに越したことはないだろう。
敗血症患者におけるポリミキシンB血液吸着を用いた標的治療:JSEPTIC-DIC研究とEUPHRATES試験の事後解析
Osawa I, Goto T, Kudo D, et al. Targeted therapy using polymyxin B hemadsorption in patients with sepsis: a post-hoc analysis of the JSEPTIC-DIC study and the EUPHRATES trial. Crit Care 2023; 27: 245
PMID: 37344804
https://doi.org/10.1186/s13054-023-04533-3

Abstract

【背景】ポリミキシンB血液吸着(PMX-HA)は血液中のエンドトキシンレベルを減少させるが,PMX-HAから利益を得る可能性のある敗血症患者の特性はよく知られていない.PMX-HAから利益を得る可能性のある患者のサブグループを特定することを目的とした.

【方法】日本の後ろ向き観察研究(JSEPTIC-DIC研究)から敗血症患者1911例と,エンドトキシン活性が高い患者に限定した北米の無作為化比較試験(EUPHRATES試験)から敗血症性ショック患者286人を後方視的に特定した.潜在的な交絡因子を調整した後,PMX-HAの28日生存に対する治療効果の異質性を調査し,PMX-HA使用の最善の基準を確認するために,JSEPTIC-DICコホートに機械学習ベースにCausal Forestモデルを適用した.PMX-HAによる標的治療のための導出基準はEUPHRATES試験のコホートを用いて検証された.

【結果】Causal ForestモデルはPMX-HAの治療効果の異質性を明らかにした.治療効果が高い患者は,重度の凝固異常と高乳酸血症を持つ可能性が高いため,PMX-HAの潜在的な治療対象をPT-INR>1.4または乳酸>3 mmol/Lの患者として特定した.EUPHRATES試験のコホートでは,標的としたサブ集団(全患者の75%)において,PMX-HAの使用は28日生存率が高いことと有意に関連していた(PMX-HA群 vs 対照群 68% vs 52%;PMX-HAの治療効果 16% [95%CI +2.2% to +30%], p=0.02).

【結論】エンドトキシン活性が高い敗血症患者における凝固異常と高乳酸血症は,PMX-HAから最も利益を得る可能性のある患者を特定するのに役立つ可能性がある.我々の知見は,凝固異常と高乳酸血症を持つ患者を対象とした将来の介入試験の登録基準を決定するのに有用であろう.
1.機械学習による有用性の高いサブグループ抽出

■特定の医療介入がどのような患者に有用であるかについては,従来から多変量解析やサブグループ解析などが用いられてきた.一方,近年は機械学習を用いたサブグループ解析が流行ってきている.これらの違いは,データの探索的な分析とモデルの複雑さにある.
探索的な分析:機械学習は,データからパターンを見つけ出すための強力なツールであり,人工知能(AI)の一分野である.これは特に大量のデータと多数の特徴(変数)がある場合に有用である.これに対して,従来の多変量解析やサブグループ解析では,事前に特定の仮説を立て,その仮説を検証する.つまり,機械学習はより探索的なアプローチを可能にし,データから新たな知見を引き出すことができる.

モデルの複雑さ:機械学習は非線形の関係や高次元の相互作用を捉えることができる.これに対して,伝統的な多変量解析では,通常は線形の関係を仮定し,特定の相互作用項を明示的にモデルに含める必要がある.また,従来のサブグループ解析では,特定の変数(または変数の組み合わせ)に基づいて患者をグループに分け,各グループでの治療効果を比較する.しかし,これは通常,事前に定義されたサブグループに対して行われ,多数の変数や複雑な相互作用を考慮することは困難である.
■このように,機械学習を用いる方法は,より探索的かつ複雑なパターンをとらえることが可能である.しかしながら,この機械学習には以下に示す過学習(overfitting)た解釈の難しさなどの課題も抱えている.また,検出されたパターンが因果関係を示すものであるかを確認するための追加の研究や検証も必要となる.

過学習:機械学習モデルが訓練データに対して過度に適合し,新しいデータに対する予測性能が低下する現象である.つまり,モデルが訓練データのランダムなノイズまで学習してしまい,その結果,訓練データに対する精度は非常に高いものの,未知のデータ(パターンの妥当性を検討するテストデータ)に対する精度は低くなるという問題が発生する.これは特に,モデルが複雑であるほど(例えば,多くの特徴を持つデータを使用する,深いニューラルネットワークを使用するなど),または訓練データが少ない場合に起こりやすい.

解釈の難しさ:特に「ブラックボックス」モデルと呼ばれる一部の機械学習モデル(深層学習やランダムフォレストなど)に関連している.これらのモデルは,高い予測性能を持つ一方で,その予測がどのように行われているのか,どの特徴が予測に重要であるのかを理解することが難しいという問題を有する.これは,特に医療やその他の高度に規制された分野で問題となる.なぜなら,予測の根拠を明確に説明することが求められるからである.この問題に対処するために,近年では「説明可能なAI」(Explainable AI)という分野が注目を集めており,モデルの予測を解釈可能な形で説明する方法が研究されている.
2.本研究で用いられたCausal Forestとは?

■Causal Forest[3]は統計学と機械学習の手法を組み合わせたもので,特定の因果関係を明らかにするために使用され,経済学分野で発展してきた.もともとは機械学習の手法は,複数の属性情報から結果を予測するために活用されてきたが,近年は結果の予測だけでなく因果推論にも活用する研究が盛んになっている.

■Causal Forestの基本的な考え方は,Random Forestという一般的な機械学習手法を利用して因果関係を推定することである.Random Forestは,多数の決定木(データを分類するためのモデル)を組み合わせて,より正確な予測を行う手法である.これらの決定木は,データの異なる部分集合と特徴を使用して構築され,その結果は平均化されて最終的な予測を提供する.

■決定木とは,質問を繰り返して答えを導き出すという,一連の「もし〜ならば」のルールを表現したものである.例えば,ある人が肺炎かどうかを判断するための決定木を考えてみる.最初の質問は「熱があるか?」で,その答えによって次に進む道が変わる.熱があるなら,「咳はするか?」という次の質問に進み,そこでもまた「はい」か「いいえ」で次に進む道が変わる.このように,質問(あるいは検査)の答えによって進む道が分岐していき,最終的に「肺炎に罹患している」と判断するか「肺炎に罹患していない」と判断するかが決まる.

■Random Forestは,このような決定木をたくさん作り,それぞれの決定木から得られた結果を集めて最終的な答えを出す手法である.各決定木は,データの一部をランダムに選んで学習し,それぞれ異なる視点から問題を見ることでより全体的な視野を持つことができる.そして,それぞれの決定木が出した答えを集計することで,全体として最も良い答えを出すことができる.Causal Forestは,このRandom Forestの考え方を利用しつつ,ただ単に予測を行うだけでなく,「ある治療が効果があるかどうか?」という因果関係を推定する.

■Causal Forestを使用する際には注意が必要であり,データが特定の統計的性質(例えば無作為化されたデータなど)を持つ場合にのみ正確な因果効果を推定することができる.また,Causal Forestが提供する結果はあくまで推定値であり,真の因果関係を完全に確定するものではない.したがって,Causal Forestの結果を解釈する際には,これらの制限を理解した上で,他のエビデンスと組み合わせて考慮することが重要である.

■なお,Causal ForestはOpenAI社の大規模言語モデルを用いた対話型AIであるChatGPTによってかなり行いやすくなった.具体的には,月$20の有料会員(ChatGPT Plus会員)で利用できるGPT-4のプラグイン機能で,Noteableプラグインを使用すれば,ChatGPT上だけで可能である.やり方としては,Noteableプラグインで新しいNotebook作成を指示し,データセットを読み込ませれば,あとはChatGPTがPythonのライブラリであるeconmlやgrfを勝手に使用してくれるため,Causal Forestを実装することができる.Noteableプラグインについては以下も参照されたい.
【AI】医学/医療でChatGPTのNoteableプラグインを使いこなすべし
https://drmagician.exblog.jp/30333493/
3.本研究の妥当性

■本研究で用いたコホートであるJSEPTIC-DIC,EUPHRATESについては以下を参照.
【文献】遺伝子組み換えトロンボモデュリンは敗血症性DICの死亡率を改善する(JSEPTIC-DIC study)
https://drmagician.exblog.jp/24205718/
【RCT+レビュー】敗血症性ショックに対するPMX-DHPは有効か?EUPHRATESの結果を踏まえて
https://drmagician.exblog.jp/27590255/
■Causal ForestはRCTのデータだけでなく,観察研究データにも適用することは可能である.しかし,観察研究データを使用する場合,以下に示すいくつかの重要な前提が必要となる.
交絡因子の制御:観察研究データでは,治療と結果の間に交絡因子が存在する可能性がある.これらの交絡因子は,治療と結果の両方に影響を与え,因果関係の推定を歪める可能性がある.Causal Forestは,これらの交絡因子を制御するために使用される.

共変量のバランス:Causal Forestは,共変量のバランスを前提としている.これは,介入群と対照群の間で共変量の分布が類似していることを意味する.この前提が満たされない場合,Causal Forestの推定結果はバイアスを含む可能性がある.

無視可能性(Ignorability):これは,共変量が与えられた場合,介入の割り当ては結果に対して無視可能であるという前提である.つまり,共変量を制御した後,介入はランダムに割り当てられると仮定する.例えば、ある薬剤の効果を評価するために,患者背景の情報(共変量)を考慮に入れて,新薬を投与するかどうかを決定する.このとき,「無視可能性」の前提が満たされているとは,これらの共変量をすべて考慮に入れた上で,薬剤の投与はランダムに行われ,その転帰は薬剤の投与だけによって決まる,ということを意味する.
■本研究では,JSEPTIC-DICのデータセットで多くの共変量を考慮に入れている.これらの共変量は,PMX-HAの効果と患者の生存率に影響を与える可能性があるため,これらを制御することで交絡を緩和することができる.また,PMX-HAを受けた患者と受けていない患者の間で共変量の分布を比較している.その際,Causal Forestの結果を用いて逆確率重み付け(Inverse Probability Weighting, IPW)を行っている.IPWは,観察研究における選択バイアスを制御するための手法で,各患者の介入を受ける「傾向」である傾向スコア(propensity score)を用いて,データに重みを付けをする.これにより,介入群と対照群の間の選択バイアスを軽減しており,共変量のバランスを適切に達成できている可能性は高い(ただし重みの極端値の問題は残る).無視可能性については,観察研究では検証が難しいが,執筆者らは,PMX-HAの使用が共変量によってのみ決定され,その他の観察されていない因子によっては決定されないと仮定している.しかし,この仮定が完全に満たされているかどうかを確認することは困難である.このように,観察研究データを機械学習する上での限界は存在している.

■本研究ではPMX-HAの最適な対象としてPT-INR>1.4または乳酸>3mmol/Lをパターンとして特定し,妥当性検証であるEUPHRATESコホートでPMX-HAによる有意な死亡改善効果を示している.このパターンでは当然ながら重症度が高まることが想定される.Additional Fileで,EUPHRATESコホートのPMX-HA施行群と,妥当性コホートとしてのPMX-HAターゲット群の患者背景を比較すると,妥当性コホートでは腹腔内感染が減少していた(26% vs 18%).また,各種重症度スコアやEAAは以外にもほぼ不変であるにもかかわらず,28日死亡率は30% vs 40%で,妥当性コホートの方が高いという結果であった.これまでの知見でも疑問はもたれているが,はたしてEAAの値は本当に予後に関連するのであろうか?加えて,今回の研究で学習データセットとなったJSEPTIC-DICコホートはEAAを測定していない.EAA≥0.6に限定されたEUPHRATESコホートでの検証は妥当なのかという疑問もある(EAAが交絡因子にならないなら問題はないが・・・).

■なお,EUPHRATESでは,事前規定されていないpost hoc解析[4]でEAA値0.6-0.89の範囲の患者において,28日死亡率が有意に改善していて,この恣意的な患者選択の結果をもとにTIGRIS trial[5]が組まれ,現在進行中である(これは正直言ってなかなか無理があるRCTのやり方で,筆者は死亡率改善効果が示せるとは思っていない).

■加えて,JSEPTIC-DICコホートは遺伝子組み換えトロンボモデュリンやアンチトロンビン製剤をかなりの割合で使用している.EUPHRATESコホートで検証はしているので懸念はそこまで大きくはないと思われるが,機械学習の際に影響は出ている可能性がある.

[1] Hayakawa M, Yamakawa K, Saito S, et al. Nationwide registry of sepsis patients in Japan focused on disseminated intravascular coagulation 2011–2013. Sci Data 2018; 5: 180243
[2] Dellinger RP, Bagshaw SM, Antonelli M, et al. Effect of targeted polymyxin B hemoperfusion on 28-day mortality in patients with septic shock and elevated endotoxin level: the EUPHRATES randomized clinical trial. JAMA 2018; 320: 1455–6
[3] Wager S, Athey S. Estimation and inference of heterogeneous treatment effects using random forests. J Am Stat Assoc 2018; 113: 1228-42
[4] Klein DJ, Foster D, Walker PM, et al. Polymyxin B hemoperfusion in endotoxemic septic shock patients without extreme endotoxemia: a post hoc analysis of the EUPHRATES trial. Intensive Care Med 2018; 44: 2205-12
[5] Safety and Efficacy of Polymyxin B Hemoperfusion (PMX) for Endotoxemic Septic Shock in a Randomized, Open-Label Study (TIGRIS). ClinicalTrialsGov.NCT03901807

by DrMagicianEARL | 2023-06-23 07:03 | 敗血症

by DrMagicianEARL