人気ブログランキング | 話題のタグを見る
ブログトップ

EARLの医学ノート

drmagician.exblog.jp

敗血症をメインとした集中治療,感染症,呼吸器のノート.医療におけるAIについても

【AI】機械学習によるrTMが有効な敗血症性DIC患者の表現型を検出するモデルの作成

■近年,機械学習により,特定の治療介入が有用なサブグループを検出する研究が盛んであり,先日はこのブログでも,JSEPTIC-DICのデータセットで機械学習を行った上で,PMX-DHPが有用なパラメーターを抽出し,それをEUHRATESのデータセットで妥当性検証を行った論文の紹介と,機械学習によりどのようなアプローチを行ったのかを詳しく解説した[1].今回紹介するのは2021年と2022年に報告された2つの論文で,敗血症性DICに対する遺伝子組換えヒト可溶性トロンボモデュリン(以下rTM)が有効な患者を抽出するための機械学習の研究と,実臨床で使えるようにしたアプリケーションを検討した研究である.順に紹介・解説していく.
【論文1】敗血症における凝固表現型と遺伝子組換えヒトトロンボモデュリンの効果:3つの多施設観察研究の解析
Kudo D, Goto T, Uchimido R, et al. Coagulation phenotypes in sepsis and effects of recombinant human thrombomodulin: an analysis of three multicentre observational studies. Crit Care 2021; 25: 114
PMID: 33741010
https://doi.org/10.1186/s13054-021-03541-5

Abstract

【背景】最近の無作為化試験では,敗血症と凝固異常および臓器不全を持つ患者において遺伝子組換えトロンボモジュリンは利益をもたらさなかった.いくつかの最近の研究では,敗血症患者の臨床表現型の存在と異なる敗血症表現型間の治療効果の異質性が示唆されている.我々は,凝固異常を伴う敗血症の潜在的な表現型と,それぞれの表現型におけるトロンボモジュリン治療と28日および入院死亡率との関連性を検討した.

【方法】本研究は,日本で重症敗血症または敗血症性ショックのために集中治療室に入院した患者(年齢16歳以上)のデータを含む多施設レジストリの二次解析である.3つの多施設レジストリは,導出(2つのレジストリ)と検証(1つのレジストリ)のコホートに分けられた.表現型は,凝固マーカー,血小板数,プロトロンビン時間/国際標準化比,フィブリノゲン,フィブリノゲン/フィブリン分解産物(FDP),Dダイマー,および抗トロンビン活性を用いてk-means法により導出された.トロンボモジュリン治療と生存結果(28日および入院死亡率)との関連性は,一般化推定方程式を用いて導出されたクラスタ内で評価された.

【結果】導出コホートの3694人の患者から4つの敗血症表現型が導出された.クラスタdA(n=323)は,FDPとDダイマーのレベルが高く,重篤な臓器不全と高い死亡率を伴う重度の凝固異常を示した.クラスタdBは中等度の凝固異常を伴う重症を示した.クラスタdCおよびdDは,それぞれ凝固異常の有無に関わらず中等度および軽度の疾患を示した.トロンボモジュリンは,クラスタdA内でのみ,28日(調整リスク差[RD]:-17.8% [95%CI -28.7 to -6.9%])および入院(調整RD:-17.7% [95%CI -27.6 to -7.8%])死亡率が低下することと関連していた.検証コホートでの敗血症表現型は同様であり,トロンボモジュリン治療はまた,28日(RD:-24.9% [95%CI -49.1 to -0.7%])および入院死亡率(RD:-30.9% [95%CI -55.3 to -6.6%])の低下と関連していた.

【結論】我々は4つの凝固マーカーベースの敗血症表現型を特定した.トロンボモジュリンの治療効果は敗血症表現型によって異なった.この結果は,FDPとD-ダイマーが高い敗血症表現型を対象とするトロンボモジュリンの将来の試験を容易にする.
1.本研究で用いた機械学習アプローチ

■本研究では,JSEPTIC-DIC study[2],東北敗血症レジストリ[3]を導出コホートとして機械学習を行い,FORECAST[4]を検証コホートとしている.本研究では,敗血症患者のさまざまな凝固特性を表現する4つの表現型を識別するために,機械学習を行っている.方法としては,論文の以下の文章(和訳済)の通りである.
我々は,敗血症の表現型を抽出するために,基本的で広く使用されている機械学習に基づくクラスタリングアプローチであるユークリッド距離を用いたk-meansを適用した.その後,サブサンプリングによるサンプリング変動性を導入することでデータセット内の監視されていないクラスの数を見積もるとともに,定量的かつ視覚的に評価することで,最適なクラスタ数を決定した.コンセンサスクラスタリングでは,エルボウ法,累積分布関数,クラスター一致プロットを使用して,合意行列のヒートマップの分離を評価した.我々は,次元削減と高次元データセットの視覚化のためのt-Distributed Stochastic Neighbour Embedding(t-SNE)を使用して,クラスタリングを視覚的に評価した.また,我々は,クラスタの一貫性を確認するためのk-meansの代替として,分割的階層的クラスタリングアプローチを用いて表現型を導出した.クラスタの数は,デンドログラムとエルボウ法,ギャップ統計法を使用して決定した.
■これは順番に何をやっているか説明すると,以下の通りである.
①「k-means」[5]という方法を使って,データをいくつかのグループ(クラスタ)に分ける(データの中にあるパターンを見つけ出すための一般的な手法).この手法では,プロットされたデータ間の「距離」を計算し,それに基づいてデータをグループ化する.近いほど特性が似ているという判定になる.
②「サブサンプリング」という手法を使って,クラスタが偶然の産物ではないのかの確認とデータの中に潜在的にどれだけのクラスタが存在するかを推定している.これにより,データの中に隠れているパターンを見つけ出すことができる.
③「エルボウ法」「累積分布関数」「クラスター一致プロット」のいう3つの手法を使って,どれだけのクラスタにデータを分けるのが最適かを決定している.
④「t-SNE」という手法を使って,高次元のデータを視覚的に理解しやすい形に変換し,データのクラスタリングの結果を視覚的に評価することができるようにしている.
⑤「階層的クラスタリング」という,k-meansとは手法を使って,データのクラスタリングを再度行い,結果が一貫しているかを確認している.

■この,クラスタリングの方法としてk-meansクラスタリングについてもう少し詳しく触れておく.これは非階層型クラスタリングの一種であり,データセット内のデータポイントをk個のクラスタに分ける方法である.kは事前に指定され,各クラスタは中心(centroid)または平均(mean)に基づいて形成される.
k-meansクラスタリングの原理
1.初期のk個のクラスタ中心をランダムに選択する.
2.各データポイントを最も近いクラスタ中心に割り当てる.これにより,k個のクラスタが形成される.
3.各クラスタの平均値(または中心点)を計算し,新しいクラスタ中心とする.
4.再度,各データポイントを最も近い新しいクラスタ中心に割り当てる.
5.クラスタ中心の変動が一定の閾値以下になるか,もしくは指定した反復回数に達するまで,ステップ3と4を繰り返す.
■すなわち,空間内でデータポイント間の距離を最小化するようにクラスタを作成しているのである.これにより,各クラスタ内のデータポイントは同じクラスタ内の他のデータポイントに対して比較的近い(すなわち似ている)ことになる.本研究では,k-meansクラスタリングによって,敗血症患者の様々な凝固特性を表現する4つの表現型を識別するために使われている.そして,それぞれのクラスター(表現型)に対してrhTM治療の有効性を評価している.なお,k-meansの弱点には以下のようなものがある.
k-meansの弱点と本研究での対応
初期値依存性:ランダムに初期のクラスタ中心(centroid)を選ぶため,初期値によっては最適なクラスタリングが得られないことがある.
クラスタの数を事前に決める必要がある:最初にクラスタの数kを設定する必要があり,これはデータにより適切なkが異なるため難しく,エルボー法などのヒューリスティックな手法が使われることが多い.
→本研究での対応方法:サブサンプリングを用いてデータセットからランダムにサンプルを選び,複数回のクラスタリングを行うことで,初期値の影響を減じている

クラスタの形状:k-meansは,クラスタを球状(あるいは円状)と仮定する.したがって,異なる形状のクラスタ(例えば楕円形)を適切に捉えることが難しい場合がある.
→本研究での対応方法:t-SNEを用いて高次元データを視覚化し,クラスタの形状を評価している.

ノイズと外れ値:k-meansはノイズや外れ値に敏感であり,それらの存在によってクラスタリングの結果が大きく変わることがある.
→本研究での対応方法:エルボウ法,累積分布関数,クラスター一致プロットを用いて,クラスタの一貫性と分離度を評価している.
■さらに,一貫性の確認のため,k-meansとは別の手法である階層的クラスタリングも行っている.これは,最初に全てのデータ点を個別のクラスタとして扱い,次第に似たクラスタを組み合わせていくものである.このやり方も当然ながら弱点があることには注意が必要である.
階層的クラスタリングの弱点
計算量:階層的クラスタリングは全てのデータポイント間の距離を計算する必要があるため,大規模なデータセットに対しては計算量が大きくなる.

データ点の移動:一度クラスタが決定された後は,データ点が別のクラスタに移動することはない.これにより,一部の異常値によって全体のクラスタリングが影響を受ける可能性がある.

クラスタ数の選択:適切なクラスタ数を選択するにはデンドログラムを解釈する必要があり,これはしばしば主観的な判断に依存する
■このように,様々な手法を組わせて評価することでクラスタリング結果の妥当性を補完している.

2.本研究の結果

■本研究では,表現型化のために,ICU入院時に凝固マーカーとして,血小板数,PT-INR,フィブリノゲン,FDP,D-ダイマー,AT活性を計測している.最終的に導出コホートから4つの表現型(dA,dB,dC,dD)にクラスタリングされた.また,検証コホートでは凝固マーカーを用いてクラスタリングを行い,導出コホートのクラスタリングと類似した特性をもつ4つの表現型(vA,vB,vC,vD)にクラスタリングされた.t-SNEによるプロットと各クラスターの特徴は以下の通りである(SOFAスコアについてはAdditional File2のTable.S1に提示されているが,導出コホート全体が9.0なのに対して各クラスタはすべて1.0になっており,記載ミスと思われるため表には含めていない).
【AI】機械学習によるrTMが有効な敗血症性DIC患者の表現型を検出するモデルの作成_e0255123_17042941.png
【AI】機械学習によるrTMが有効な敗血症性DIC患者の表現型を検出するモデルの作成_e0255123_17071173.png
【AI】機械学習によるrTMが有効な敗血症性DIC患者の表現型を検出するモデルの作成_e0255123_17073178.png
■導出コホートではクラスタdA(aRD -17.8; 95%CI -28.7 to -6.9),検証コホートではクラスタvA(aRD -24.9; 95%CI -49.1 to -0.7)がrTMによる死亡リスクの有意な減少を示しており,他のクラスタでは有意差がみられなかった.よって,rTMは,低い血小板数,極度に高いFDPとD-ダイマー値,重度の臓器不全を特徴とする重度の凝固異常を持つ表現型のみで死亡リスク低下が得られたとしている.凝固異常の重症度は,DICを診断するための国際血栓止血学会(ISTH)のISTH-DICスコアや日本救急医学会のDICスコアなどのスコアリングシステムによって定義されてきた.これらのシステムと機械学習に基づくクラスタリングの違いは明確なカットオフの使用有無である.今回の研究結果では,各表現型クラスタが他のクラスタと重なる明確なカットオフはなく,様々なISTH DICスコアを持つ患者を含んでいることを示している(Additional File2のTable.S1参照).これは,機械学習に基づくクラスタリングが従来のスコアリングシステムを使用しても特定できない新たな表現型を検出できることを示唆している.

3.実臨床で使用可能なウェブベースのアプリケーションの作成

■rTMが有効な表現型を機械学習モデルで検出できたが,このモデルはこのままでは実臨床に使いづらい.そこで,モデルをウェブベースのアプリケーションとして実装する研究が行われ,Crit Careにpublishされた.
【論文2】ウェブベースのアプリケーションを用いた,敗血症患者に対する遺伝子組換えヒトトロンボモジュリン療法の潜在的なターゲット表現型の予測:3つの多施設レジストリの分析
Goto T, Kudo D, Uchimido R, et al. Web-based application for predicting the potential target phenotype for recombinant human thrombomodulin therapy in patients with sepsis: analysis of three multicentre registries. Crit Care 2022; 26: 145
PMID: 35590381
https://doi.org/10.1186/s13054-022-04020-1

Abstract

【背景】最近の無作為化比較試験では,遺伝子組換えヒトトロンボモジュリン(rhTM)が敗血症に対する有益な効果を示すことはできなかった.しかし,研究対象の多様性により,rhTMの敗血症への効果にはまだ議論がある.我々は以前,rhTM療法の潜在的なターゲットとなる特異的な表現型を持つ患者を特定した(rhTMターゲット表現型).しかし,臨床現場での適用には,このターゲットを特定するための簡便なツールが必要である.そこで,我々は3つの多施設敗血症レジストリを使用して,以前に我々が特定したrhTM療法のターゲット表現型の存在を予測する機械学習モデルを開発し,検証することを目的とした.

【方法】予測因子は,血小板数,PT-INR,フィブリノゲン,フィブリノゲン/フィブリン分解産物,D-ダイマーであった.また,モデルをウェブベースのアプリケーションとして実装した.3つのレジストリのうち2つはモデル作成(n=3694)に使用され,残りの1つは検証(n=1184)に使用された.

【結果】各コホートで約8-9%の患者がrhTMターゲット表現型を持っていた.検証では,開発されたモデルのrhTMターゲット表現型を予測するためのC統計量は0.996(95%CI 0.993-0.998),感度は0.991,特異度は0.967であった.検証群(n = 142)で潜在的なターゲット表現型を持つと予測された患者(予測されたターゲット患者)の中で,rhTMの使用は院内死亡率を低下させることと関連していた(調整リスク差 -31.3% [-53.5 to -9.1%]).
※筆者注釈:C統計値はROC曲線下面積のこと

【結論】開発されたモデルは,rhTMターゲット表現型を正確に予測することができた.ウェブベースのアプリケーションとして利用可能なこのモデルは,rhTMの治療効果とそのメカニズムの多様性を研究する臨床医や研究者にとって大いに利益をもたらすことができる.
■この研究での方法の肝は以下の部分である(和訳済み).
モデル開発のため,我々は導出コホートを訓練セット(全サンプルの70%をランダムに選択し,モデル開発とハイパーパラメーターのチューニングのために使用)とテストセット(全サンプルの30%をランダムに選択し,内部検証のために使用)に分けた.訓練セットを使用して,対数変換された予測因子を用いて,XGBoostを用いて予測モデルを構築した.我々は10分割交差検証を用いて最良のハイパーパラメーターの組み合わせを識別するために,グリッド検索戦略をrangerとcaretパッケージを用いて使用した.
この研究では,論文1で判明したクラスタ(dA)の表現型をrTMターゲット表現型として,この表現型を予測するモデルを作成している.まず,導出コホートをランダムに選択した70%のグループと残り30%のグループに分け,前者をモデル開発とハイパーパラメーターのチューニングのために使用する訓練セット,後者をモデルの性能を評価するためのテストセットにしている.そして,機械学習としてXGBoostという手法を用いている.

■XGBoostは"Extreme Gradient Boosting"の略で,機械学習のアルゴリズムの一つである.これは「勾配ブースティング」という方法を最適化したもので,複数の「弱い学習機」(単体ではそれほど強力ではない予測モデル)に順番に学習させ,以前のモデルでの予測誤差を減らすように新たなモデルを学習する.このような連続的な学習と改善の過程により予測能力が高い「強い学習機」を作るという考え方に基づいている.

■簡単な例で説明すると,例えばクイズ大会で優勝しようとしていて,個々のクイズを解く能力が一定レベル程度のたくさんの友人がいたとする.しかし,それぞれの友人は特定のジャンルに対してはとても強い能力を持っている.ある友人は歴史の問題に強く,別の友人は芸能の問題に強い,といった具合である.となれば,一人で参加するよりも,多くの友人をチームに組み入れてそれぞれの強みを活かす方が全体としてのパフォーマンスは高くなる.XGBoostはまさにこのような考え方で動作する.個々の弱い学習機(友人)が予測を行い,その結果を組み合わせてより強力な最終的な予測(クイズの答え)を得る.そして,それぞれの弱い学習機がどれだけ貢献するか(どれだけクイズを解くのが得意か)を計算するために,「勾配ブースティング」という手法を使う.これは誤りを正すための手法で,予測が間違っていたときに,それを正すように次の弱い学習機を調整する.これを何度も繰り返すことで,最終的に全体として強力な予測モデルを作り出す.

■さらに,モデルの性能を評価するため,10分割交差検証を行っており,これは訓練データを10等分し,そのうちの9つを訓練用に,残りの1つをテスト用に使う.これを10回繰り返し,各回で異なるテストセットを使用して,その結果を平均してモデルの一般化性能を評価する.その際に,機械学習モデルがデータをどのように学習するかを決める設定値であるハイパーパラメータの最適な組み合わせを見つけるためグリッド検索を行っている.

■これらによって作成されたモデルは検証コホートにおいても高精度にrTMターゲット表現型を検出した(C統計値0.996,感度0.991,特異度0.967,陽性的中率0.754,陰性的中率0.999).以下は,このrTMターゲット表現型かどうかを簡単に判別できるウェブ上のアプリケーションであり,スマートフォンからも操作可能である.
敗血症患者における遺伝子組換えヒトトロンボモデュリン治療のターゲット表現型の予測
http://research-kudo-prediction.s3-website-ap-northeast-1.amazonaws.com/
【AI】機械学習によるrTMが有効な敗血症性DIC患者の表現型を検出するモデルの作成_e0255123_17004672.png

[1] EARLの医学ノート管理人.【AI】PMXが有用な敗血症患者特性の機械学習による抽出.EARLの医学ノート 2023年6月23日(https://drmagician.exblog.jp/30356470/)
[2] Hayakawa M, Yamakawa K, Saito S, et al. Nationwide registry of sepsis patients in Japan focused on disseminated intravascular coagulation 2011–2013. Sci Data 2018; 5: 180243(PMID: 30531950)
[3] Kudo D, Kushimoto S, Miyagawa N, et al. The impact of organ dysfunctions on mortality in patients with severe sepsis: a multicenter prospective observational study. J Crit Care 2018; 45: 178–83(PMID: 29549747)
[4] Abe T, Ogura H, Shiraishi A, et al; JAAM FORECAST group. Characteristics, management, and in-hospital mortality among patients with severe sepsis in intensive care units in Japan: the FORECAST study. Crit Care 2018; 22: 322(PMID: 30466493)
[5] Steinley D. K-means clustering: a half-century synthesis. Br J Math Stat Psychol 2006; 59: 1–34(PMID: 16709277)
by DrMagicianEARL | 2023-07-05 17:14 | 敗血症性DIC

by DrMagicianEARL