人気ブログランキング | 話題のタグを見る
ブログトップ

EARLの医学ノート

drmagician.exblog.jp

敗血症をメインとした集中治療,感染症,呼吸器のノート.医療におけるAIについても

【お知らせ】ブログ『EARLの医学ノート』のnoteへの移転と今後の方向性

■このたび,本ブログの移転と方向性の変更を行うこととしました.今回はその内容の説明記事です.

■本ブログ自体は医師3年目の時から始めたもので,当時は自分の勉強した内容とそれに対する自分なりの意見をアップしていくことを目的とし,同時に勉強内容はその時の診療に直結するものを重点的に取り扱っており,院内スタッフも共有できるように誰でも閲覧可能なブログにしました.ところがブログが様々な方々の目に留まるようになってお声がけをいただき,講演や執筆,さらには日本版敗血症診療ガイドライン作成にも携わらせていただきました.ガイドライン作成時やコロナ禍では多忙を極めたため更新が滞っておりましたが,自分の仕事としても大きな転機を迎えたため,これを機にブログに関しても内容を大きく変えることにしました.以下に詳しく説明します.
-----

1.ブログの移転について

■これまで課金もしてexblogを使用してきましたが,どうも使い勝手の悪さを感じていたので,noteに変更することにしました.ただし,このexblogにはこれまでの多数の記事があるため,このexblog自体は閉鎖せず残します(レビュー記事の改訂についてはnoteの方に移行します).また,同時にブログ名を『EARLの医学・AIノート』に変更します.AIも追加したのは,2022年末のChatGPT登場以降,私はAIについて勉強しつつ,いかにして医学・医療に応用できるかを検討してきており,2025年からは本格的にAI事業立ち上げやAIスタートアップ企業のお手伝いを開始したからです(そのぶん臨床の仕事量を4割ほど減らしました).

■移転先のnoteは機能的に使いやすいと感じたため選びました.新しい移転先は以下の通りです.
EARLの医学・AIノート
https://note.com/drmagicianearl/n/n8714d72cf831

2.今後のブログの方向性について

■このブログは,インパクトがある論文をAbstract和訳とともに解説や過去の知見なども添えるなどして医学情報を発信してきました.しかしながら,2022年末のテキスト生成AIであるChatGPTの登場以降,医学情報の収集や学習は大きく変わりました.特に論文に関してはAIによる要約・解説の精度は急速に向上しました.これまで医師は多忙であることもあり,読める論文数は年間数十本程度が限度です.もちろん,1本の論文をしっかり読み込むことは大事ですが,限られた時間の中で知識を増やしていく上では効率性が必要です.同時に,医師以外の医療職種においても,AIは論文に触れるハードルを大幅に下げてくれました.同時に,重要な論文に関しては,今や日経メディカル系やm3.comをはじめ,多くのサイトが内容解説を行っている状況です.

■これらのことから,このブログはこれまでの「単一の論文を紹介・解説する」というスタイルは時代にそぐわないと考え,コンテンツを変更することにしました.コンテンツ構成を以下に述べます.
新しいブログのコンテンツ構成

1.エビデンスレビュー記事(メイン)
2.1週間の論文情報
3.非常にインパクトのある論文の紹介
4.新しいAIモデル/ツールやアップデートの紹介
5.AIの基本レクチャー
(1)エビデンスレビュー記事

■本ブログの主体にする予定です.もっともこれまでも書いてきたコンテンツでしたが,ミニレビュー程度ならまだしも,本格的なレビュー記事は数ヵ月かけて書いていました.しかし,AIの精度向上により,最も時間がかかる「Clinical Questionをもとにした検索と論文抽出の過程」にかかる時間が大幅に縮小され,効率化がはかれるフローの目途がたったため,エビデンスレビュー記事を主たるコンテンツに据えることにしました.

■既に,ChatGPT Deep Researchをそのままブログにはりつける,なんてことをしているブロガーも最近は見受けられますが,ChatGPT Deep Researchといえども弱点はあり,ハルシネーションも起こる上に,レポート内容が膨大で,内容理解/解釈とファクトチェックが大変です.ましてや,論文に至ってはフルオープンでない論文の詳細までは拾ってきてくれません.加えて,ブログ記事の書き方は私自身の癖や全体構造があるので,レポートを転用というやり方はやりません.

■これまでアップしてきたレビュー記事もそうですが,基本的に私が意識しているのは,雑誌Intensivistの昔のスタイルです(最近はずいぶんスタイルが変わったようですが).実際に筆者自身もIntensivistを3回執筆していますが,雑誌側から要求されるエビデンスレビューのレベルは半端ではありません.あれくらいのストイックなスタイルで発信していければと思います.

■同時に,効率化できたとはいえ,Intensivistレベルを目指すとなるとやはり単一論文紹介に比べればかなり労力はかかる上,他のコンテンツもあるため,申し訳ありませんが,noteのメンバーシップ機能を用いて月額500円のサブスクリプション制とします

(2)1週間の論文情報

■私がその週に目を通した(私個人の独断と偏見による)インパクトがあるなと感じた論文リストをアップします.1つ1つの紹介はX(旧Twitter)でほぼ毎日行っていますが,それの総まとめです.基本的に最新論文でかためますが,私自身が見落としていた重要論文も含めます.

(3)非常にインパクトのある論文の紹介

■これまで行ってきた単一論文の紹介はメインコンテンツではなくなりますが,非常にインパクトがある論文に関しては今後もその論文単一でとりあげていきます.

(4)新しいAIモデル/ツールやアップデートの紹介

■AIの進化はすさまじい速さで,かつそれに伴う情報量も膨大です.数日でも最新情報から目を離すと置いていかれるレベルのため,毎日最新情報をピックアップしなければなりません.しかし,その中には「ハズレ」情報が含まれたり,自分の環境では役に立たないものもあります.

■本ブログでは,これらの情報から医学・医療分野にも応用できそうな内容をピックアップします.また,AIの新たな情報については,過剰なまでのポジティブな情報が初期は蔓延し,ネガティブ情報は埋もれます.こういうのは俗称で「AI驚き屋」と呼ばれてる人達が発信するもので,最新情報感度は高いものの,情報粒度はかなり低いです.よって,このブログでピックアップするのは数日後で,「一歩引いて,内容や使用感,遅れて出てきた問題点も拾い上げて情報をまとめる」というスタイルでいきます.

(5)AIの基本レクチャー

■AIは普及が教育を置き去りにしている状況で,関連法規も全然整備されていない状況のため,AI活用のためのコツやセキュリティー上の問題を知らないまま使用している一般ユーザーが非常に多く,AIリテラシーが問題となりつつあります.また,AIをまだほとんど触っていない医療従事者も多く,昨今のAIの進化速度を考えると,日常的にAIを使用している人とそうでない人との差は後から頑張ってもなかなか埋まらなくなっていきます.

■一方で,AIを学ぼうにもWebや書店には有象無象のセミナーやレクチャー本があり,中には内容としてひどいものや間違っているものもありますし,AIの情報が1日単位でどんどん更新されていく以上,どのセミナーやレクチャー本を選べばいいのかはなかなか難しいです.

■そこで,このブログでは小手先のプロンプトテクニックの紹介だけなどというもはや古いやり方は扱わず,体系的に学べるまとめコンテンツを配信していきます.筆者自身はGoogle AI Essentialsなどの,その手の大手のセミナーを修了しています.もちろん基本を学ぶならそちらのセミナーを受講していただくのが一番いいので,そちらを受講してください.その上で,このブログは読み物としての一助となれば幸いです.

-----

■以上がこのブログの移転と今後の方向性についての説明です.コンテンツに関しては他にも細々としたものが増えるかもしれませんが,大枠は上記の通りです.月額500円のサブスク制となってはしまいますが,今後ともよろしく御願い申し上げます.
# by DrMagicianEARL | 2025-02-19 15:25
敗血症とサイトカインのかかわり
2011年10月26日作成
2025年2月6日改訂


■ 敗血症(sepsis)は,感染に対する宿主の全身性炎症反応が制御不能となり,臓器障害や敗血症性ショックを引き起こす疾患である[1].この病態において,サイトカインが中心的な役割を果たすことが明らかとなっている[2].敗血症では,感染に対する防御機構が過剰に活性化されると同時に,それを抑制しようとする免疫応答も働き,その結果,免疫システムのバランスが崩れる[3]

■ 微生物由来の分子パターン(PAMPs)は,自然免疫系の受容体であるトール様受容体(TLR)を介して炎症性サイトカインの放出を誘導する[4].この過程では,TNF-α,IL-1β,IL-6,IL-8などのプロ炎症性サイトカインが産生され,全身性炎症反応症候群(SIRS)を引き起こす[5].また,サイトカインストームと呼ばれる現象が発生し,過剰な免疫応答が組織損傷を引き起こす[6]

■ 炎症性サイトカインは血管透過性の亢進や凝固系の異常を引き起こし,最終的に多臓器不全(MODS)を誘発する[7].特に,IL-6の血中濃度は敗血症の重症度と相関し,その測定は診断および予後予測の指標となる可能性がある[8]

■ 炎症反応を抑制するために,宿主はIL-10やTGF-βなどの抗炎症性サイトカインを分泌し,免疫応答の制御を試みる[9].しかし,これらの抗炎症性サイトカインの過剰な活性化は,免疫麻痺(immune paralysis)を引き起こし,二次感染や遷延する敗血症のリスクを高める[10].このように,炎症性サイトカインと抗炎症性サイトカインのバランスが,敗血症の病態進展において極めて重要な要因となる[11]

■従来,敗血症はSIRSとその後のCARS(compensatory anti-inflammatory response syndrome)の二相性モデルで説明されてきたが,最近の研究では,炎症と免疫抑制が同時に進行する可能性が示唆されている[12].実際,敗血症患者の遺伝子発現解析では,炎症性サイトカインと抗炎症性サイトカインの両者が高発現していることが確認されている[13]

■免疫抑制の一因として,T細胞の疲弊(T cell exhaustion)が指摘されている[14].敗血症では,T細胞の機能が低下し,PD-1やCTLA-4などの免疫抑制分子の発現が亢進することが知られている[15].これにより,感染防御が低下し,敗血症患者の死亡率の上昇に寄与する可能性がある[16]

■さらに,ミトコンドリア機能障害と炎症応答の関連が近年の研究で注目されている[17].ミトコンドリアの異常が炎症性サイトカインの過剰産生を引き起こし,敗血症の病態を悪化させることが示唆されている[18].特に,転写因子ATF4の活性化がIL-6の異常産生を促進する機序が解明されつつある[19]

■これらの知見を踏まえ,敗血症の治療戦略は単一のサイトカインを標的とするものではなく,免疫応答全体のバランスを考慮したアプローチが求められている[20].例えば,PD-1阻害剤やミトコンドリア保護薬の研究が進行中であり,これらが新たな治療法として期待されている[21]

■結論として,敗血症におけるサイトカインネットワークは極めて複雑であり,その動的な制御が病態の鍵を握る.炎症と免疫抑制のバランスが病態進展を決定づけるため,個々の患者の免疫プロファイルを評価し,適切な治療を選択する精密医療的アプローチが今後の研究課題となる[22]

[1] Bone RC. Sepsis and the systemic inflammatory response syndrome (SIRS). Crit Care Med 1996;24:863-874.
[2] Abraham E. Why immunomodulatory therapies have not worked in sepsis. Intensive Care Med 1999;25:556-566.
[3] Angus DC, van der Poll T. Severe sepsis and septic shock. N Engl J Med 2013;369:840-851.
[4] Hotchkiss RS, Moldawer LL. Parallels between cancer and infectious disease. N Engl J Med 2014;371:380-383.
[5] van der Poll T, Opal SM. Host-pathogen interactions in sepsis. Lancet Infect Dis 2008;8:32-43.
[6] Shankar-Hari M, et al. Developing a new definition and assessing new clinical criteria for septic shock. JAMA 2016;315:775-787.
[7] Marshall JC. Sepsis definitions: A critical perspective. Clin Chest Med 2016;37:165-171.
[8] Liu V, et al. Hospital deaths in patients with sepsis. JAMA 2014;312:90-92.
[9] Boomer JS, et al. Immunosuppression in patients who die of sepsis. JAMA 2011;306:2594-2605.
[10] Hotchkiss RS, et al. The evolving understanding of sepsis pathogenesis. Nat Rev Immunol 2016;16:471-482.
[11] Rittirsch D, et al. The role of complement in sepsis. Nat Rev Immunol 2008;8:776-787.
[12] Delano MJ, et al. Myeloid-derived suppressor cells in sepsis. J Clin Invest 2014;124:2773-2786.
[13] Venet F, et al. Increased circulating regulatory T cells in sepsis. Intensive Care Med 2009;35:678-686.
[14] Rubio I, et al. Circulating miRNA biomarkers for sepsis. J Clin Med 2019;8:775.
[15] Hotchkiss RS, et al. The pathophysiology and treatment of sepsis. N Engl J Med 2016;375:1303-1315.
[16] Delano MJ, Ward PA. Sepsis-induced immune dysfunction. Immunity 2016;44:303-312.
[17] Weiss SL, et al. Pediatric sepsis biomarkers. J Pediatr Infect Dis Soc 2015;4:187-195.
[18] Boomer JS, et al. Immunosuppression in patients who die of sepsis. JAMA 2011;306:2594-2605.
[19] Rubio I, et al. Circulating miRNA biomarkers for sepsis. J Clin Med 2019;8:775.
[20] Shankar-Hari M, et al. Developing a new definition and assessing new clinical criteria for septic shock. JAMA 2016;315:775-787.
[21] Marshall JC. Sepsis definitions: A critical perspective. Clin Chest Med 2016;37:165-171.
[22] Liu V, et al. Hospital deaths in patients with sepsis. JAMA 2014;312:90-92.

# by DrMagicianEARL | 2025-02-06 11:39 | 敗血症
【AI】システマティックレビューの論文抽出も一撃!ChatGPTのDeep Researchが他モデルを圧倒
【AI】システマティックレビューの論文抽出も一撃!ChatGPT Deep Researchが他のAIを圧倒_e0255123_16573831.png

■2025年2月3日,OpenAIのChatGPTにエージェント機能としてDeep Researchが搭載された.o3をベースとした自動検索+レポート作成システムであり,ベンチマークではGoogleのGemini-2.0-Flash-ThinkingやDeepSeek-R1をはるかに上回っており,他の検索AIツール(Felo,Genspark,Perplexity)のDeep Research機能と比較して追随を許さない圧倒的性能である.OpenAIはこのDeep Researchを,汎用人工知能(AGI)の開発に向けた重要な一歩としている.

■後述する通り,医学・医療においても極めて有用で高精度な機能である.以下にChatGPT Deep Researchについて概説とシステマティックレビューへの適用結果について説明する.
Index

1.ChatGPT Deep Researchとは?
2.Deep Researchの使い方
3.Deep Researchの仕組み
4.Deep Researhの性能
5.Deep Researchを使用する際の注意点
6.Deep Researchによる驚異的な医学論文検索能力

1.ChatGPT Deep Researchとは?

■Deep Researchは,OpenAIが開発した次世代エージェントであり,ユーザーの代わりに独立して作業を遂行する.ユーザーがプロンプトを入力すると,ChatGPTが数百のオンライン情報源を検索・分析し,研究アナリストレベルの包括的なレポートを作成する.この機能は,近日公開予定のOpenAI o3モデルの改良版によって動作し,ウェブ閲覧やデータ分析に特化している.o3の推論能力を活用して,大量のテキスト,画像,PDFを検索・解釈・分析し,得られた情報に応じて調査の方向性を適宜調整する.これにより,人間なら数時間かかる作業を5~30分程度で自動的に完了する(当然待っている間は他の作業ができる).

■金融,科学,政策,エンジニアリングなどの分野で精密かつ信頼性の高い調査を必要とする知識労働者向けに設計されている.また,自動車や家電,家具など,慎重な比較検討が求められる買い物をする際にも役立つ.

2.Deep Researchの使い方

■現時点(2025年2月4日時点)では月$200のサブスクリプションであるPro会員にしか開放されていないが,今後,Plus会員(月$20のサブスクリプション)にも開放される予定である.使用回数制限があり,月100回までである.

■現時点でアプリには搭載されておらず,Web版でのみ使用可能である(Web版であればスマホも可).使い方は,ChatGPTを開き,プロンプト入力欄の下にDeep Researchというボタンがあるので,そこを選択してプロンプトを入力し,実行ボタンを押す.自動的に検索が始まるが,タスクにおいてより必要な情報があるとChatGPTが判断した場合は,ChatGPTからユーザーにいくつかの質問を提示してくることがある.これらの質問に回答すると,Deep Researchが開始となる.
【AI】システマティックレビューの論文抽出も一撃!ChatGPT Deep Researchが他のAIを圧倒_e0255123_16575413.png
■使用モデルは4oとo3-miniで可能であるが,o3-miniだとうまく作動しないことがある.4oであればファイルを添付して質問した上でのDeep Reserchも可能である.

■調査が開始されると,サイドバーに「実行したステップ」や「使用した情報源」の概要が表示されるため,進捗が分かるようになっている.所用時間はタスクにもよるが,概ね5~30分の範囲である.

■調査が完了すると通知が届き,スレッド内でレポートを受け取る(回答が出力されている).なお,OpenAIによると,今後数週間以内に画像やデータ可視化の追加機能も提供予定とのことである.

3.Deep Researchの仕組み

■Deep Researchは,ブラウザやPythonツールの使用を伴うリアルなタスクを通じて訓練され,推論モデルであるOpenAI o1 と同様の強化学習手法を用いたエンドツーエンドの訓練で開発された.その訓練を通じて,必要なデータを見つけるために多段階のタスクを計画・実行し,必要に応じてバックトラックし,リアルタイムの情報に反応することを学習している.また,このモデルは,ユーザーがアップロードしたファイルをブラウズしたり,Pythonを使ってグラフをプロットして反復したり,生成されたグラフやウェブサイトからの画像を回答に埋め込んだり,ソースから特定の文章や一節を引用したりすることもできる.

■通常のAI検索との違いとして,インターネット上の多数の情報源から検索結果を単純にまとめて示すだけではない.以下のような,検索,分析,出力のループ処理を行っている.

(1)検索して収集した情報の分析

■収集された情報を高度な推論モデルで処理し,複数の情報を比較・照合し,内容の矛盾を解消したり,関連するデータを統合して意味のある結論を導きだしたりする作業が行われる.さらに,どの情報が信頼できるかを判断し,引用元を明確にするなどの透明性も確保している.

(2)レポート作成

■そして,分析結果をもとに,専門家レベルの包括的なレポートを作成する.

(3)ループ処理

■作成したレポートで不足している情報や曖昧な部分を補うために,再度の追加の検索・分析を行うこともある.ユーザーからのタスクに対して十分な情報が得られるまで,このプロセスを何度も繰り返し,最終的なレポートを生成する.

■SNSでは,Deep Researchで使用されているモデルをo3-miniとしているポストが見られるが,使用モデルはo3-miniではなく,o3シリーズの完成形であるo3(2025年2月5日時点で未公開)の改良版である.

4.Deep Researhの性能

■OpenAIからはベンチマークでの評価結果が示された.これらから,これまでのAIモデルと比較して圧倒的に精度が向上していることが分かる.

(1)Humanity's Last Exam(HLE)

■「人類最後の試験」と名付けられたこのベンチマークは,AIが真に人間レベルの知能に到達したかどうかを判定するための究極のテストとして考案された,いわば現時点でのベンチマークの最後の砦とも言うべきものであり,その先には人工汎用知能AGI到達というゴールがある.様々な分野の専門家からなる国際的なチームによって開発され,正確性,創造性,有用性の3つの基準で評価される.

■ChatGPT Deep Researchは,このHLEでの専門レベルの試験(言語学,宇宙工学,古典学,生態学など100以上の分野)で26.6%の正解率を記録した.この成績はOpenAI o1やDeepSeek-R1,Gemini-Thinkingの成績を大幅に超えるものである
【AI】システマティックレビューの論文抽出も一撃!ChatGPT Deep Researchが他のAIを圧倒_e0255123_17161581.png
(2)GAIA

■GAIA(General AI Assessment)はAIのリアルワールド対応力を評価する公開ベンチマークである.従来のAIベンチマークは,画像認識や自然言語処理など,特定のタスクやデータセットに特化していることが多く,AIの真の能力を測るには不十分であった.GAIAは,より包括的な評価基準を設けることで,AIのリアルワールド対応力をより正確に測定することを目的としており,AIの総合的な能力を評価することで真に人間レベルの知能に近づいたAIの開発を促進することを目指している.具体的には,問題解決能力,学習能力,適応能力,コミュニケーション能力,創造性,倫理的判断能力を評価する.

■ChatGPT Deep ResearchはこのGAIAで過去最高のスコアを記録した(外部リーダーボードで1位).

(3) 専門レベルのタスク評価

■専門家による内部評価で「何時間もの調査を自動化」 できることを確認した.

5.Deep Researchを使用する際の注意点

■非常に高精度なDeep Researchであるが,いくつか注意すべき点がある.

(1)情報の新鮮さがあまり考慮されない

■ChatGPT Deep Researchは信頼度の高い情報源を優先するが,そのかわり,情報源の新鮮さをあまり考慮していない,すなわち,古い情報も分析に統合されてレポートに反映されてしまう.対策として,プロンプトで情報ソースの年月日にカットオフをもうけることで,このようなリスクは減じることができる.医学論文を検索する際は,年月日のカットオフを指示した上でPubMedを指定して検索させることで,古い情報は一切入らなくなる.

(2)結果の解釈やファクトチェックが難しい

■あらかじめ答えが分かっている内容でDeep Researchをやれば正確性などは評価できるが,日常使いとして新たにタスクを実行させた場合は話が変わってくる.Deep Researchが出力するレポート量はかなり膨大である.結果をそのままプレゼンや資料作成,論文等に転用するのは避けるべきであるのは当然であるが,問題は,この膨大な量をどのようにして扱うかである.

■結果をプレゼンや資料作成にそのまま使用した場合,その膨大な量ゆえに自分の理解度が内容に追いつかないリスクがある.同時に,ファクトチェックに関しても,ソースが示されているとはいえ,膨大であり,前述の「情報の新鮮さ」も考慮する必要がでてくるため,容易ではない(ハルシネーションは極めて少なくなったとはいえ,まだ存在する).このため,自分が扱える範囲内での使用に限定する必要がある.具体的には,情報の補充,仮説の検証などである.

(3)ネットでオープンにされている情報の範囲

■Deep ResearchのレポートはWeb上の情報に依存する.このため,Web上にはない情報や,オープンにはされていない情報源はレポートに反映されない.医学論文に至っては,公開情報がアブストラクトのみなものと全文フルオープンのものがあり,情報量の違いによる偏りも発生しうる.これらのことを踏まえて出力レポートを解釈する必要がある.

6.Deep Researchによる驚異的な医学論文検索能力

■最後に,ChatGPT Deep Researchによる他のAIモデル/ツールをはるかに凌駕する驚異的な医学論文検索能力について言及しておきたい.私は昨今SNSに跋扈するAI驚き屋(「これはすごい!」と言って過大評価する投稿を繰り返す人)ではないが,今回ばかりは驚かざるを得なかった.

■試しに,筆者は予め答えが判明している(論文リストを全て知っている)内容のPICOS(敗血症性DICに対する遺伝子組換えトロンボモデュリンのRCT)を指定して,サイトをPubMedに限定させて論文検索を行ったところ,過不足なく,すなわち,「該当する論文をすべて抽出できた上に,余計な論文を1つも抽出せず」論文リストを出力した.その時間わずか9秒である(Deep Researchが組んだ検索式でヒットした論文数は120本).

■私はこの2年間,AIを用いてシステマティックレビューを自動化する研究に取り組んできたが,人間が最も苦労する「検索でヒットした論文リストからPICOSに合致した論文の抽出工程」が最大の難所で,どのAIにさせても感度・特異度は低く,つい先日公開されたばかりのo3-mini-highによWeb検索でも,感度は高かったが特異度は非常に低いという結果であった(ノイズの論文が多数混じる).しかし,ChatGPT Deep Researchはこれをあっさりクリアしてきた.試しに他のPICOSも2つ試したが,いずれも感度100%,特異度100%という結果であった.また,筆者と同様の精度の結果を複数の医師が得ていることをSNSで確認している.

■これは,これまで非常に労力を要してきたシステマティックレビューを個人レベルでカジュアルに実行できる可能性がでてきたことを示しており,さらにはAIによるシステマティックレビューの完全自動化も目前にきていることを意味する.同時に,今後,論文執筆の際に引用文献探索は非常に容易になるだろう.月$200(2025年2月5日時点では日本円で35000円相当)という高額なサブスクリプションであるが,その価値がようやくでてきたかもしれない.
# by DrMagicianEARL | 2025-02-05 17:34 | 医学・医療とAI
【AI】DeepSeek騒動はAIリテラシーのいいリトマス紙
【AI】DeepSeek騒動はAIリテラシーのいいリトマス紙_e0255123_15194525.png

■中国の企業からDeepSeek-V3とDeepSeek-R1がリリースされ,その高性能さとともに,セキュリティへの懸念や,ChatGPTを運用しているOpenAIのデータをDeepSeekが不正入手したのではないかという疑惑が出ている.これに関して,SNSでは様々な議論がなされているが,そこに垣間見えるのはAIリテラシーの欠如である.このあたりは震災やコロナパンデミックでのリスクコミュニケーションを見ているようだなと感じた.

■何より,「AIの基本の"き"」すら分かってない人が非常に多い上に,DeepSeekに対する的外れな批判も非常に多い.中にはDeepSeekのあらゆる使い方が危険という思考停止レベルの発言を繰り返している人もいる.これらの人に関してはAIリテラシーが欠如してる(というかそもそもAIに詳しくない)ので,今後AIについてのその人の発言は無視してよい.もっとも,AIを使いこなしているユーザーや企業は今回の騒動はさほど気にせずDeepSeekを使い続けている.

■今回の事例は,AIの仕組み,セキュリティに関する基本を知る上でも非常に教訓的であるため,このブログ記事をまとめた.この記事では以下について述べる.
Index

1.「DeepSeekで入力内容を抜かれる」という注意喚起が的外れな理由
2.DeepSeekをどう使えばバックドアのリスクを回避できるか
3.将来起こるかもしれない中国国内法の適用リスクをどう回避するか
4.バイアスのある人による「出力内容の中国バイアス」への的外れな批判
5.DeepSeekがOpenAIのデータを不正入手した疑いについて

1.「DeepSeekで入力内容を抜かれる」という注意喚起が的外れな理由

■DeepSeekでの会話内容は保存されるため,入力内容は当然ながらサーバーに残る.これについてやたらと「危ない」と言う人がいるが,そもそも他のAIではなぜ騒がないのかという話になるし,何より,「(クラウド型の)AIに個人情報や機密情報を入力/アップロードしない」というのは大原則であって,何もDeepSeekに限った話ではない.こういう注意喚起をする人は普段から他のAIには個人情報や機密情報を入力してしまっているのだろうか?加えて,DeepSeekも利用規約に「個人情報や機密情報を入れるな」というニュアンスをちゃんと強く示している(DeepSeekの利用規約を批判している人はなぜかこの部分に一切言及しない).
【AI】DeepSeek騒動はAIリテラシーのいいリトマス紙_e0255123_15525666.png
■AIに個人情報や機密情報を入力するリスクはChatGPTが世に出た当初から指摘されていて,実際に社内機密情報がChatGPT経由で漏れた事例もいくつか報道されている.セキュリティ基準がちゃんとしている企業は,社内の重要情報をAIで扱う場合,オフラインのローカル環境で使用しており,オンラインでGPT-4oなどのAPIすら使うことを禁止している.

■「入力内容を抜かれる」という心配は,元はと言えば使用するユーザーがそういう個人情報や機密情報を入力すること前提の心配であって,そのような入力をしてしまう人は最初からAIを使用すべきではない.

2.DeepSeekをどう使えばバックドアのリスクを回避できるか

■AIそのものにPC/スマホ内のデータを抜き取る仕掛けがあるのではないかという心配をしている人もいる.現時点でそのような実例は確認されておらず,解析を行っているプログラマーの方からも不審な挙動は確認されていない.それでも不安に思う人はいるだろう.ただ,安全に使用はできる方法はいくつもあるので,以下にリスクを踏まえた選択肢を提示する.

(1)Web版やAPI

■Web版やAPIではバックドアの危険性はありえるので,プライベートのPCやスマホでは使用回避した方がいいだろう.もし使用するなら重要データが入っていないPCを使用するのがよい.

(2)アプリ

■iOS版やアンドロイド版がリリースされており,これらはAppStore/GooglePlayの審査において,コードの検査,APIの適切な使用,不審な挙動有無,マルウェア有無などが、チェックされており,バックドアリスクはかなり少ない.

■もちろん,隠しコードなど抜け道が存在する可能性が残されているため,リスクはゼロではない.それでも,最近のiOSは強固なセキュリティシステムを有するため,アプリのアクセス権限をユーザーが許可しない限りは情報を抜くのは困難である.となると残るリスクとしては,サンドボックスの制約を回避する手法をとられる場合である.この場合,クリップボード(コピー&ペーストの内容)上のデータとWifi情報は抜かれる可能性がある.逆に言えば,DeepSeekアプリのバックドアがiOSのシステムデータや他のアプリデータ,通話履歴・SMS・iMessageなどへアクセスすることはまず不可能である.

■一方,アンドロイドではプラットフォームがiOSよりオープンで,アプリがより多くの権限を持っていること,GooglePlayの審査がAppStoreよりやや緩いことから,iOSよりはリスクがやや高くなる.

■なお,アプリが今後アップデートされる可能性もあるので,以下に注意は必要(どのアプリでも言えること)
知らないアプリに不要な権限を与えない
- 例えば,電卓アプリが「連絡先」や「位置情報」を求めてきたら不自然なので,権限を拒否する

プライバシー設定を確認 - [設定]→[プライバシー]で,どのアプリがどのデータにアクセスしているかを定期的に確認する

クリップボードの監視に注意
- iOS 14以降では,アプリがクリップボードにアクセスすると通知が表示されるので,不審なアプリを見つけやすい

VPNアプリの利用に慎重になる
- 無料VPNアプリの中には,通信データを傍受する悪意あるものもあるので,信頼できるサービスを選ぶ

アプリのアップデート内容を確認
- 突然「新しい権限」を要求するアップデートには注意する

(3)ホストサービスを利用する

ローカル使用できない一般個人ユーザーが使用する上ではセキュリティ上ホストサービスを利用するのが最も安全な使い方だろう.ホストサービスを仲介することで,AIがユーザーのデバイスに直接アクセスされる心配がない.以下にDeepSeekが使用できるホストサービスを紹介する.
DeepSeekを使用できるホストサービス

① Poe
多数のチャットボットを扱うプラットフォームである.Poeでは無料ユーザーでも最大で1日10回はDeepSeek-R1を使用できる.

② Perplexity
AI検索ツールのPerplexityでは,ProのところをタップorクリックするとDeepSeek-R1の推論が選択でき,使用可能.

③ Felo
AI検索ツールのFeloのPro検索でDeepSeek-R1が使用可能.無料ユーザーでも1日5回まで使用可能.

④ Genspark
AI検索ツールのGensparkでは有料会員限定でDeepSeek-R1が使用できる.

⑤ Copilot
Microsoft社のCopilotではDeepSeek-R1を無料で使用することが可能である.

⑥ Azure AI Foundry
開発者や企業向けではあるが,Microsoft社のAzure AI Foundryで使用可能である.

(4)ローカル環境で使用する

■DeepSeekはオープンソース(厳密にはオープンウェイト)のモデルである.テクニカルにはなるが,AIモデルをオフラインのローカル環境に入れて使用すれば通信が外部と遮断されているため情報が抜かれる心配はない.DeepSeek-R1自体はサイズが非常に小さいため,企業であれば自前で用意できる程度のGPUで動かすことが可能である.また,よりサイズを小さくした蒸留モデルであれば個人ユーザーのPCやスマートフォンにも入れることができる.
3.将来起こるかもしれない中国国内法の適用リスクをどう回避するか

■DeepSeekの利用規約第9.1条では,「本利用規約の成立,履行,解釈および紛争解決には中華人民共和国(中国本土)の法律が適用される」と明記されている.AIやデータ利用に関する法整備がなされた場合,ユーザーが中国国内法により賠償責任を負わせられるケースが将来的に出てくるリスクはある.DeepSeekを利用する上で上記リスクがある主な行為は以下の通りで,これらは避けるべきだろう.
将来的な中国国内法適用リスクとなる可能性がある行為

入力内容
- 個人情報,機密情報,企業秘密を入力・アップロードする
- 法律で禁止されている内容(例: 中傷,虚偽情報,政治的に敏感な情報)を入力する
- jail-breakプロンプトの使用
- 性的・暴力的等のAI使用ポリシーに反するプロンプト

出力内容の使用
- DeepSeekのAIが生成した出力をそのまま公開または商用利用する
- 出力内容が他者の権利を侵害している可能性がある場合,それを無断で使用する

規約違反や中国法適用となる行為
- DeepSeekの利用規約に違反する行為(例: 不正利用,禁止された用途での利用)
- AIを使用して,中国政府が規制する分野(例: 国家安全,機密データ)での利用

4.バイアスのある人による「出力内容の中国バイアス」への的外れな批判

■「天安門事件や尖閣諸島などのことをDeepSeekに質問すると,歴史的に誤った回答や回答拒否が起こるから,DeepSeekの性能は使いものにならない」と批判している人がいるが,AIリテラシー欠如も甚だしい.もっともこのような批判をしている人自身がベースにバイアスがあるわけで,いい年した大人が「自分の気に入らないバイアスがあるAIは全部ゴミ」みたいな極端な結論を出すのは如何なものかと思う.

■AIモデルは訓練データや設計思想に大きく依存している.中国製AIが「中国バイアス」を持つのは,開発者が設定した内部ガイドラインの影響であり,これは技術的な制約ではなく設計上の選択に過ぎない.天安門事件や尖閣諸島といった話題は中国国内で特にデリケートな問題であり,政府規制や文化的背景に沿った制約がモデルに組み込まれている.中国の企業である以上,国の方針に逆らって企業をつぶすわけにもいかないので当然避けられない分かり切った話である.

■実際,(リスクのある使い方なのでやるのはおすすめしないが)prompt injectionを用いると,実際には天安門事件等について正しい知識を出力することも判明している.この中国バイアスがモデル全体の性能(例えば自然言語処理や推論能力)に直結するわけではないのだが,これを理解せず,AIそのものが全般的に「使い物にならない」と結論づけるのは,AIがどのように作られ,使われるかについての理解不足,AIへの評価能力の欠如を反映している.

■すべてのAIは何らかのバイアスを持っている.ChatGPTを含め,どのAIも訓練データや設計者の意図によって,特定の文化や価値観に偏る可能性がある.中国製AIが中国の政治的バイアスを持つのは,特定の国家のニーズに応じて調整された結果であり,これを理解せず,特定のバイアスだけを取り上げて騒ぐのはAI全般に対する偏見や誤解の表れと言える.

5.DeepSeekがOpenAIのデータを不正入手した疑いについて

■DeepSeekがOpenAIからデータを不正入手した疑いがあるという報道がなされ,AIのことをあまりよく知らない人がこの報道に飛びついて「盗作だ」と騒いでいるが,そんな単純な話ではないし,現時点で盗んだと断定できるような情報はない(OpenAIとMicrosoftが調査中).現時点で断定口調で騒いでいる人は単に中国嫌いなのであろう.

■勘違いしてる人が多いが,これはDeepSeekがOpenAIにハッキングかけてデータ盗んだとかそんな話ではなく,あくまで一般ユーザーも使用するAPI経由でのデータの話である.APIはサービス同士を繋ぐ窓口のようなもので,アプリ経由ではなくダイレクトにAIモデルとやりとりができるものである.

■報道での疑惑とされているのは,一般ユーザーが行うAPI経由でのAIとのやりとりを頻回に行って,その入出力データを収集してデータセットとし,DeepSeekモデルの学習のために使ったのかどうかである.グレーな話ではあるが,少なくともAPIを使う行為も,データセットを作って蒸留する行為も,利用規約違反にはなれど違法性を問うことはまずできない

■となるとあとはそのAPI経由のやりとりが利用規約範囲内か否か,企業モラル的にどうなのかが問題となる.OpenAIとMicrosoftが調査するとのことだが,分かるのはせいぜい利用規約違反有無のみで,DeepSeekの学習に使う目的だったのか,実際に使ったのかが判明することはおそらくないだろう.

■DeepSeek-R1のテクニカルレポートから「出力すべき内容を既に解っている前提でそれをアウトプットするための効率化が考察されているので,OpenAIのモデル蒸留を行なっている」という指摘もあるが,適用プロセスでは「正解が分かっている前提で出力を最適化する」わけではなく,自己学習によって新たな推論能力を獲得するアプローチを取っている.DeepSeek mathの論文も見る限りは,数学を用いることにより自立的に思考を獲得したと書かれており,この状況においてo1のデータはノイズとなるため,o1のデータを学習したとは考えにくい.

■仮にDeepSeekがAPI経由でデータを入手して学習に使用していたとして,おそらくこれはDeepSeekに限らず,他の競合AI企業やスタートアップ企業が既にやってる可能性も十分にある.このあたりにまだ明確なルールも法規制もないからである.実際,被害を訴えるOpenAI自身も,利用規約を逸脱してYouTubeから学習データを得ていることが指摘されており,さらに遡るなら,OpenAIがネットの著作権を有するデータを無断で大量に学習していたことを考えると,皮肉な話ではあり,AIを触ってきた人間からすれば今更感しかないだろう.

■DeepSeekにいろいろ質問すると,あたかもChatGPTかのように振る舞う現象も確認されているが,これを持ってDeepSeekがOpenAIからデータを搾取したと断じることはできない.このような現象はDeepSeekのみならず,多くのオープンソースモデル,さらにはClaudeやGeminiでも確認されており,Transformerアーキテクチャの影響によるハルシネーションの可能性が高いからである.

■Transformerとは,Googleが開発した自然言語処理のためのAIモデルの仕組みで,ほとんどのAIモデルの基盤になっている.そこに,ネット上の大量の情報をAIが学習していくわけだが,ここで,先述の現象が起きてしまう.Transformerはテキストの関係性を学習して,確率的に最適な次の単語を生成する仕組みになっている.テキスト生成AIが世に出た当初はChatGPTの独壇場で,「OpenAIのChatGPT」はAIアシスタントの代名詞的扱いになっており,そのようなネット情報を学習すると,確率的に自身をChatGPTと名乗る現象が起こる.

6.最後に

■DeepSeek騒動はSNSで大きな話題となったが,その一方で,AIに詳しい普段使いしている人や開発系の人はこの騒動を冷めた目で見つつDeepSeekを普通に使用している(IT開発系の人と話したが,「こんな低コストで高性能のモデルを使用しない方がおかしい」という口ぶりであった).このような人達はAIでのリスクの5W1Hをよく理解していて,リスクさえ回避すれば問題なく使えることを示している.そして,実際に一般ユーザーでも安全にDeepSeekを使用する方法はいくつもあるのである.この温度差の理由がAIリテラシーの格差として如実に表れている.

■AIを日常的に使用するにあたり,体系的に基本を学んでいる方は少ないと思われる.ChatGPTが世に出てから2年以上経っているが,今回のDeepSeek騒動を見ても,AIの基本を知らない人は非常に多い.SNS等には個人でAI活用セミナーなどを開いている人もいるが,できればGoogle AI Essentialsなどの基礎の学習・トレーニングコースを受講することをおすすめする(修了証ももらえて履歴書にも書ける).

# by DrMagicianEARL | 2025-01-31 16:11 | 医学・医療とAI
【AI】ChatGPT-o1に匹敵するオープンソースのAIモデルDeepSeek-R1が登場!
【AI】ChatGPT-o1に匹敵するオープンソースのAIモデルDeepSeek-R1が登場!_e0255123_15190968.png

■2025年1月20日に中国のAIスタートアップ企業である深度求索(英語ブランド名:DeepSeek Research)からオープンソースAIであるDeepSeek-R1がリリースされた.その性能は,三大大規模言語モデル(LLM)であるChatGPT,Claude,Geminiの牙城を崩すレベルであり,ベンチマークスコアではChatGPT-o1に匹敵するレベルである.

1.DeepSeekはどこの企業が開発した?

■DeepSeekを開発したのは深度求索である.中国は杭州に拠点を置くこの企業は,中国の大規模ヘッジファンド企業「幻方量化(Huanfang Quant)」の資金で設立された子会社であり,外部からの資金調達は一切ない.本企業は
①単に既存のモデルを模倣するのではなく,モデルアーキテクチャの根本的な革新にフォーカスする
②具体的な目標やタスクを与えず,自由に研究させる独自の社風
③社会貢献としての低コスト,技術を独占しないオープンソース戦略
という特徴がある.

2.DeepSeek-R1の特徴

■DeepSeek-R1は,複雑な問題解決に特化した高性能な推論型LLMである.数学やコーディング,複雑な質問に回答するタスクを専門としている.DeepSeek-R1は,6710億のパラメータと128Kトークンのコンテキスト長を持ち,DeepSeek-V3-Baseと呼ばれるMixture of Experts (MoE) アーキテクチャを採用したモデルをベースに開発された.

(1)強化学習によるo1に匹敵する性能
■最大の特徴は,従来の教師ありファインチューニングではなく,大規模な強化学習によってトレーニングされている点である.これにより,AI自身が試行錯誤を通じて学習する強化学習と,巨大なモデルからより小さなモデルに知識を伝達する蒸留と呼ばれる技術を組み合わせることで,複雑な問題を解決するための思考の連鎖(Chain of Thought: CoT)を探索することを可能にした.

DeepSeek-R1は,複数の数学・コーディング・推論のベンチマークにおいて,OpenAIのChatGPT-o1に匹敵する性能を示している
【AI】ChatGPT-o1に匹敵するオープンソースのAIモデルDeepSeek-R1が登場!_e0255123_15205647.jpg

■DeepSeek-R1で特筆すべきはAha Moment(アハモーメント)であろう.これは,DeepSeek-R1の学習過程で観察された「モデルが突然,問題解決の新しい方法を発見する瞬間」を指す.これは,強化学習を通じてモデルが自律的に推論能力を向上させる過程で現れる非常に興味深い現象である.具体的にはテクニカルレポートの7-8ページにあるが,強化学習の途中過程で,モデルが数学の問題解決タスクの計算ステップで行き詰まった際に,「Wait, wait. That’s an aha moment I can flag here.(あ,待てよ.ここがまさに『気づきの瞬間』だ)」という内部的な「気づき」を生成し,問題を再構築し,ステップバイステップで再計算を試みて最終的に正しい解を導出するに至った.これは,強化学習を通じて,モデルが「自己修正」や「再検討」の能力を自律的に獲得したことを示しており,人間の「ひらめき」に近いプロセスをAIが再現できる可能性を実証したことになる.
【AI】ChatGPT-o1に匹敵するオープンソースのAIモデルDeepSeek-R1が登場!_e0255123_15211894.png

(2)超低価格の実現
■このモデルはオープンソースであり,MITライセンスのもとで提供されているため,誰でも自由に使用,修正,そして商用利用することができる.既存の三大LLMに比して極めて自由度が高い.加えて,Web版やアプリ版は無料,API価格はOpenAI o1の約27分の1と,圧倒的な低価格で利用できる

(3)推論の思考プロセス■多くのAIモデルとは異なり,推論プロセスを段階的にユーザーインターフェースに表示するため,信頼性が高く,デバッグが容易である.具体的には,以下のプロセスで回答を生成している.
1. 問題の解析とフレームワーク構築
- 入力の構造化: ユーザーの質問を自然言語処理(NLP)で解析し,キーワードや文脈を抽出
- タスクの分類: 問題を「数学」「コーディング」「論証」などドメイン別に分類し,適切な推論モードを選択

2.知識の活性化と関連情報の検索
- 内部知識ベースの参照: 事前学習済みの数理公式やコードパターンを検索
- 類似問題の抽出: 過去の学習データから類似ケースを比較

3.仮説の生成と優先順位付け
- 複数アプローチの列挙: 解決策の候補を生成
- スコアリング: 各手法の計算効率や正確性を評価し,最適な順序で実行

4.段階的実行と中間検証
- ステップバイステップ実行: 各計算ステップを詳細に記録し,中間結果を逐次チェック
- 自動検証: 数値計算や論理矛盾をリアルタイムで検出

5.フィードバックループによる修正
- エラー検出時: 矛盾が生じたステップに戻り,代替アプローチを試行
- 動的方針変更: 計算が複雑化した場合、より単純な手法に切り替え

6.結論の統合と説明生成
- 回答の構造化: タグ内に思考プロセス,に最終結論を明示
- 可読性の最適化: 数式のLaTeX整形,自然言語での要約を付加

7.メタ認知による品質保証
- 自己評価: 回答の信頼度をスコア化
- 例外処理: 未解決の問題は「回答不能」と明示し,追加情報を要求
■この抽出された推論プロセスの思考をClaudeに tagで組み込むことで,Claudeは自分の思考だと錯覚し,自身の限界を超えた推論能力を発揮できるようになる(もっとも,推論プロンプトを使えばDeepSeek-R1の推論プロセスを用いずとも可能ではある).

■なお,思考プロセスは,日本語,英語,中国語のいずれかで表示されるが,これもプロンプトで指定が可能である.ただし,DeepSeek-R1は設計上英語で思考を行う方が精度が上がるとされており,「思考は英語で,出力は日本語で」と指示すると,英語で思考を行いつつ,思考プロセスの表示は日本語にできる

(4)サイズの小さい蒸留モデル

■DeepSeek-R1は,671Bパラメータのフルモデルに加えて、1.5Bから70Bパラメータまでの6種類の軽量版モデルが用意されており,1.5BであればPCやスマートフォンに入れることができ,高性能AIモデルをオフラインで使用できる.これは,大規模で高度なAIシステムが,より小規模で単純なモデルと知識を共有するという,モデル蒸留と呼ばれるAIのトレンドの一環である.DeepSeek-R1蒸留モデルは,大規模なテック企業だけでなく,すべての人が最先端のAIを利用できるようにするというDeepSeekの理念を体現している.

(5)Web検索との組み合わせ
■Web版では,DeepSeek-R1とWeb検索を組み合わせることも可能である(ただし,Web検索自体をDeepSeek-R1が行うわけではないので,同時起動の意味はたいしてないものと思われる).また,AI検索ツールのFelo,GensparkでもDeepSeek-R1が使用可能となった.

(6)内部ガイドラインの存在
■中国製のAIモデルということもあり,天安門事件等の質問に対しては回答を拒否する特徴がある(ただし,比較的簡単なインジェクションプロンプトで回答するようにはなる).実際このあたりの質問に関しては思考プロセスの中で「内部ガイドライン遵守」という言葉が出現している.

3.DeepSeek-R1の使用方法
■DeepSeek-R1はアカウント登録をした上で以下の方法で使用できる.APIを使用しないならばアプリ版がおすすめである.

(1)Web版(無料)
◾️https://chat.deepseek.comにアクセスし,プロンプト入力欄の下にある「DeepThink (R1)」ボタンを押すと使用できる.

(2)アプリ版(無料)
■iOSでもアンドロイドでもアプリがリリースされている.プロンプト入力欄の下にある「深く考える」ボタンを押すと使用できる.ただし,アプリ版では,「深く考える」と「Web検索」の同時使用はなぜかできない(ただし,同時使用してもしなくてもたいして変わらない).
iOS版
https://apps.apple.com/jp/app/deepseek-ai-assistant/id6737597349

アンドロイド版
https://play.google.com/store/apps/details?id=com.deepseek.chat&pcampaignid=web_share
(3)API(有料)
■DeepSeekのAPIに接続することでDeepSeek-R1を自身のアプリケーションに統合することが可能である.料金は,100万トークンあたり,出力が$2.19(≒340円),入力が$0.55(≒85円)である.

(4)ローカル実行(無料)
■OllamaやHugging Faceなどのツールを使用して,DeepSeek-R1のモデルをダウンロードし,ローカル環境で実行することができる.

(5)Poe(無料)
■多数のAIを使用できるプラットフォームであるPoeで使用できる.無料ユーザーでも可能だが,1メッセージあたり2400ポイントと,なぜか消費ポイントが大きいため,Poeで使う必要はない.

(6)Felo(無料でも可能)
■AI検索ツールFeloで使用できる.無料ユーザーでもPro検索として1日5回まで,ファイル分析として1日3回まで使用できる.

(7)Genspark(有料)
■AI検索ツールGensparkで使用できる.

4.セキュリティは?

■DeepSeekは中国製であるため,バックドア等セキュリティを心配する声もある.ただ,本AIモデルのアプリは,GooglePlayやAppStoreの厳しい審査をクリアしていること,オープンソースであるため誰でもソースコードを検証できることから,現時点でその心配はほぼ杞憂であろう.もっとも,中国製か否かにかかわらず,オンラインのAIモデルに機密情報や個人情報は入力しないのが基本であるため,そのルールに則れば心配は不要である.

# by DrMagicianEARL | 2025-01-24 15:22 | 医学・医療とAI

by DrMagicianEARL