人気ブログランキング | 話題のタグを見る
ブログトップ

EARLの医学ノート

drmagician.exblog.jp

敗血症をメインとした集中治療,感染症,呼吸器のノート.医療におけるAIについても

■論文検索が可能なAIには,Consensus,Elicit,Perplexityなどがあり便利ではあるが,当然ながら完璧ではなく(漏れがでる),手動でのPubMed検索が一番網羅的で精度が高いことは変わらない.そこでPubMedというデータベースとその検索機能をChatGPTがダイレクトに操作してくれれば手動の精度を維持したまま網羅的検索を簡便に行える上に,その検索結果のファイル化,論文抽出,解説までChatGPTのユーザーインターフェース上で行うことができる

■ChatGPTにはBingを用いたウェブアクセス機能が備わっているが,ChatGPTで論文検索を行う上では特定の論文検索エンジンを使用することをプロンプトで指示した方がよい.しかしながら,ChatGPTはPubMedのサイトをうまく読み込めず,以下のようなトラブルが発生しやすい.
・PubMed検索結果を読み込めずハルシネーションを起こす(偽の結果を表示する)
・論文Abstractのページをうまく読み込めない
・論文検索結果で表示された1ページ分しか読み込めない
■このようなことが起こるのは以下のことが原因である.

(1)動的コンテンツ
■PubMedのウェブサイトは動的にコンテンツを生成することが多く,JavaScriptを使用して情報を表示する.これにより,ウェブスクレイピングツールが正確に情報を取得するのが難しくなる.

(2)ページ構造の複雑さ
■PubMedのウェブページの構造が複雑であり,多くのリンクやデータベースクエリが絡み合っている.このため,特定の情報を正確に抽出するのが難しい場合がある.

(3)制限や防御策
■PubMedは自動化されたツールによる過度なアクセスを防ぐための制限や防御策を持っているため,情報取得が制限されることがある.

■そこで,PubMedのサイトにアクセスするのではなく,API経由で情報を取得するようにすればこのようなトラブルを回避することができる.以下では,API経由でPubMed検索結果を取得するGPT「PubMed Searcher」を筆者が作ったので紹介する

1.GPT「PubMed Searcher」の仕組み

■ChatGPTの有料ユーザー(Plus会員:月$20のサブスクリプション)は,自分専用のbotであるGPTを作成することができる.このGPTでPubMed Searcherを作成する(個別にAPIキーが必要となるため,他者には公開せず自分のみの使用となる).また,PubMedはAPIを無料公開している(厳密にはNCBIが提供するEntrezのAPIのデータベースを選択するパラメータとしてPubMedを指定できる).APIはApplication Programming Interfaceの略で,ソフトウェア同士が通信するためのインターフェースであり,いわゆる「情報をやりとりするための鍵」である.このAPIを用いてPubMedのデータベースにChatGPTが直接アクセスして論文情報を引っ張ってくることができる.

■PubMedのAPIはNCBIにアカウントを作成した上で,自分だけのAPIキーを入手する必要がある.つまり,このGPTを作成しても他人が使用することは避けなければならず,自分だけが使用するものである.このため,作成したPubMed SearcherがGPT storeに置かれているわけではなく,各自で作成しなければならない.といっても,筆者が作成した以下の手順通りやれば作成できるので,さほど難しくはなく,スマホからも作成可能である.

2.GPT「PubMed Searcher」を作成する手順

(1)ncbiのアカウントを作成する
■まず,以下のURLにアクセスし,ncbiのアカウントを作成する.
https://www.ncbi.nlm.nih.gov/account/
(2)APIキーを取得する
■アカウントを取得したら,以下のアカウント設定ページにアクセスし,一番下にあるAPI Key ManagementにあるAPIキーを取得する.このAPIキーは自分だけのものなので他人に公開しないこと.
https://www.ncbi.nlm.nih.gov/account/settings/
(3)GPTを作成する
■ウェブ版のChatGPTにアクセスし,左側のバーから「GPTを探す(GPT explore)」をクリックし,右上の「+作成する」をクリックするとGPT builderが立ち上がる.一番上のバーで真ん中の「構成」を選択し,以下のように設定する.

アイコン画像:好きな画像を設定できる.DALL-E3に頼んで画像生成してもらうことも可能
名前:好きな名前に設定する(例:PubMed Researcher)
説明:GPTを開いた時に表示される短い説明文.好きな説明文を入れる(例:PubMedでの網羅的検索を目的としたGPTです)
指示:以下をコピペする(構造化された情報を提供する必要がある部分について,精度を高めるためにYAMLを使用した指示となっている).
このGPTはPubMedから文献情報を検索することでユーザーを支援します。ユーザーが提供する特定のクエリを使ってPubMedを検索し、関連する論文情報を返すことができなければなりません。GPTはPubMedデータへのアクセスにNCBIのアカウント詳細とAPIキーを活用してください。

Clinical Questionへの対応:
```yaml
clinical_question:
  steps:
    - Extract as many all relevant terms (synonym or quasi-synonym) as possible from the Clinical Question provided by the user.
    - Create a PubMed search query using these terms, enclosed in double quotes.
    - Ensure the search query is highly sensitive but not highly specific.
    - Ask the user for confirmation before performing the search.

search_results:
  steps:
    - Indicate the number of results found.
    - If ESearch results exceed 3, do not display article details in the response.
    - Use ESummary to compile all results into an Excel file.
    - Include all articles in the Excel file without setting a limit on the number of articles.

excel_file:
  columns:
    - PMID
    - URL: Create a hyperlink to the article's PubMed page in the format https://pubmed.ncbi.nlm.nih.gov/PMID/
    - Title

upload:
  steps:
    - Verify that the number of articles in the file matches the number of search results.
    - Ensure each article includes all required information.
    - Redo the process if any information is missing.

efetch:
  usage: Use EFetch only when abstract information is needed.
・会話の開始者:特に設定は不要
・知識:特に設定は不要
・機能:「ウェブ参照」と「コードインタープリター」にチェックを入れる
・アクション:「新しいアクションを作成する」をクリックし,「スキーマ」に以下をコピペする
openapi: 3.0.0
info:
  title: PubMed API
  description: API to search and retrieve literature from PubMed using esearch, esummary, and efetch endpoints.
  version: 1.0.0
servers:
  - url: https://eutils.ncbi.nlm.nih.gov/entrez/eutils
    description: NCBI E-utilities server
paths:
  /esearch.fcgi:
    get:
      operationId: searchLiterature
      summary: Searches for literature in PubMed.
      parameters:
        - name: db
          in: query
          required: true
          schema:
            type: string
          description: The database to search (e.g., pubmed).
        - name: term
          in: query
          required: true
          schema:
            type: string
          description: The search term(s).
        - name: retmax
          in: query
          required: false
          schema:
            type: integer
          description: The maximum number of results to return.
        - name: retmode
          in: query
          required: false
          schema:
            type: string
          description: The return mode (e.g., xml, json).
        - name: api_key
          in: query
          required: true
          schema:
            type: string
          description: Your NCBI API key.
    responses:
      '200':
        description: Search results
        content:
          application/json:
            schema:
              type: object
              properties:
                count:
                  type: integer
                retmax:
                  type: integer
                retstart:
                  type: integer
                ids:
                  type: array
                  items:
                    type: string
  /esummary.fcgi:
    get:
      operationId: getSummary
      summary: Retrieves the summary of literature based on search results.
      parameters:
        - name: db
          in: query
          required: true
          schema:
            type: string
          description: The database to search (e.g., pubmed).
        - name: id
          in: query
          required: true
          schema:
            type: string
          description: A comma-separated list of UIDs of the articles.
        - name: retmode
          in: query
          required: false
          schema:
            type: string
          description: The return mode (e.g., xml, json).
        - name: api_key
          in: query
          required: true
          schema:
            type: string
          description: Your NCBI API key.
    responses:
      '200':
        description: Summary details of the search results
        content:
          application/json:
            schema:
              type: object
              properties:
                uid:
                  type: string
                title:
                  type: string
                source:
                  type: string
                pubdate:
                  type: string
                authors:
                  type: array
                  items:
                    type: string
                volume:
                  type: string
                issue:
                  type: string
                pages:
                  type: string
                doi:
                  type: string
  /efetch.fcgi:
    get:
      operationId: fetchDetails
      summary: Fetches the details including abstracts for specified UIDs.
      parameters:
        - name: db
          in: query
          required: true
          schema:
            type: string
          description: The database to search (e.g., pubmed).
        - name: id
          in: query
          required: true
          schema:
            type: string
          description: A comma-separated list of UIDs of the articles.
        - name: rettype
          in: query
          required: false
          schema:
            type: string
          description: The return type (e.g., abstract).
        - name: retmode
          in: query
          required: false
          schema:
            type: string
          description: The return mode (e.g., xml, text).
        - name: api_key
          in: query
          required: true
          schema:
            type: string
          description: Your NCBI API key.
    responses:
      '200':
        description: Detailed information including abstracts
        content:
          text/plain:
            schema:
              type: string
・コピペしたスキーマには「Your NCBI API Key.」と書かれている部分(上のボックス内で赤字で示している部分)が3か所あるので,その部分を取得したAPIキーに置き換える
追加設定:設定は不要
・右上の「更新する」を押す.公開範囲は「自分のみ」とする.

3.GPT「PubMed Researcher」でできること

■このGPTでは上記のベースの指示により以下のことが可能である.

(1)Clinical Questionに応じたPubMed検索式の生成
Clinical Question(その他の質問でもよいが)を質問すると,その質問に応じて網羅的なPubMed検索式を生成する.網羅的検索ができるように設定しているため,各用語についてできるだけ多くの同義語を検索式に加えるようにしており,感度が高く,特異度が低い検索式となっている.回答の最後に「この検索式でPubMed検索していいか?」と聞かれるので,修正が必要であればそこで修正内容を伝える.
【AI】ChatGPTとAPIを使って網羅的なPubMed検索できるGPT「PubMed Searcher」_e0255123_12375758.png
(2)ESearchを用いた検索
■PubMed検索を指示すると,GPTはまずAPIキーを使ってESearchで検索結果としてヒットした論文のPMIDを取得する.これにより論文のヒット数とPMIDが入手される.この際,「〇件の論文がヒットした」と回答される.このPMIDをもとに,各論文のより詳しい内容をESummaryやEFetchで取得することができる.
【AI】ChatGPTとAPIを使って網羅的なPubMed検索できるGPT「PubMed Searcher」_e0255123_12382730.png
(3)ESummaryを用いた論文情報取得
■ESummaryは論文タイトル,論文が掲載されているジャーナル・年・巻号・頁の情報を取得できる.このESummaryを使って,(2)でESearchから得た論文のPMIDから論文情報を取得する.ただし,網羅的検索ではかなりの論文数がヒットされる可能性があるため,GPTの回答出力の限界もあることから,論文数が4件以上の場合はAdvanced Data Analysis(旧Code Interpreter)を使って自動的にExcelファイルにまとめるよう設定されている(この件数を変更したい場合は,GPT編集で指示を変更する).Excelファイルに提示される情報は,PMID,PubMedでのその論文Abstractへのリンク,論文タイトルの3つである(ジャーナル名等まで入れると処理しきれずタイムアウトしてしまう).また,ChatGPTの処理の限界から,取得できる論文情報は多くとも200件程度までと考えた方がよい.これ以下に論文数をおさえるなら検索式の特異度を高める必要がある.
【AI】ChatGPTとAPIを使って網羅的なPubMed検索できるGPT「PubMed Searcher」_e0255123_12385102.png
■応用として,GPTに指示して,このExcelファイルから自分の目的にあった論文タイトルの論文だけを抽出して再度ファイル化してもらうことも可能である(ただし,ChatGPTは「選択」というタスクが苦手であり,その抽出精度は感度が高く特異度が低めである).

(4)EFetchを用いた論文Abstractの取得
■EFetchは論文Abstractやdoiも含めたより詳細な論文の情報を取得することができる.これにより,ダイレクトにAbstractの内容をGPTに解説してもらったりすることも可能である.
【AI】ChatGPTとAPIを使って網羅的なPubMed検索できるGPT「PubMed Searcher」_e0255123_12430125.png

# by DrMagicianEARL | 2024-05-18 12:44 | 医学・医療とAI
【AI】GoogleのAIであるGemini Advancedに高性能のGemini-1.5Proが搭載_e0255123_17073861.png
■2024年2月8日にリリースされた,Google最強のAIであるGeminiがBardと入れ替わる形で利用可能となったが,機能が不完全で,他のGoogleアプリとの連携も未完成であったこと,その後3月4日にClaude-3がリリースされたことから,Geminiを使用する人は大幅に減ったと思われる.だが,今回,Googleは大規模なアップデートを5月15日にGoogle I/O 2024で発表した.OpenAIが意図的に狙ったのかは不明だが,GPT-4oのリリースを同じ日にかぶせてきたため,Googleの発表は霞んでしまったものの,アップデート内容は必見である.何より,Googleは多数のアプリケーションを有しており,Geminiでこれらとの連携が可能になるのは大きい.

1.4月9日に開放されたGemini-1.5Pro

■Geminiには,ハイスペックで,最大で1時間の動画や70万語のテキストを扱える次世代モデル「Gemini-1.5Pro」が存在したが,一部のユーザーしか使用できない限定テストの状態であった.4月9日になってAPI経由であれば誰でも使用できるようになった(逆にWeb版やアプリではまだ利用できなかった).音声を理解する機能(音声翻訳機能はOpenAIによるテストでGPT-4oと同等レベル)やファイルを処理しやすくするAPIが搭載され,さらに開発者がモデルの出力をより詳細に制御できるようにするシステム命令やJSONモードなども搭載された.そして5月15日のアップデートではこのGemini-1.5ProがWeb版およびアプリのGemini Advancedで利用できるようになった.

■Gemini-1.5Proは,GPT-4が用いているTransformerだけでなく,Mixture-of-Expertも取り入れており,入力に応じて最も関連性の高いエキスパートのニューラルネットワークのみを選択的に活性化させることでモデルの効率性が大幅に向上した.

2.5月15日のGemini Advancedのアップデート内容

(1)Gemini-1.5ProをGemini Advancedに導入
■Gemini-1.5ProがGemini Advancedに導入されたことで,ようやくWeb版やアプリでも使用が可能になった(これによりGemini-1.0Ultraは廃止).Gemini Advancedは有料プランであり,Googleが提供するストレージ(容量)を増やす有料サービスGoogle One(https://one.google.com/about?hl=ja)にアクセスして,AI Premiumプランに登録することで利用可能となる.
【AI】GoogleのAIであるGemini Advancedに高性能のGemini-1.5Proが搭載_e0255123_17164292.png
■料金は月額$20(2900円)であり,GPT-4が利用できるChatGPT Plus会員とほぼ同額であるが,Gemini Advanced利用を含めたGoogle Oneのサービス(クラウドサービスGoogle drive,メールサービスGmail,画像保存サービスGoogle Photoなど)を保存容量を2TBまで大幅に増やして利用できるようになる他,利用者専用の特典を受けられるため,ChatGPT Plusよりお得といえる.また,最初の2ヵ月間は試用期間として無料で利用できる.

(2)日本語対応が可能となった
■Gemini Advancedでは,最もハイスペックなGemini-1.0Ultraが使用できたが,必ずしもUltraで回答されるわけではなく,無料のGemini Proとの違いが分からない,GPT-4より見劣りする,といった声が聞かれていた.これはGemini-1.0Ultraが日本語対応していないかったため,Googleアカウントの言語設定を英語に設定した上で英語で質問する必要があったからである.このため,日本人には使いづらいものであったが,今回のアップデートではGemini-1.0UltraからGemini-1.5Proに変更されて日本語対応も可能となったことから,以前よりも日本語でのチャット性能が向上している.

(3)コンテキストウィンドウ強化
■機械学習の向上によりコンテキストウィンドウで最大100万トークンもの膨大な情報を処理可能になっている.GPT-4oが12万8000トークンであることを考えるとGemini-1.5Proは圧倒的な処理量で,これはハリーポッターの全書籍の8割の量に相当する.これによりこれまでよりも複雑な問題を解決できるようになり,情報の探索と分析の時間が節約され,生産性の向上が期待される.また,約100通の電子メールを要約することが可能である.

■なお,Google AI StudioかVertex AIのwaiting listに登録する必要があるが,コンテキストウィンドウをさらに倍の200万トークンに増やすことも可能である.

(4)Googleが提供している他のサービスとの連携
プロンプトに「@」マークを入力すると,連携できる機能が選択できるBoxが現れ,Googleの他のサービス機能を呼び出せる.連携できるのはGmail,Googleドキュメント,Googleドライブ,Googleフライト,Googleホテル,Googleマップ,YouTubeである.
【AI】GoogleのAIであるGemini Advancedに高性能のGemini-1.5Proが搭載_e0255123_17133471.png
(5)ファイルアップロードが可能に
■前述の連携機能でのGoogleドライブまたはデバイスから複数のGoogleドキュメント,PDFファイル,Wordファイルをシームレスにアップロードすることが可能となった.

(6)画像認識
■以前からGeminiでは画像認識が可能であったが,Gemini-1.5ProではGPT-4oと遜色ないレベルの画像認識機能にまで向上している

(7)動画解析
■動画解析機能は全AIの中で最も優れており,GPT-4oでは困難な長い動画の解析も可能である.

(6)数カ月以内にGemini Live搭載へ
■今回のアップデートでは未搭載であるが,Gemini Advancedユーザー向けの音声会話機能「Gemini Live」が数ヵ月以内に公開されるとのことである.また,2024年後半にはGemini Live使用時にカメラを利用できるようにする予定とのことである.

3.アプリについて

■Geminiは5月からGoogleアプリで使用することができるようになった.Googleアプリを開いて,一番上の検索の横にある星マークをタップするとGeminiに切り替わる.
iOS版(App Store)
https://apps.apple.com/jp/app/google-アプリ/id284815942
アンドロイド版(Google Play)
https://play.google.com/store/apps/details?id=com.google.android.googlequicksearchbox&hl=ja&gl=US

# by DrMagicianEARL | 2024-05-16 17:39 | 医学・医療とAI
【AI】無料で利用可能な革新的性能のAIモデル「GPT-4o」がリリース_e0255123_17311453.jpeg
■2024年5月14日にOpenAI社からGPT-4o(oはomni「全て」の略)がリリースされた.この日はGoogleが大規模アップデートを発表する日でもあったが,GPT-4oのその性能と無料開放されたことから完全に霞んでしまったようである(Googleアップデートもかなりのものなので後日別の記事でまとめる).OpenAIは1ヵ月前にGPT-4-turbo-2024-04-09をリリースしてかなり精度アップしていたが,今回はそれを大きく上回るマルチモーダルな大幅アップデートである.
Hello, GPT-4o. OpenAI 2024 May 13
https://openai.com/index/hello-gpt-4o/

■実は,このGPT-4oは事前公開されていた.多数のAIチャットボットを比較できるChatBot Arenaに,4月30日に突然GPT2-chatbotなるものが1日だけ出現し,GPT-4を上回る高性能であったことからGPT-5かと噂になっていた.そして1週間後の5月6日に派生版であるim-a-good-gpt2-chatbotとim-also-a-good-gpt2-chatbotの2つのモデルが登録され,偶然エラーメッセージでOpenAIのAPIに関連していることが発覚した.GPT-4oがリリースされた後,OpenAI社CEOのSam Altomanが,GPT2-chatbotはGPT-4oだったことを認めている.

1.GPT-4o無料開放とその使い方と制限

■ChatGPTのGPT-4は有料ユーザー(Plus会員:月$20≒3000円のサブスクリプション)しか使用できなかったが,GPT-4oは制限つきながら無料ユーザーにも開放された(全員に一度に開放できてはおらず,何日かかけて順次GPT-4oが選択できるようになる).ChatGPT-3.5よりも圧倒的に性能がいいため,ぜひ利用してみてほしい.

■無料ユーザーはチャット可能回数が有料ユーザーよりも少ない.1回のセッションで最大40回までで,制限に達した場合はChatGPT-3.5に自動的に切り替わる(有料ユーザーは無料ユーザーの5倍の200回使用できる).ただし,この制限は3時間ごとにリセットされるため,無料ユーザーでもよほど高頻度の使い方をしない限りは制限にはまずひっかからないと思われる.

■以下の機能は無料ユーザーは使用できない.特に今回のアップデートでの目玉であるリアルタイム翻訳を使用したいのであれば有料ユーザーになることをおすすめする.
画像生成機能:DALL-E3による画像生成機能の使用はできない
GPTsの作成:GPTsを使用することはできるが,自分で作成することはできない
音声会話機能:アプリでのGPT-4oによる音声会話機能は利用できない

2.GPT-4oの性能

■GPT-4oは,これまでChatGPTで一番よく使用されているテキストベースの会話はもちろんのこと,音声,画像認識能力も含めたマルチモーダル機能が大幅に強化された.モデル評価としてはELOスコアは他のAIモデルをはるかに凌駕する1310点を獲得している.
【AI】無料で利用可能な革新的性能のAIモデル「GPT-4o」がリリース_e0255123_17315343.jpg
(1)テキストベース

■まず目につくのは回答速度であり,ChatGPT-3.5と比較しても遜色のない速度になっている.回答精度も向上している.また,多言語に対応する能力が向上し,日本語はより流暢になっている.さらに,トークナイザーが圧縮され,日本語テキストは1.4分の1に圧縮され,より長い入力・出力が可能となった.

■テキスト評価のベンチマークでは,MMLU,GPQA,MATH,HUMANEval,MGSM,DROPの6項目で評価され,DROPこそClaude-3-Opusに勝てなかったものの,それ以外はすべてトップであった.注意点として,ベンチマークには様々な種類があり,必ずしもこの結果が絶対的な指標ではないことである.実際,GPT-4oのコード生成能力は,HUMANEvalでは最高評価だが,実際の使用感ではかなり間違いが多く,コード生成にはとても使えないという声が多い.
【AI】無料で利用可能な革新的性能のAIモデル「GPT-4o」がリリース_e0255123_17321599.png
MMLU:幅広いタスクにわたる言語理解能力を評価するためのベンチマーク
GPQA:一般的な質問応答能力を評価するためのベンチマーク
MATH:数学的な問題解決能力を評価するためのベンチマーク
HUMANEval:コード生成能力を評価するためのベンチマーク
MGSM:モデルの生成能力を多面的に評価するためのベンチマーク
DROP:段落にわたる離散的な推論能力を評価するためのベンチマーク
(2)音声認識
■音声入力(ChatGPTアプリで使用可能)は,アップデート前はChatGPT-3.5で平均2.8秒,ChatGPT-4で5.4秒の) の遅延があったが,GPT-4oではわずか0.232秒で応答でき,平均では0.320秒で,人間の応答時間とほぼ同じである.アップデート前のWhisper-v3は,「音声認識→テキスト変換→テキスト処理→音声変換」のプロセスがあったため遅延していたが,GPT-4oではテキストも音声も1つのモデルで処理するため,すべての入力と出力が同じニューラルネットワークによって処理されており,自然な対話が可能になっている.その結果リアルタイム翻訳が可能となり,その動画はSNSで多数拡散されて話題になっている(あまりのインパクトで世界中の人がリアルタイム翻訳機能を試したため,現在は過負荷でアクセスが困難になっている).
【AI】無料で利用可能な革新的性能のAIモデル「GPT-4o」がリリース_e0255123_17330258.png
(3)音声翻訳パフォーマンス
■音声翻訳パフォーマンスはアップデート前のWhisper-v3から各段に性能が向上し,それまでトップに君臨していたGeminiに匹敵するレベルである.これに加えて前述の高速な対話速度からリアルタイム翻訳が可能となり,画期的なものとなっている.ちなみに,このGPT-4oのリリースにより,言語学習・翻訳ツールなどを提供しているDuolingoなどの企業の株価が暴落している.
【AI】無料で利用可能な革新的性能のAIモデル「GPT-4o」がリリース_e0255123_17350162.png
(4)視覚機能パフォーマンス
■視覚機能(Vision機能)も大幅に向上し,M3Exam ベンチマークは、多言語と視覚の両方の評価のベンチマークであるM3Examでは全ての言語でGPT-4を上回った.視覚認識ベンチマークでは,他の全てのAIを上回るパフォーマンスであった.例えば食べ物の写真を撮ってアップロードし,レシピやカロリー計算までできたり,これまでほとんどできなかった漫画も認識して解説できるようになっている.画像内の文字や医療系画像の認識精度も向上している.
【AI】無料で利用可能な革新的性能のAIモデル「GPT-4o」がリリース_e0255123_17355434.png
【AI】無料で利用可能な革新的性能のAIモデル「GPT-4o」がリリース_e0255123_17373493.png
(5)APIのコストパフォーマンス向上
■GPT-4oのAPIは,GPT-4-turboの速さの2倍で,価格は半分,レート制限は5倍に増加している.

(6)GPTsのGPT-4o化
■GPT-4oリリース時点ではGPTsのベースのモデルはGPT-4のままである.ただし,OpenAIは今後数週間でGPTsをGPT-4oに切り替えるとのことである.

3.GPT-4oの弱点

■SNSではGPT-4oは高性能と話題で,優秀だというポストばかりが目につくが,最高性能とは限らない.各AIには得意不得意があり,GPT-4oとて例外ではない.1年前はChatGPTの独壇場であったが,現在は競合他社からも優秀なAIがリリースされており,用途に応じて最適なAIを使い分けていくのがベストと思われる.

(1)ウェブアクセスはいまだに苦手
■ウェブアクセスして情報を得る場合,依然としてGPT-4oはハルシネーションが多い.このあたりはGemini-1.5Proの方が断然上である.用いている検索エンジンもBingで,やはりGeminiが使うGoogle検索には劣る.PerplexityでGPT-4oを使うと精度は上がるが,同じPerplexityならSonar Large 32K(Llama3ベース)を選択した方が精度は上である.

(2)論文要約能力は微妙
本ブログを読まれる方は医学論文PDFを読み込ませて解説させたりデータを抜粋させたりする用途でAI使うことも多いだろう.GPT-4oでは読み込めるPDF容量が増えたので,だいたいの医学論文は読み込んで高速で回答できるようにはなったが,論文内容全体を圧縮することはできても,重要ポイントを把握して要約する性能に関してはClaude-3やCommand-R plusの方がだいぶ上である.

(3)コードを書くのが下手
■ベンチマークではコード生成能力は高いとの評価であったが,実際の使用感ではプログラマー達から酷評されている.マルチモーダル化の代償が何かあったのかもしれない.

(4)長い動画要約は不可
■動画を読み込ませての要約機能はGemini-1.5Proの方が圧倒的に性能が上である.動画が長いほどGPT-4oはうまく要約できない.

■以下は私の個人的な意見ではあるが,各タスクでのおすすめAIである.
一般知識質問→GPT-4o
論証→GPT-4oまたはClaude-3
画像認識→GPT-4o
音声対話→GPT-4o
動画要約→Gemini-1.5Pro
翻訳→GPT-4o
PDF要約→Claude-3
ウェブアクセス→Gemini-1.5ProまたはPerplexity Sonar Large 32K
論文検索→PerplexityまたはGPT×Consensus
コード作成→Claude-3またはGPT-4-turbo
小説作成→Command-R plusまたはLlama-3

4.アプリダウンロードの際の注意
■GPT-4oのリリースで,ChatGPTのアプリを利用する方も多いが,ChatGPTを名乗る非公式アプリが多数存在するため,間違えてダウンロードしないよう注意が必要である
iOS版(App Store)
https://apps.apple.com/jp/app/chatgpt/id6448311069
アンドロイド版(Google Play)
https://play.google.com/store/apps/details?id=com.openai.chatgpt&hl=en_US&pli=1

# by DrMagicianEARL | 2024-05-15 17:41 | 医学・医療とAI
【まとめ】劇症型A群溶血性連鎖球菌感染症(1)疫学,感染経路,リスク因子
Key Point
・劇症型A群溶血性連鎖球菌感染症は急激な経過をたどり,死亡率3割前後の重症疾患である.
・日本において,COVID-19の5類移行後から劇症型A群溶血性連鎖球菌感染症が急増している.
・A群溶血性連鎖球菌感染症は通常12月~初夏に流行するが,COVID-19の5類移行後は時期に関係なく流行がみられている.
・欧米での侵襲性A群溶血性連鎖球菌感染症の発生率は人口10万対で約2~4人である.
・感染経路は飛沫感染,接触感染が主体で,ヒト-ヒト感染もあり,病院,高齢者施設,保育園,軍事訓練施設,家族内での侵襲性/劇症型A群溶血性連鎖球菌感染症の集団発生が多数報告されている.
・日本において,感染症(敗血症)による妊産婦死亡の原因の最多はA群溶血性連鎖球菌であり,この菌による死亡の半数以上が入院後24時間以内に死亡している.
・侵襲性/劇症型A群溶血性連鎖球菌感染症のリスクに基礎疾患有無はあまり関連しておらず,小児の発症者ほど基礎疾患を有する割合は低かった.
■2024年に入って劇症型溶血性連鎖球菌感染症(Streptococcal Toxic Shock Syndrome:以下,STSS)が急増している.STSSは溶血性連鎖球菌による感染症の合併症であり,原因菌の中でも最も多いA群溶血性連鎖球菌Streptococcus pyogenes(Group A Streptococcus:以下,GAS)自体は,主に急性扁桃炎/咽頭炎で知られ,非常にポピュラーである.しかし,稀ながらこの菌による重症化病態が知られていて,その死亡率は23~44%と高率であり,死亡例の約半数が72時間以内に死亡している.このため,通称「人食いバクテリア」とも呼ばれ,本邦では全数報告疾患となっている.

■昔はGASはリウマチ熱や重症病態の原因として知られていたものの,20世紀を通じてその合併症の頻度は低下しており,抗菌薬治療の進歩や社会経済状況の改善の影響であまり重症化しない病原体になりつつあった.しかし,1980年代に入り,重篤化が懸念される報告がでてくるようになり,1989年にNEJM誌にロッキー山脈地域出身の20例のSTSSの報告[1]がなされ,毒性の強いGASの再出現を警告したのをきっかけに広く知られるようになった.日本では1992年に初めて報告されている.

■STSSは報道が比較的大きくなされているぶんSNSでも話題になっているが,医師からの誤った情報も散見されており,注意が必要である.以下では,日本国内の流行状況,疫学,症状,治療についてまとめた.

1.日本国内の流行状況

■GASによる扁桃炎/咽頭炎は非常にポピュラーである.GAS咽頭炎は本邦では小児科定点医療機関からの報告が集計されており,COVID-19流行前のデータでは冬季および春~初夏にかけての2峰性のピークがみられていた.COVID-19パンデミック下では流行はほとんど見られなくなったが,COVID-19が5類に移行した後,第19週(5/8~5/14)頃から増加に転じ,第23週(6/5~11:1.67)にピークに達し,その後減少傾向となるも,その後再増加しており,2024年第3週(1/15~21)以降は3.5~4.5付近の高水準で高止まりしている状況にある.

■GAS咽頭炎とSTSSの週報データを並行して見る際は注意が必要で,GAS咽頭炎はA群溶血性連鎖球菌のみが病原体であるのに対し,STSSはA群以外の溶血性連鎖球菌であるB群,C群,G群によるものも含んでいる.疫学上,A群が最も多いが,近年はA群以外も増加傾向にあり,年によってその頻度はばらつきがある.このため,GAS咽頭炎の流行とSTSSのデータが必ずしも相関しないことがある.

■国立感染症研究所は,GASによるSTSSの増加を受けて,GAS由来に特化した報告を行った[2,3].このデータを見ると,GASによるSTSS発生数は,COVID-19パンデミック~5類移行前は低水準で推移はしていたものの,200~400例で推移していたのに対し,2024年は既に第11週時点で335例発生している.STSSに占めるGAS由来の割合は,COVID-19パンデミック前の2018~2019年は約45%,2020~2022年は30%弱に低下したのに対し,2023年は36.3%に増加しており,2024年はGAS流行期のみデータになってしまうため過大評価となるが,第11週(3/11~17)までの集計で64.3%である.以上から,これまでの状況とは異なりGAS由来のSTSSがかなり増加していることがうかがえる.

■2024/1/1~3/15に国立感染症研究所に送付された92症例から分離されたGAS 92株のうち,M1型株が54株 (58.7%)であり,うち43株(79.6%)がM1UK系統株であった[2]

■年齢分布は,2023年秋頃までは50歳未満が目立っていたが,その後は50歳以上にもみられるようになっている[2]

■GAS以外も含むSTSS全体の都道府県別データは,人口10万人あたりのSTSS報告数は全国で0.34であり,多いのは沖縄県(0.91),佐賀県(0.72),群馬県(0.71),富山県(0.66),愛媛県(0.65)などであり,少ない県は岩手県,福井県,山梨県,鳥取県が報告ゼロ,奈良県(0.07),秋田県(0.10)などである.

2.疫学

■GAS由来の重症病態については国によって集計方法が異なることに注意が必要である.多くの国はSTSSではなく,侵襲性A群溶血性連鎖球菌(invasive Group A Streptococcus:以下iGAS)感染症を集計してる[4].iGAS感染症とは,GASが通常無菌的な部位(血液,脳脊髄液,関節液など)に侵入した場合の感染症を指す.具体的には,細菌性肺炎,菌血症,皮膚軟部組織感染症,髄膜炎,腹膜炎,骨髄炎,関節炎などがある.STSSはiGAS感染症にショックや多臓器不全を伴うものである.

■iGAS感染症の発生率は先進国では人口10万人あたり2~4人程度で推移している[5].また,発展途上国や,米国・豪州などの先進国に住む先住民族ではかなり高い割合が観察され,その範囲は10万人当たり12~83人である.季節性があり,欧州や北米では12月から4月に増加する[6,7](COVID-19パンデミック前の本邦も同様の季節性パターンである).性差では,男性に多い傾向がみられている.年齢別の発生率はJ字型の分布を示し,高齢者と幼児での発生率が高い.

■O'Loughlinら[8]によるiGAS感染症5400例の報告では,iGAS感染症患者のうち,5.7%がSTSSに進展し,iGAS感染症の死亡率が13.7%であったのに対し,STSSの死亡率は36%であった.

3.感染経路とクラスター事例

■GASの感染経路については,判明している経路のほぼすべてが飛沫感染,接触感染(外傷に伴う創部感染や感染者が接触した環境からの含む)である.SNSで「STSSはヒト-ヒト感染しない」と主張する医師がいるが大間違いである.前述の通りSTSSはGAS感染症の合併症であり,原因菌はヒト-ヒト感染する上,後述する通り基礎疾患がない患者でもSTSSに進展し,その傾向は小児ほど強い.

病院や高齢者施設,軍事訓練施設,保育園,家族内でのSTSS/iGAS感染症のクラスター(集団発生)の報告も多数あり[9-25],この中には患者から医療従事者や施設スタッフへの感染も複数報告されていることから,当該患者の診療・ケアにあたっては適切な感染対策を講じる必要がある.これらの報告では,幅広い年齢層でクラスターが発生しており,若年であっても致死率は高かった.

■iGASによる産褥熱の症例も発生しており,時には健康な若い女性が死亡する場合がある[26].日本の317例の妊産婦死亡事例の解析[27]では,死亡原因の7.5%が敗血症であり,原因菌はGASが54.2%と最多であった.GASによる死亡妊産婦のうち,発症時期は76.9%が出産前,23.1%が産後であり,53.8%が入院後 24 時間以内に死亡,入院から死亡までの時間の中央値は 12 時間であった.

4.リスク因子

■iGAS感染症やSTSSは免疫が低下した患者にしか起こらないと思われていることがあるが,そんなことは決してなく,免疫不全を含む基礎疾患がない患者においてもそれなりに発生する.もちろん,(明確ではないものの)リスク因子は多数提案されており,アルコール依存症,悪性腫瘍,糖尿病,皮膚病変,最近の出産,ステロイド使用,水痘などが挙がっている[28,29].しかし,iGAS感染症患者の23~33%は基礎疾患がないと報告している[6,8,9]

■また,Lamagniら[30]の報告では,16歳未満のiGSA感染症患者の46%はリスク因子を有しておらず(16-64歳では15%,65歳以上では29%がリスク因子なし),基礎疾患有無はSTSSの有意なリスク因子ではなかったと報告している.O'Loughlinら[8]の報告でも,10歳未満のiGAS感染症患者は,10歳以上の患者に比して有意に基礎疾患を持つ割合が少なく,わずか22%であった(22% vs 72%,P<0.001).このように,小児では基礎疾患にほぼ関係なくiGASやSTSSを発症する

[1] Stevens DL, Tanner MH, Winship J, et al. Severe group A streptococcal infections associated with a toxic shock-like syndrome and scarlet fever toxin A. N Engl J Med 1989; 321: 1-7 (PMID: 2659990)
[2] 国立感染症研究所.A群溶血性レンサ球菌による劇症型溶血性レンサ球菌感染症の50歳未満を中心とした報告数の増加について.IASR 2024; 45: 29-31
https://www.niid.go.jp/niid/ja/group-a-streptococcus-m/group-a-streptococcus-iasrs/12461-528p01.html
[3] 国立感染症研究所.国内における劇症型溶血性レンサ球菌感染症の増加について.2024年3月29日
https://www.niid.go.jp/niid/ja/group-a-streptococcus-m/2656-cepr/12594-stss-2023-2024.html
[4] Miller KM, Lamagni T, Cherian T, et al. Standardization of Epidemiological Surveillance of Invasive Group A Streptococcal Infections. Open Forum Infect Dis 2022; 9(Suppl 1): S31-S40 (PMID: 36128405)
[5] Steer AC, Lamagni T, Curtis N, et al. Invasive group a streptococcal disease: epidemiology, pathogenesis and management. Drugs 2012; 72: 1213-27 (PMID: 22686614)
[6] Lamagni TL, Darenberg J, Luca-Harari B, et al; Strep-EURO Study Group. Epidemiology of severe Streptococcus pyogenes disease in Europe. J Clin Microbiol 2008; 46 :2359-67 (PMID: 18463210)
[7] Lamagni T, Tyrrell G, Lovgren M, et al. Seasonal patterns of invasive Streptococcus pyogenes disease in the northern hemisphere. 19th European Congress of Clinical Microbiology and Infectious Diseases (p. P1534). Helsinki: European Society of Clinical Microbiology and Infectious Diseases.
[8] O'Loughlin RE, Roberson A, Cieslak PR, et al; Active Bacterial Core Surveillance Team. The epidemiology of invasive group A streptococcal infection and potential vaccine implications: United States, 2000-2004. Clin Infect Dis 2007; 45: 853-62 (PMID: 17806049)
[9] Schwartz B, Elliott JA, Butler JC, et al. Clusters of invasive group A streptococcal infections in family, hospital, and nursing home settings. Clin Infect Dis 1992; 15: 277-84 (PMID: 1520763)
[10] Daneman N, McGeer A, Low DE, et al; Ontario Group A Streptococcal Study Group. Hospital-acquired invasive group a streptococcal infections in Ontario, Canada, 1992-2000. Clin Infect Dis 2005; 41: 334-42 (PMID: 16007530)
[11] Mahida N, Beal A, Trigg D, et al. Outbreak of invasive group A streptococcus infection: contaminated patient curtains and cross-infection on an ear, nose and throat ward. J Hosp Infect 2014; 87: 141-4 (PMID: 24928787)
[12] Lacy MD, Horn K. Nosocomial transmission of invasive group a streptococcus from patient to health care worker. Clin Infect Dis 2009; 49: 354-7 (PMID: 19580415)
[13] Thigpen MC, Thomas DM, Gloss D, et al. Nursing home outbreak of invasive group a streptococcal infections caused by 2 distinct strains. Infect Control Hosp Epidemiol 2007; 28: 68-74 (PMID: 17230390)
[14] Dooling KL, Crist MB, Nguyen DB, et al. Investigation of a prolonged Group A Streptococcal outbreak among residents of a skilled nursing facility, Georgia, 2009-2012. Clin Infect Dis 2013; 57: 1562-7 (PMID: 24021484)
[15] Greene CM, Van Beneden CA, Javadi M, et al. Cluster of deaths from group A streptococcus in a long-term care facility--Georgia, 2001. Am J Infect Control 2005; 33: 108-13 (PMID: 15761411)
[16] Auerbach SB, Schwartz B, Williams D, et al. Outbreak of invasive group A streptococcal infections in a nursing home. Lessons on prevention and control. Arch Intern Med 1992; 152: 1017-22 (PMID: 1580705)
[17] Centers for Disease Control and Prevention (CDC). Invasive group A streptococcus in a skilled nursing facility--Pennsylvania, 2009-2010. MMWR Morb Mortal Wkly Rep 2011; 60: 1445-9 (PMID: 22031216)
[18] Arnold KE, Schweitzer JL, Wallace B, et al. Tightly clustered outbreak of group A streptococcal disease at a long-term care facility. Infect Control Hosp Epidemiol 2006; 27: 1377-84 (PMID: 17152038)
[19] Deutscher M, Schillie S, Gould C, et al. Investigation of a group A streptococcal outbreak among residents of a long-term acute care hospital. Clin Infect Dis 2011; 52: 988-94 (PMID: 21460311)
[20] Crum NF, Russell KL, Kaplan EL, et al. Pneumonia outbreak associated with group a Streptococcus species at a military training facility. Clin Infect Dis 2005; 40: 511-8 (PMID: 15712072)
[21] Harkness GA, Bentley DW, Mottley M, et al. Streptococcus pyogenes outbreak in a long-term care facility. Am J Infect Control 1992; 20: 142-8 (PMID: 1636935)
[22] Aguero J, Ortega-Mendi M, Eliecer Cano M, et al. Outbreak of invasive group A streptococcal disease among children attending a day-care center. Pediatr Infect Dis J 2008; 27: 602-4 (PMID: 18520444)
[23] Ichiyama S, Nakashima K, Shimokata K, et al. Transmission of Streptococcus pyogenes causing toxic shock-like syndrome among family members and confirmation by DNA macrorestriction analysis. J Infect Dis 1997; 175: 723-6 (PMID: 9041354)
[24] DiPersio JR, File TM Jr, Stevens DL, et al. Spread of serious disease-producing M3 clones of group A streptococcus among family members and health care workers. Clin Infect Dis 1996; 22: 490-5 (PMID: 8852968)
[25] Roy S, Kaplan EL, Rodriguez B, et al. A family cluster of five cases of group A streptococcal pneumonia. Pediatrics 2003; 112(1 Pt 1): e61-5 Erratum in: Pediatrics 2003; 112: 70 (PMID: 12837907)
[26] Eriksson BK, Norgren M, McGregor K, et al. Group A streptococcal infections in Sweden: a comparative study of invasive and noninvasive infections and analysis of dominant T28 emm28 isolates. Clin Infect Dis 2003; 37: 1189-93 (PMID: 14557963)
[27] Tanaka H, Katsuragi S, Hasegawa J, et al. The most common causative bacteria in maternal sepsis-related deaths in Japan were group A Streptococcus: A nationwide survey. J Infect Chemother 2019; 25: 41-44 (PMID: 30377069)
[28] Bucher A, Martin PR, Høiby EA, et al. Spectrum of disease in bacteraemic patients during a Streptococcus pyogenes serotype M-1 epidemic in Norway in 1988. Eur J Clin Microbiol Infect Dis 1992; 11: 416-26 (PMID: 1425712)
[29] Svensson N, Oberg S, Henriques B, et al. Invasive group A streptococcal infections in Sweden in 1994 and 1995: epidemiology and clinical spectrum. Scand J Infect Dis 2000; 32: 609-14 (PMID: 11200369)
[30] Lamagni TL, Neal S, Keshishian C, et al. Severe Streptococcus pyogenes infections, United Kingdom, 2003-2004. Emerg Infect Dis 2008; 14: 202-9 (PMID: 18258111)
# by DrMagicianEARL | 2024-04-09 13:13 | 感染症
Stanford CRFM and MosaicMLが共同で,バイオメディカル分野に特化した27億パラメータの自己回帰型言語モデル「BioMedLM」をリリースした.このモデルの特記すべき特徴は非常に少ないパラメータ数と限られた学習範囲というコンパクトさにもかかわらず,GPT-4やMed-PaLM 2に引けを取らない性能を示したという点である.このため,計算コストが低く,プライバシー保護にも優れ,経済的で環境にも優しい.また,学習データが公開されているため透明性が高い.BioMedLMは既に使用可能で,コンパクトであるがゆえに,インストールしてオフラインで使用するこも可能である

1.モデルの特徴

(1)学習データ
■BioMedLMは,PubMedデータベースの要約と全文のみを学習データとして使用している.学習には,2022年11月時点でのPubMedデータのうち、The Pileと呼ばれるデータセットに含まれる部分が使用された.学習データのトークン数は346億であり,学習中に8.67回データを繰り返し使用している.

(2)モデルアーキテクチャ
■BioMedLMは,GPT-2と同様のデコーダのみのTransformerアーキテクチャを採用している.GPT-2は自己回帰型言語モデルの代表例で,次のトークンを予測するように学習されいる.BioMedLMのパラメータ数は27億で,位置エンベディングには,学習された絶対位置エンベディングを使用している.

(3)トークナイザ
■BioMedLMは,PubMedの要約から学習したバイオメディカル分野に特化した語彙数28896のByte Pair Encoding (BPE) トークナイザを使用している.このトークナイザにより,"chromatography"や"nanoparticles"などの専門用語が単一のトークンとして扱われ,汎用の語彙では複数のサブワードに分割されてしまうような問題が回避されている.ドメイン特化型トークナイザの使用により,下流タスクの性能が向上したと報告されている.

2.性能

(1)多肢選択問題解決能力
■BioMedLMは,臨床医学の多肢選択問題データセットMedMCQAの開発セットにおいて57.3%の正解率を達成し,この結果は,GPT-4やMed-PaLM 2といった大規模モデルに迫る高い性能である.また,様々な専門分野の試験問題を集めたベンチマークであるMMLUの医学遺伝学カテゴリにおいては69.0%の正解率を達成し,GPT-4やMed-PaLM 2に匹敵する高い性能を示している.

■この結果はパラメータ数や学習データの少なさからすると驚愕すべき性能である.BioMedLMのパラメータ数は27億であるのに対し,GPT-4は数千億,Med-PaLM 2は5400億とされている.また,GPT-4やMed-PaLM 2は,ウェブ上の大規模な一般的なテキストデータで学習されているのに対し,BioMedLMはPubMedのバイオメディカル分野の文献のみで学習されている.すなわち,BioMedLMは10倍以上小さいモデルで,かつ限定された分野の学習データで汎用の大規模モデルに引けを取らない性能を示している

(2)医療の一般的質問への回答能力
■医療に関する一般的な質問と医療専門家による回答のペアを集めたデータセットHealthSearchQAの質問に対して,BioMedLMは複数文からなる回答を生成することができ,複数の治療法を提示してそれぞれについて簡潔に説明するといったことが可能であった.また,重症例には侵襲的治療が必要になる可能性があるが,ほとんどの場合は保存的治療で改善が得られるといった補足情報も提供する.

3.ファインチューニング

■BioMedLMを,特定のバイオメディカルNLPタスクに対してファインチューニング(事前学習済みのモデルを特定のタスクに合わせて追加学習させること)することができる.ファインチューニングには,タスク固有のデータセットを使用する.例えば,薬物-タンパク質相互作用の予測タスクでは,薬物とタンパク質のペアとその相互作用の有無をラベルとしたデータセットを使用する.BioMedLMをこのデータセットでファインチューニングすることで,薬物-タンパク質相互作用の予測に特化したモデルを得ることができる.

4.使用方法

■Hugging Faceのモデルページ(https://huggingface.co/StanfordBioNLP/BioMedLM)から,BioMedLMをダウンロードまたはオンラインで使用可能である(ダウンロードする場合はHugging Faceの無料アカウントが必要).オンラインで使用する場合は,Hugging FaceのAPI(無料では呼び出し回数に制限あり)を介してBioMedLMを呼び出すことができる.また,ローカル環境にBioMedLMをインストールして使用することもできる.BioMedLMは,Transformersライブラリ(https://huggingface.co/docs/transformers/index)と互換性があるため,このライブラリを使用してBioMedLMを扱うことができる.

■インストールしてオフラインで使用する場合必要な環境は以下の通りである.Python 3.7以上
PyTorch 1.8.1以上
Transformersライブラリ 4.5.1以上
CUDA(GPUを使用する場合)

■インストール手順としては,まずPythonをインストールする.次に,PyTorchをインストールする.GPUを使用する場合は、CUDA対応バージョンをインストールする.さらにTransformersライブラリをインストールし,以下のコマンドを実行する.
pip install transformers
そして,BioMedLMのモデルファイルをHugging Faceのモデルページ(https://huggingface.co/StanfordBioNLP/BioMedLM)からダウンロードし,モデルファイルを任意のディレクトリに解凍する.BioMedLMをオフラインで使用するにはTransformersライブラリを使用する.以下は,BioMedLMを使用してテキストの埋め込みを得る例である.
from transformers import AutoTokenizer, AutoModel

model_path = "/path/to/biomedlm" # ダウンロードしたモデルファイルのパス
tokenizer = AutoTokenizer.from_pretrained(model_path)
model = AutoModel.from_pretrained(model_path)

text = "This is a sample text."
inputs = tokenizer(text, return_tensors="pt")
outputs = model(**inputs)
embeddings = outputs.last_hidden_state
BioMedLM:バイオメディカル分野のテキストで学習した27億パラメータの大規模言語モデル
Bolton E, Venigalla A, Yasunaga M, et al. BioMedLM: A 2.7B Parameter Language Model Trained On Biomedical Text. arXiv:2403.18421 2024 Mar.27
https://arxiv.org/abs/2403.18421

Abstract

GPT-4やMed-PaLM 2のようなモデルは,様々な生物医学NLPタスクにおいて素晴らしい性能を示してきた.しかし,これらのモデルは数千億のパラメータを持ち,実行には計算コストがかかり,ユーザーは入力データをインターネット経由で送信する必要があり,未知のデータソースで学習される.より小さく,より的を絞ったモデルで対抗できるのだろうか?この疑問を解決するために,我々はPubMedの抄録と全文のみを対象に学習させた27億パラメータのGPT型自己回帰モデルBioMedLMを構築し,リリースした.BioMedLMを微調整すると,MedMCQA (dev)で57.3%,MMLU Medical Genetics試験で69.0%のスコアを達成するなど,はるかに大規模なモデルに引けを取らない強力な多肢選択式生物医学問題解答結果を出すことができた.BioMedLMはまた,医療トピックに関する患者の質問に有用な回答を生成するように微調整することもできる.このことは,より小さなモデルが,生物医学のような特定の自然言語処理アプリケーションにおいて,透明性が高く,プライバシーを保護し、経済的で環境に優しい基盤として機能する可能性があることを示している.このモデルはHugging Face Hubで利用可能である.

# by DrMagicianEARL | 2024-04-03 18:14 | 医学・医療とAI

by DrMagicianEARL