人気ブログランキング | 話題のタグを見る
ブログトップ

EARLの医学ノート

drmagician.exblog.jp

敗血症をメインとした集中治療,感染症,呼吸器のノート.医療におけるAIについても

【AI】医学/医療分野でも非常に有用なChatGPTの有力対抗馬Claude2の登場

医学/医療分野でも非常に有用なChatGPTの有力対抗馬Claude2の登場

■ChatGPTの有力な対抗馬と目されている大規模言語モデルによる対話型AI「Claude2」が2023年7月11日にAnthropich社によってリリースされた.このAIは,その読み込み能力においてChatGPTを圧倒的に凌駕しており,医学/医療分野でも十分に威力を発揮するAIと思われるので紹介する.

■なお,Claude2は前評判通り非常に優秀なスペックであるが,ChatGPTと比較すると当然ながら得意不得意はある.どのように使うかで使い分けしていけば両方をうまく活用できるようになるだろう.

1.Claude2は実は既に日本でもアプリを使えば7日間までなら無料で利用可能

■Claude2を開発したAnthropic社は,ChatGPTを開発したOpenAI社にいたエンジニアが創業したAI企業で,米Googleや米Zoomが出資している.現在,Claude2は米英に限定しての提供だが,日本でもpoe.com(スマートフォンでもウェブ上でも利用可能なアプリhttps://poe.com/)をインストールすれば,一定時間あたりの利用回数に制限はあるものの利用可能である(インストールしたら,PCでは左から,スマートフォンでは左上の「三」のボタンをタップからでClaude-2-100kを選択する).Claude2は日本語にも対応している.ChatGPTと同じく,英語で質問する方が精度はやや高いとの見方が多いが,現時点での使用感は特に不自由はない.

■poe.comはClaude2のAPI(有料)を利用している.このため,poe.comは7日間まで無料で,その後は有料プランに切り替わるのでご注意を.有料プランはサブスク形式で,年間30000円プラン(月2500円)か月間3000円プランから選択する.もしサブスクを利用するなら年間プランの方が安いが,現在Anthropic社はClaude2を日本など米英以外の国でも使用可能になるよう鋭意努力中とのことで,どれくらいの期間になるかは分からないため,月間3000円プランを選択して様子を見る方法もある.また,使用回数については,APIを使用しすぎないようにする制限のため,可能な質問数は9時間ごとに30回までとなっている.

2.論文やガイドライン等長い文書読み込みなら断然ChatGPTよりClaude2

■Claude2はChatGPTの有力な対抗馬と目されている.その性能は概ねGPT-3.5より上,GPT-4より下,との見方が多い.しかし,ChatGPTをはるかに上回る10万トークン(本1冊まるごと読み込めるレベル)を一度に読み込める能力を有しており,これは大容量のファイルの読み込みや記憶の点においてChatGPTより圧倒的なアドバンテージである.

■URLを提供すれば情報を共有でき,大量の情報を処理することが可能である.ファイルを直接アップロードはできないが,クラウドストレージにアップロードしてシェアリンクを張り付ければ読み込めるようになる.特に論文,さらにはガイドラインなど長い文章を要するpdfファイルを読み込む能力はChatGPTでは上限が厳しく,GPT-4の機能であるCode Interpreterやサードパーティープラグインでもpdfファイルの全内容の読み込みが難しいことは多々あることから,Claude2を利用した方がよいだろう.また,定期的に情報更新も行っていて最新の情報を扱っている点もChatGPTより優れている.
【AI】医学/医療分野でも非常に有用なChatGPTの有力対抗馬Claude2の登場_e0255123_15451740.png
■推論能力においては,米国司法試験の多肢選択問題において,Claude2は76.5%のスコアをだしており,これはChatGPT-4と同等のスコアである.また,大学院入学希望者向け試験(GRE General Test)では,リーディングとライティングでテストを受けた全体の受験者の上位10%に入っており,数学的な概念や問題解決能力を測る量的推論試験では受験者の中央値と同様のスコアであった.

■なお,Claude2は回答を箇条書きで生成する傾向が非常に強い.その分要点がまとまっていてわかりやすいが,事前に指示しないと,文章として生成してくれないため注意が必要である.

3.データの解析

■Claude2は前バージョンのClaude1.3よりもコード作成や解析機能が向上している.Pythonのコーディングテストである「CodexHumanEval」で71.2%のスコアを記録している.算術能力としては,小学生向け算数問題GSM8kで88.0%というスコアであった.しかし,触ってみるとその精度はChatGPTほどではない.それでも,大きなデータの読み込みがChatGPTよりもはるかに早いため,データ解析もやりやすいことから,比較的単純な解析であればClaude2はおすすめである.ただし,グラフや表などを表示する能力はない(表示するためのコードは示してくれるため,そのコードをGPT-4 Code InterpreterやPythonに入力すれば表示可能).
【AI】医学/医療分野でも非常に有用なChatGPTの有力対抗馬Claude2の登場_e0255123_15474931.png
4.その他

■余談ではあるが,Claude2にスペックを質問すると,なぜかChatGPT-3のスペックを回答してきたりする他,自身がChatGPT-3.5と思い込んでいるかのうような回答を生成することがよくあった.Claude2はあまりスペックを公表していないため,ハルシネーションの可能性もあるが,ChatGPT-3がここまで出てくるあたり,Claude2がChatGPT-3の出力をfinetuningしているしている可能性もあるかもしれない.真相は不明だが,Claude2に自身の機能について尋ねても正確な回答は返ってこないと思われるため注意が必要である.
by DrMagicianEARL | 2023-07-17 15:51 | 医学・医療とAI

by DrMagicianEARL