人気ブログランキング | 話題のタグを見る
ブログトップ

EARLの医学ノート

drmagician.exblog.jp

敗血症をメインとした集中治療,感染症,呼吸器のノート.医療におけるAIについても

ChatGPT新モデル「OpenAI o1」が登場
OpenAI o1をうまく活用するコツ
・科学分野(特に数学)やコーディングタスクの場合に使用推奨
・科学分野以外のタスクや複雑な計算に関してはChatGPT-4oを推奨
・広範な知識を必要としないタスクならo1-previewよりもo1-miniを推奨(使用回数制限の関係)
・GPT-4oと違い,OpenAI o1では「シンプルかつ明確」なプロンプトを推奨
■ChatGPTに新しいモデル「OpenAI o1」が2024年9月12日にリリースされた(一方でGPT-5はいつになったらでるんだとも思いましたが).以下に,利用方法,特徴,ベンチマーク評価,実際の使用感を紹介する.

1.OpenAI o1の利用方法

■ChatGPTでは「o1-preview」として選択できる.また,より軽量で速度が速く低コストの,数学やコーディングの性能は維持されたo1-miniも同時にリリースされている.現在,OpenAI o1(以下,o1と略す)を使用できるのは,月$20のサブスクリプションプランであるChatGPT plus会員(有料会員)に限定されているが,将来的に無料会員にも開放予定とのことである.

■なお,現在,o1は無制限に使用できるわけではない.o1-previewは1週間に30回まで,o1-miniは1週間に50回までしか使用できないことに注意が必要である.このため,後述の通り得意分野が異なるGPT-4oと使い分けた方がいいだろう.また,o1-miniは軽量化した上でSTEM推論に最適化して数学やコーディング性能を維持しているモデルのため,広範な知識を必要としない数学・コーディングタスクであれば,使用回数上限が多いo1-miniを優先的に使う方がいいだろう

■o1のAPIに関しては値段は高く,$15/1M入力トークン,$60/1M出力トークンであり,GPT-4oに比して3~4倍の料金となっている.o1-miniであれば$3/1M入力トークン,$12/1M出力トークンと比較的安価である.

2.OpenAI o1の特徴

■OpenAI o1はコードネーム「Strawberry」として推論に焦点をあてて開発されていたAIモデルである.複雑な推論を行うために強化学習でトレーニングされており,回答する前に長くかつ深く考える特徴がある.特にchain-of-thought(思考の連鎖)はこれまではプロンプトやcustom instructionsなどで指示しないと施行しなかったが,OpenAI o1はデフォルトでこれを行う.この結果,以下の通り,数学・化学・物理・生物学などの科学分野タスク,コーディングにおいて大幅に精度が向上したとしている.

■一方で,実世界の知識など複数分野ではGPT-4oを下回っており,タスクによってGPT-4oとo1の使い分けが必要である.

■また,o1は現時点ではネットアクセス(Web browsing)やファイルアップロード,Advanced Data Analysis(Code Interpreter)にもまだ対応していない

■o1はGPT-4oとは異なり,単純なプロンプトで最高のパフォーマンスを発揮するようにできており,かつ思考プロセスが定まっている.プロンプトはシンプルかつ明確(区切り記号を使うなど)にしておかないと,パフォーマンスを妨げてしまう

3.ベンチマーク評価

■o1は,競技プログラミング問題(Codeforces)で89パーセンタイルにランクインし,米国数学オリンピック予選で全米上位500名に入る成績を収めている.具体的には,2024年の問題において,GPT-4oの正答率は平均12%(15問中1.8問)であったのに対し,o1は平均74%(15問中11.1問),64サンプルでのコンセンサスでは83%(15問中12.5問),1000サンプルの中から学習したスコアリング関数で再ランク付けすると93%(15問中13.9問)の正答率を記録した.このスコアは本選進出基準を上回る成績である.また,物理学・生物学・化学の問題に関する評価基準(GPQA)では,人間の博士号レベルの精度を超えている.

■また,o1を化学,物理,生物学の専門知識を問うGPQAダイヤモンドという難解な知能ベンチマークで評価したところ,o1はこれらの専門家を上回る成績を収め,このベンチマークで初めて人間を超えたモデルとなった(あくまで博士号を持つ人間が解ける問題の一部においてモデルの方が優れているということ).他のいくつかの機械学習ベンチマークでも、o1は最先端の性能を上回っており,視覚認識能力が有効な場合,o1はMMMUで78.2%のスコアを記録し,初めて人間の専門家と競えるモデルとなった.また,MMLU57サブカテゴリのうち54でGPT-4oを上回った.

■国際的なプログラミングコンテストでは上位11%に入る成績を達成している.

4.使用感

■o1モデルは主に科学分野でのバージョンアップであり,それ以外についてはGPT-4oが勝っていること,プロンプト入力のコツも異なることから,科学分野,特に数学的問題解決能力やコーディングの試行を行い,より精度が上がるプロンプトを模索してきた.それをo1にも行った.その上で使用感を述べる.

(1)コーディング
■GPT-4oはコーディングが使えないと評価されてきたが,o1では大幅に向上したようであり,Claude-3.5-Sonnetと同等レベルかもしれない.o1とClaude-3.5-Sonnet,v0を組み合わせることで大きく幅が広がるだろう.ただし,私はプログラマーではなく,生成されたコードを使用して試しているだけなので,より正確な評価はプログラミングのプロの方の評価を参照されたい.

(2)推論能力
■chatGPT-4oと違い,o1は思考の連鎖と修正を繰り返し,解答にたどりつく.このためかなりきっちりした推論を出力する.ただし,超難問が解けるようになるわけではないである.

(3)探索が苦手
■「AIは選択するというプロセスが非常に苦手」ということに関連するが,「すべて求めよ」という問題文をGPT-4oは非常に苦手としていて,いくつかの具体的な数値で試行を行い,それだけで結論づけてしまい,それですべてを網羅しているのか,他に数値はないのかを論証しようとしない.残念ながらo1でもそれは同様である.この手の問題文は,プロンプトを「すべて求め,それ以外には存在しないことも証明せよ」と書き足さなければいけない.

(4)計算力(算術能力)は依然として低い
■ChatGPTに限らず,AIは推論力は向上しても,計算力は非常に悪い.これは残念ながらo1でも同様である.ChatGPT-4oはAdvanced Data Analysis(Code Interpreter)があるため,正確な計算はそちらでできる.o1はAdvanced Data Analysisは対応していないが,「Advanced Data Analysisを用いると」「mathモジュールを用いると」という文言とともに誤った応えを出力してしまうハルシネーションがしばしば起こる.このため,複雑な計算を要するタスクではGPT-4oを使用した方がよい

(5)回答が終了しない
■o1の思考プロセスの概略は見ることはできるが,詳細なプロセスは非公開であるため,推測になるが,思考の連鎖プロセスの関係で,思考が終了せず動きっぱなしになっている可能性があり,回答文生成が終わっても次のプロンプト入力ボタンが回答生成中止ボタンのままというトラブルがよく起こる(特に難問を解決させるタスクで発生しやすい).
# by DrMagicianEARL | 2024-09-13 11:42 | 医学・医療とAI
AI検索最強のPerplexityに強力なライバルが登場「Genspark」
【AI】AI検索最強のPerplexityに強力なライバルが登場「Genspark」_e0255123_11174822.png
■AI検索では1年余りの間,Perplexityが無双状態であったが,ここにきてその地位を脅かす強力なライバル「Genspark」が2024年6月18日に登場した.Genspark社は,Baidu(百度)の元幹部が設立した企業(本社はカリフォルニア州パロアルト)である.

■Gensparkの売りは「無料」「速い」「Sparkpagesの充実性」であろう.特に,Sparkpages機能は,医学情報においては,レビュー論文ばりの詳細情報を即座に生成することができる

1.Gensparkの機能

(1)複数のAIモデルを使用して検索情報からSparkpagesを生成
■Gensparkは,同社で訓練されたモデルに加え,OpenAI社,Anthropic社などのサードパーティーモデルも含む複数のAIモデルプロバイダーを使用して情報をインデックス化して要約する.結果は,AI生成サマリーの提示に加えて,1ページにカスタマイズされた,Wikipediaのような詳細なSparkpagesを生成してリンクを表示する.権威性や人気が高いWebページを優先し,信頼性の低い情報を排除している.また,生成したSparkpagesにはAIによるCopilot機能がついている他,Sparkpagesを他者にシェアすることもできる.

(2)ユーザーの検索行動を学習
■Gensparkは,ユーザーの検索行動を学習し,個々のニーズに合わせたカスタマイズされた情報を提供できる.

(3)無料で使用可能
■現時点ではGensparkはβ版であり,無料で提供されている.ゆくゆくはサブスクリプションプランも組むとのことである.

(4)生成速度が非常に速い
■実際に触ってみると分かるが,Gensparkの検索結果生成速度は非常に速い.検索結果のサマリーだけならPerplexityと同程度と感じるかもしれないが,それに加えて詳細なSparkpagesも同時に完成させるため,トータルの速度は断然Gensparkが早い.

2.Gensparkでの医学情報の検索

■Gensparkは旅行や画像,商品の情報を前面に押し出しているが,医療・医学情報にも強く,検索結果のサマリー生成とその引用サイトはPerplexityにひけをとらない質の回答を生成する他,Sparkpagesはかなり充実しており,例えば治療薬についての検索だと「治療目的」「効果のエビデンス」「投与方法」「研究結果の比較」「副作用と注意点」「ガイドラインの推奨」「まとめと結論」といった,さながらレビュー論文ばりのまとめを即座に生成する.PerplexityにもPerplexity Pagesがあるが,Sparkpagesに比べてかなり時間がかかる.

■↓検索結果サマリー(Directed Answer by AI)
【AI】AI検索最強のPerplexityに強力なライバルが登場「Genspark」_e0255123_11243485.png
■↓Sparkpages
【AI】AI検索最強のPerplexityに強力なライバルが登場「Genspark」_e0255123_11260485.png

■Perplexityよりも劣る点では以下のことがあげられる.
・AcademicやWritingといったフィルター機能がない
・Perplexityに比して情報の最新性がやや劣る
・ファイルアップロード機能がない
・APIがない
・アプリがない

# by DrMagicianEARL | 2024-06-28 11:34 | 医学・医療とAI
最新のClaude-3.5-Sonnetをどう使うか?課金すべきか?
【AI】最新のClaude-3.5-Sonnetをどう使うか?課金すべきか?_e0255123_18174338.png
■2024年6月21日にAnthropic社のAIモデルClaudeシリーズに最新のClaude-3.5-Sonnetが登場した(今年度末には3.5でのHaikuやOpusもリリース予定).精度向上のみならず,新たなArtifactよるPreview機能がビジュアル的にインパクトがあってか,SNSでは絶賛されているが,使用するとなれば,無料ではすぐにレート制限にひっかかってしまい,短時間しか使えない.さらに,プロジェクトごとにファイルアップロード(Knowledge)と事前の指示(Instructions)ができるbot機能を使用できるProjects機能が6月25日に搭載されたが,これは無料ユーザーには開放されていない.

■最近はAIのアップデート,新しいツールの登場などが目まぐるしい中,課金すべきか悩むケースも多いと思われる.では,Claude-3.5-Sonnetにはどのような人が課金すべきか?代替手段はないのか?このあたりについてこの記事では扱う.

1.Claude-3.5-Sonnetの性能

■Claude-3.5-Sonnetは確かに高性能で,「LLMのベンチマークではGPT-4oを超えて最強」とSNSでは湧き上がっているが,この手のベンチマーク比較については話半分に聞いておいた方がよい(新しいモデルがでるたびにこういう騒ぎが起こるが,過剰評価であることもしばしばで,後で評価が逆転することもある).なので,LLMとしての精度だけで課金しようとするのはおすすめしない今回のアップデートは,LLMの精度向上というよりもむしろ,Claudeの新しいオプション機能による利便性が大幅に増した,というのがポイントで,ここに自分のAIを使う目的がマッチするかどうかである.
Claude-3.5-Sonnetの注目すべきポイント
・回答速度の速さ
・API利用料金の安さ
・Artifact機能
・Projects機能
(1)回答速度の速さ
■Claude-3.5-Sonnetの性能はClaude-3シリーズで最強と言われているOpusを上回っており,その回答速度はOpusの2倍である.他者のLLMとのベンチマークでの比較は参考程度にとどめておいた方がいいが,同じClaude同士の比較では確かにOpusより高性能である.
【AI】最新のClaude-3.5-Sonnetをどう使うか?課金すべきか?_e0255123_18183292.png
(2)APIの安さ
■APIを使用しない方には関係ない話であるが,最近,OpenAIもGoogleもAPIの料金の安さで競争しているかのような低コスト化が進んでおり,Anthropic社もそれに乗っかった形となった.入力トークン100万あたり$3,出力トークン100万あたり15$で,トークンコンテキストウィンドウは20万(200K)である.これはClaude-3-Opus/Sonnetのみならず,GPT-4oやGemini-1.5Proよりも安く,1000文字の入力で1円程度である($1=¥155,1文字2トークンと換算した場合).APIは従量制であるため,どの程度値段がかかるのか使用してみなければ分からないという恐怖心がある人も多いが,ここまで安くなると使いやすいのではないだろうか?
【AI】最新のClaude-3.5-Sonnetをどう使うか?課金すべきか?_e0255123_18195752.png
(3)Artifact機能
■Claude-3.5-Sonnetで最もインパクトがあるのがこの機能であろう.この機能はアプリ版では使用できず,Web版のみ可能である.Claude-3.5-Sonnetのページでアカウント(設定)をクリックし,[Feature Preview]を選択してArtifactsを[On]に設定すれば使用できる.
【AI】最新のClaude-3.5-Sonnetをどう使うか?課金すべきか?_e0255123_18211905.png
■Artifactsには以下の6つの機能が搭載されている.

- コード:プログラミング言語で書かれたコードスニペットやスクリプトを表示する.シンタックスハイライトが適用されており,コードの構文に基づいた色分けが行われて読みやすくなっている.
【AI】最新のClaude-3.5-Sonnetをどう使うか?課金すべきか?_e0255123_18221447.png
- ドキュメント:プレーンテキストやMarkdown形式のドキュメントを表示する.長文のテキスト,説明文,レポートなどに適している.
【AI】最新のClaude-3.5-Sonnetをどう使うか?課金すべきか?_e0255123_18233217.png
- HTML:HTML形式のコンテンツを表示する.HTML,CSS,JavaScriptを含む単一ファイルのウェブページを表示でき,インタラクティブな要素を含むことができる.ホームページ作成に適している.
【AI】最新のClaude-3.5-Sonnetをどう使うか?課金すべきか?_e0255123_18240022.png
- Scalable Vector Graphics (SVG):一言で言えば図形や簡単な絵などの描画機能である.SVGはウェブやその他の環境で使用される2次元のベクター画像を定義するためのXMLベースのファイル形式であり,ベクター形式のグラフィックスを表示できる.ベクター画像は数式で描画されるため,どの解像度でも鮮明に表示され,直接編集しやすく,要素の位置や形状,色などを手軽に変更できる.軽量なため,ウェブページの読み込み速度を向上させることができる.
【AI】最新のClaude-3.5-Sonnetをどう使うか?課金すべきか?_e0255123_18243874.png
- Mermaid図:Mermaid記法で書かれた図表を表示できる.具体的には,フローチャート,シーケンス図,ガントチャート,マインドマップなどの図表を簡単に作成できる.テキストベースで図表を定義できるため,修正や更新が容易である.同様の機能はGPTsにもあるが,Artifactsでは事前に日本語表記できる点が異なる.
【AI】最新のClaude-3.5-Sonnetをどう使うか?課金すべきか?_e0255123_18250418.png
- Reactコンポーネント:ReactはFacebookによって開発されたオープンソースのJavaScriptライブラリであり,主にユーザーインターフェース(UI)の構築に使用されている.要は,ウェブページの一部分を作るための「部品」のようなものである.例えば,ボタン,フォーム,カードなどのUI要素を作ることができる.ボタンやフォーム(クリックしたり,テキストを入力したりできる部品),データの表示(グラフや表で情報を見やすく表示できる),シンプルなゲーム(簡単なクイズやパズルのようなゲームを作れる)などが可能である.
【AI】最新のClaude-3.5-Sonnetをどう使うか?課金すべきか?_e0255123_18260550.png
■「Claude-3.5-Sonnetはスライドも作成できる」との話もあるが,これは間違いである.確かに,プロンプトで指示するとあたかもスライド生成ができるようには見える.しかし,このArtifact機能にはスライド生成機能はなく,上記の6つの機能を組み合わせて,プレゼンテーションのような内容を生成し,スライドを模倣しているというのが実際である.

■このArtifact機能を活用する上で肝となるのが「Preview」である.Previewは生成されたArtifactの内容をユーザーに即座に表示する機能であり,これにより,ユーザーは,コードだけでは分かりにくい作成されたコンテンツを直接視覚的に確認し,必要に応じて修正や調整を要求することができる.まさにプログラムができない人でもコードを扱いやすくするためのツールである.

■このPreviewが非常にインパクトが高いためSNSでは話題性が高いが,Artifacts機能を扱う上でのその本質はPreviewではなく,コード生成能力の高さにある.もともとClaudeはChatGPTなどの他のLLMよりもコード生成能力が高く,Claude-3.5-Sonnetではさらに精度が向上している.その精度に自信がなければ,このようなPreview機能はつけられなかっただろう.同時に,このPreviewはダウンロードはできない.もっとも,特定のデータを可視化して自分にとって理解しやすい形にする上ではその場では便利で,例えば,論文を読み込ませた上で内容・データをビジュアル化させるのは一つの手である.だが,そこでせっかく生成されたコードを活用できなければ宝の持ち腐れでもある.

(4)Projects機能
■Projects機能は,Claude-3.5-Sonnetリリースから数日遅れで追加された機能で,有料会員であるProもしくはTeamのユーザーしか使用できない.この機能は早い話が自分専用のbotを作成できる機能である.GPTsと似ているが,Webアクセス機能やActionによる外部API呼び出し機能,Advanced Data Analysis(旧Code Interpreter)ほどの機能は有していない.

- ファイルアップロード登録機能
■knowledgeとしてドキュメントやコードなどのファイルをアップロードでき,会話の際にそのファイルを参照してくれるようになる.1つのプロジェクトにつき,アップロードできるファイルの上限は200kトークンであり,書籍で言うとや500ページほどの量である(NotebookLMには遠く及ばない).

- Custom Instructions機能
■ChatGPTにもあるような,事前の指示をそのプロジェクトにおいて守らせることができる,「自分だけのチャットbot」の機能である.

2.Claude-3.5-Sonnetをどう使う?課金は必要?

■前述の通り一通りの機能を説明したが,ここからはどう使うかである.ただ普通に会話するだけならChatGPTもあるので,わざわざ課金する必要はないだろう.無料のままでいいのか,有料(月$20≒3100円のサブスクリプション)で使用するかはここが大きな分岐点である.当ブログの性質上,読者が医療従事者であるため,医療従事者を想定した内容に限定することになるが,ここの読者が使用するとなると第一に考えることと言えば学術的な内容であろう.

(1)論文の理解のための使用
■Claude-3.5-Sonnetは論文の解説がうまい.加えて,内容をデータも含めてビジュアル的に分かりやすくする上では非常に使い勝手がいい.となれば,あとは1日にどれくらいの本数の論文を読み込ませるかしだいである.
考え方

1日2~3本程度
 →無料がおすすめ

まとまった時間に何本も読み込ませたい
 →選択肢1:有料化
 →選択肢2:ChatGPT-4o(無料)を使う
(2)ガイドラインや通知文書等,まとまった情報の理解
■ガイドラインやレビュー論文,厚労省などの通知文書などを読み込ませてFAQのbot代わりに使うことも可能である.ただし,毎回アップロードするのではなく,あらかじめファイルをアップロードしたbotを作っておくと便利で,このような使い方をする際は有料のProjects機能が便利である.ただし,同様の機能を有する代替手段は無料のものも含めて多い.
考え方

多量の参照文書のbot的使い方はしない
 →無料がおすすめ

多量の参照文書のbotを作成して使用したい
 →選択肢1:有料でProjects機能を使う(Artifacts機能付きで使いたいなら特におすすめ)
 →選択肢2:既にChatGPTの有料ユーザーならGPTsを使う
 →選択肢3:Cozeで自作する(無料.モデルはClaude-3.5-Sonnetを含め様々なAIから選択できる)
 →選択肢4:NotebookLMで自作する(無料)
 →選択肢5:Poe.comで自作する(使用回数制限はあるが無料.モデルはClaude-3.5-Sonnetを含め様々なAIから選択できる)
 →選択肢6:easy-peasy.AIで自作する(有料.NotebookLMのような特化bot,GPTsのような創造性もあるbotのどちらも作成可能)
(3)論文を書く
■論文生成にも使用できるが,論文生成となればそれなりの会話頻度になるため,無料で使用するのは現実的ではないだろう.有料で使うにしても,既にChatGPT-4oが無料で使用できる他,論文生成を支援してくれるGPTsは既にいくつか公開されているので,そちらを使うのがいいだろう.
考え方

Claude-3.5-Sonnetはおすすめしない.既存の論文生成を支援してくれるGPTsを使用する.
(4)スライド作成
■アウトラインを考えてくれたり,スライドに使用するデータをまとめる上では有用だが,それは他のAIでも可能である.なにより誤解してはいけないのは,前述の通り,Claude-3.5-SonnetのArtifacts機能はスライド生成機能はなく,HTML等を使用した模倣であり,提示されたコードを使用してもスライドは作れない.
考え方

Claude-3.5-Sonnetはおすすめしない.ChatGPT-4o,あるいは既存のスライド生成を支援してくれるGPTsを使用する.
(5)データの解析
■ChatGPTのAdvanced Data Analysis(旧Code Interpreter)ように,プログラムを独自にUI上で走らせて解析してくれる機能までは備わっていないが,コード生成機能自体は全AIモデルの中でほぼトップであり,そのコードを用いて自分のPC(あるいはコードが使用できるGoogle Colaboratoryなどのプラットフォーム)で動かす上では非常に有用である.ChatGPTのAdvanced Data Analysisが精度があまりよくなくて失敗しやすいことを考えれば,Claude-3.5-Sonnetの使用はおすすめである.コード生成する上では会話回数も多くなることから,有料での使用がおすすめである.
考え方

無料はおすすめしない.

選択肢1:有料で使用する(コードを使用するための他のアプリケーションを使用する必要はある).
選択肢2:ChatGPT-4oのAdvanced Data Analysisを使用する(無料.精度は落ちるが,解析をAI上で済ませてしまいたい場合はおすすめ)

# by DrMagicianEARL | 2024-06-26 18:31 | 医学・医療とAI
多数のアップロードした文書に特化したAIチャットアプリ「NotebookLM」の強みと弱点
【AI】多数のアップロードした文書に特化したAIチャットアプリ「NotebookLM」の強みと弱点_e0255123_13162061.jpg
■Googleから新たなAIツール「NotebookLM」が試験的に無料公開された.NotebookLM自体は2023年の開発者向けカンファレンスGoogle I/O 2024の基調講演で発表されたサービスで,2023年12月8日から米国アカウントのみで使用可能となり,開発者や企業がGoogle AI StudioやGoogle Cloud Vertex AIのAPIを通してGemini-1.0Proを搭載したNotebookLMが利用できた.今回はそれが大幅アップデートされ,かつ世界200か国で公開され,SNSでもかなり話題となっている.

1.NotebookLMとは何か?

■NotebookLMは作家のSteven Johnson氏とのパートナーシップで設計されたもので,ユーザーがパソコン,Google Drive,Googleスライド,ウェブサイト,あるいはテキストの直接入力から複数のドキュメントを1つのデジタルノートスペースにアップロードし,Google最新のAIであるGemini-1.5Proを通して会話し,アップロードしたドキュメントを使用して回答できるような質問をすることができるように設計されている.

■これはプライベートRAG(Retrive-Augumented Generation)と呼ばれる機能で,入力されたクエリに関連する情報を大規模なデータベースから検索し,その情報を利用して回答を生成する手法である.NotebookLMは,ユーザーのアップロードしたローカル資料を基盤として言語モデルを構築することで,個々のニーズに最適化されたインサイトを提供する.このソースグランディングによって,AIが提供する情報の信頼性と関連性が高まる.通常のLLMモデルとは異なり,NotebookLMは入力データに書かれていないことには回答を拒否する場合があるため,事実と異なる情報を生成するリスクが低い.
【AI】多数のアップロードした文書に特化したAIチャットアプリ「NotebookLM」の強みと弱点_e0255123_15195142.png
■例えば,医学研究者がNotebookLMに複数の論文をアップロードし,特定のトピックに関する質問をすると,NotebookLMはアップロードされた論文の内容に基づいて正確な回答を生成することができる.特定の疾患についてのレビュー論文やガイドラインなどを複数アップロードすれば,その疾患について非常に詳しいボットを作成することができる.

■Gemini-1.5Proは,2024年2月8日にリリースされ,4月9日にはAPI開放,5月15日にはWeb版とGoogleアプリでGemini Advancedとして使用可能になったGoogleが誇る最新AIである.その強みはやはり,その膨大な処理能力にある.機械学習の向上によりコンテキストウィンドウで最大100万トークンもの膨大な情報を処理可能になっている.GPT-4oが12万8000トークンであることを考えると,Gemini-1.5Proは圧倒的な処理量で,これはハリーポッターの全書籍の8割の量に相当する.これによりこれまでよりも複雑な問題を解決できるようになり,情報の探索と分析の時間が節約され,生産性の向上が期待されている.NotebookLMに数十のソースをアップロードしてのプライベートRAGは他のAIにはなかなか真似できないだろう.

2.NotebookLMの機能

■ここでは,NotebookLMの機能について述べる.

(1)アップロードできるファイルの種類と数
■Notebookにアップロードできるファイルは以下の通りである.
・Googleドキュメント(Googleドライブから)
・Googleスライド(Googleドライブから)
・PDFファイル(.pdf)
・テキストファイル(.txt)
・コピペで直接入力したテキスト
・ウェブサイトURL
■アップロードファイルについての制限・応用は以下の通りである.
・アップロードできるファイル内容の上限は50万語まで.
・アップロードできるファイル数の上限は49(公開情報では50だが実際には49個までしかアップロードできない).・基本的には文書がメインだが,Googleスライドに限って言えば画像や表も可能.・ウェブサイトURLについては,そのウェブサイトがアップロード後に更新されても反映はされない.・NotionのURLでも内容を読み込むことが可能で,この場合は公開設定にした上でネット検索を可能にする必要がある.ただし,読み込みはあまりうまくいかない.・Excelファイル(あるいはCSVファイル)そのものは読み込めないが,PDFファイルもしくはJSON形式に変換した上での.txtファイルにすると読み込める.PDFファイル化する場合は,セル内改行を施しておく必要がある.
(2)質問する
■チャットボックスに質問や指示を書くことで,アップロードしたソースをもとにGemjni-1.5Proが回答する.言語は日本語でもよく,回答はあくまでソース情報のみしか生成しない(Gemini-1.5Proがもつ知識は適用されない).質問の際に使用するソースのファイルは選択が可能である(チェックボックスのon/off切り替え).なお,チャット内容は自動的には保存されないため,回答を保存したい場合は次に説明するメモ機能を使用する

■ほとんどの場合,AIの回答にはソースからの引用番号がつく.引用は直接引用であるため,引用の文章を確認することで,回答の正確性を確認したり,元の引用を見つけることができる.
【AI】多数のアップロードした文書に特化したAIチャットアプリ「NotebookLM」の強みと弱点_e0255123_13304580.png
【AI】多数のアップロードした文書に特化したAIチャットアプリ「NotebookLM」の強みと弱点_e0255123_13310315.png
(3)メモを使う
■NotebookLMにはメモ機能がついており,いくつかの使い方がある.
- メモにAIからの回答を保存する:回答を保存したい場合は,回答ボックスの右上にあるピンマークをクリックすると保存できる.保存された回答ノートは編集は不可である.
- ソースの1つから引用または要約を保存する:アップロードしたソースを読みながら,保存するテキストを選択し,メモに追加またはメモに要約を選択して新しいメモを作成できる.これらの保存されたメモは編集は不可である.
- 既存のメモを使用して新しいメモを作成する:メモを選択し,提案されたアクションの1つを選択して,その内容に基づいて新しいメモを作成する.たとえば,すべてのメモを選択し,学習ガイドの作成を選択するなどが可能.
- 新しいメモを書く:メモセクション(質問入力部位の左にある「チャットを閉じる」をクリック)の左上にある「メモを追加」をクリックすると,新規にメモを作成できる.

■作成したメモの右上にある□のチェックボックスをクリックすると,下のチャットモードが起動し,メモ内容からAIへの質問・指示が可能である.
【AI】多数のアップロードした文書に特化したAIチャットアプリ「NotebookLM」の強みと弱点_e0255123_14573570.png
■1つのノートブックには最大1000件のノートを作成できる.

(4)ノートブックの共有

■各ノートブックの右上に共有ボタンがあり,これをクリックすると別のユーザーのメールアドレス(自分のアカウントと同じドメインのみ)を追加することで共有ができる.追加されたユーザーのアクセス権に関しては閲覧者か編集者のいずれかを指定できる.
- 閲覧者:共有ノートブック内のソースとメモの読み取り専用のアクセス権を有する.
- 編集者:共有ノートブック内のソースとメモを表示,追加,削除したり,他のユーザーとさらに共有することができる.

■共有できる個人ユーザー数は最大で50人であるが,Googleグループとは共有は不可.企業アカウントでは,ノートブックを共有できるユーザー数に制限はない.

(5)ノートブックガイド
■プロンプト入力欄の右に「ノートブックガイド」というものがあり,ここをクリックすると以下の5つから選択してメモが自動作成される.
- よくある質問:FAQを自動作成
- 学習ガイド:ソース内容から問題を自動的に出題することができる
- 目次:ソースから目次を自動生成する
- タイムライン:ソース内の時系列や登場人物についての情報を自動作成する
- ブリーフィング・ドキュメント:ソース内容の概要を自動的に作成する

3.NotebookLMの弱点

■SNSではNotebookLMを賞賛する投稿であふれているが,当然ながら弱点がある.

(1)言語の壁
■NotebookLMに搭載されているAIモデルであるGemini-1.5Proは日本語能力にかなり優れており,ChatBot Arenaでも他のモデルをおさえてトップだったことが話題になっている.しかしながら,ことNotebookLMにおいては,ソースとしてアップロードした文書が英語であった場合,日本語で質問した時の精度がやや落ちているようである.質問の日本語を英語に変換した上でソースから検索するというワンステップ多い過程となるため,ここがボトルネックになっているようである.

(2)連続した会話が成立しにくい
■通常のAIチャットボットは,文書の内容だけでなく,ユーザーと繰り返す対話の文脈も考慮して回答を生成する.NotebookLMの場合は,あくまでアップロードされた文書の内容のみに基づいて回答が生成されるため,文脈を考慮した柔軟な対話が難しい.

(3)通常のGemini-1.5Proとの会話と比べて柔軟性や応用性が損なわれている
■NotebookLMではソースからの情報に特化し,それ以外の情報(元々AIが有している知識等)は出力しない仕様となっているため,柔軟な対応や応用性が損なわれている.このため,思っていた回答がなされなかったり回答を拒否されることもある.大量の文書の処理や正確性を求めるならNotebookLMがいいが,もし柔軟性や応用性を求めるならば,通常のGemini-1.5Proやその他大規模言語モデルのAIチャットボットにアップロードして質問・指示した方がいいだろう.

(4)機能性が会話に限定される
■ファイルをアップロードしてのカスタマイズしたプライベートRAGとしてのAIチャットボットにはGPTsやPoeの自己作成ボット,Cozeアプリなどがあり,これらはbotを呼び出したり,解析やウェブアクセス等の他の機能も同時に使用できる.NotebookLMは会話機能以外が一切できない仕様であり,こういった機能性を有していない.

■このため,使い勝手を知るならば,GPTs,Poe,Cozeなどを触った上でソース内容とその使用目的でNotebookLMと使い分けをした方がいいだろう.GPTs作成は有料であるが,Poeボット(一部有料のモデルもあり),Cozeは無料で使用できる.

(5)プロンプトの工夫があまり通用しない可能性
■NotebookLMは見ての通りチャットのプロンプト入力部分が非常に狭い上に改行もできない.改行したプロンプトをコピペして実行してもチャット上には反映されていない.長く複雑なプロンプトを想定したつくりにはなっていないのかもしれない.

(6)スマートフォンからは扱いづらい
■スマートフォンでもNotebooLMの使用はできるが,表示があまりよくなく,ソースをアップロードする際のエラーもでやすい.

(7)チャット履歴が自動で保存されない
■前述の通り,チャット履歴は自動では保存されず,メモに移す必要がある.

(7)メモ保存で表形式が崩れる
■チャットでは表形式で出力させることも可能だが,これをメモに保存した場合,表形式が崩れてしまう.

(8)APIがない
■NotebookLMには利用できるAPIがない.このため,外部からNotebookLMの情報をリクエストすることはできない.
# by DrMagicianEARL | 2024-06-12 15:16 | 医学・医療とAI
【AI】出版プラットフォーム「Perplexity Pages」で簡単にソース付き情報ページ作成_e0255123_13475757.png
■元GoogleのAIチームのメンバーが立ち上げたAI検索のPerplexityは,その検索機能のみならず,マルチ機能も有し,GPT-4やClaude-3など他のAIの大規模言語モデルとの連携も可能であることからこの1年で非常に人気が高まった.

■そのPerplexityが,今度は「Perplexity Pages」というサービスを開始した.このサービスは,いわゆる出版プラットフォームで,タイトルを入力するだけでそれに応じた情報をPerplexityが検索し,AIによってソース付きで文章化し,画像もつけるなど視覚的にも見映えがするコンテンツを瞬時に作成することができる.現時点で利用できるのはPerplexity Proに登録している有料会員($20/月のサブスクリプション)のみである.Google検索などで上位にきやすいという声もあり,SEO(Search Engine Optimization)対策としても重要なサービスかもしれない.

■Perplexity Pagesの使い方について,筆者自身が「Perplexity Pages入門ガイド」というPageを作成したので,そちらを参照されたい.
Perplexity Pages入門ガイド
https://www.perplexity.ai/page/Perplexity-Pages-ahVXIkl0RhGdSNprsz.m7w
【AI】出版プラットフォーム「Perplexity Pages」で簡単にソース付き情報ページ作成_e0255123_14014719.png

# by DrMagicianEARL | 2024-06-07 14:02 | 医学・医療とAI

by DrMagicianEARL