人気ブログランキング | 話題のタグを見る
ブログトップ

EARLの医学ノート

drmagician.exblog.jp

敗血症をメインとした集中治療,感染症,呼吸器のノート.医療におけるAIについても

AI検索最強のPerplexityに強力なライバルが登場「Genspark」
【AI】AI検索最強のPerplexityに強力なライバルが登場「Genspark」_e0255123_11174822.png
■AI検索では1年余りの間,Perplexityが無双状態であったが,ここにきてその地位を脅かす強力なライバル「Genspark」が2024年6月18日に登場した.Genspark社は,Baidu(百度)の元幹部が設立した企業(本社はカリフォルニア州パロアルト)である.

■Gensparkの売りは「無料」「速い」「Sparkpagesの充実性」であろう.特に,Sparkpages機能は,医学情報においては,レビュー論文ばりの詳細情報を即座に生成することができる

1.Gensparkの機能

(1)複数のAIモデルを使用して検索情報からSparkpagesを生成
■Gensparkは,同社で訓練されたモデルに加え,OpenAI社,Anthropic社などのサードパーティーモデルも含む複数のAIモデルプロバイダーを使用して情報をインデックス化して要約する.結果は,AI生成サマリーの提示に加えて,1ページにカスタマイズされた,Wikipediaのような詳細なSparkpagesを生成してリンクを表示する.権威性や人気が高いWebページを優先し,信頼性の低い情報を排除している.また,生成したSparkpagesにはAIによるCopilot機能がついている他,Sparkpagesを他者にシェアすることもできる.

(2)ユーザーの検索行動を学習
■Gensparkは,ユーザーの検索行動を学習し,個々のニーズに合わせたカスタマイズされた情報を提供できる.

(3)無料で使用可能
■現時点ではGensparkはβ版であり,無料で提供されている.ゆくゆくはサブスクリプションプランも組むとのことである.

(4)生成速度が非常に速い
■実際に触ってみると分かるが,Gensparkの検索結果生成速度は非常に速い.検索結果のサマリーだけならPerplexityと同程度と感じるかもしれないが,それに加えて詳細なSparkpagesも同時に完成させるため,トータルの速度は断然Gensparkが早い.

2.Gensparkでの医学情報の検索

■Gensparkは旅行や画像,商品の情報を前面に押し出しているが,医療・医学情報にも強く,検索結果のサマリー生成とその引用サイトはPerplexityにひけをとらない質の回答を生成する他,Sparkpagesはかなり充実しており,例えば治療薬についての検索だと「治療目的」「効果のエビデンス」「投与方法」「研究結果の比較」「副作用と注意点」「ガイドラインの推奨」「まとめと結論」といった,さながらレビュー論文ばりのまとめを即座に生成する.PerplexityにもPerplexity Pagesがあるが,Sparkpagesに比べてかなり時間がかかる.

■↓検索結果サマリー(Directed Answer by AI)
【AI】AI検索最強のPerplexityに強力なライバルが登場「Genspark」_e0255123_11243485.png
■↓Sparkpages
【AI】AI検索最強のPerplexityに強力なライバルが登場「Genspark」_e0255123_11260485.png

■Perplexityよりも劣る点では以下のことがあげられる.
・AcademicやWritingといったフィルター機能がない
・Perplexityに比して情報の最新性がやや劣る
・ファイルアップロード機能がない
・APIがない
・アプリがない

# by DrMagicianEARL | 2024-06-28 11:34 | 医学・医療とAI
最新のClaude-3.5-Sonnetをどう使うか?課金すべきか?
【AI】最新のClaude-3.5-Sonnetをどう使うか?課金すべきか?_e0255123_18174338.png
■2024年6月21日にAnthropic社のAIモデルClaudeシリーズに最新のClaude-3.5-Sonnetが登場した(今年度末には3.5でのHaikuやOpusもリリース予定).精度向上のみならず,新たなArtifactよるPreview機能がビジュアル的にインパクトがあってか,SNSでは絶賛されているが,使用するとなれば,無料ではすぐにレート制限にひっかかってしまい,短時間しか使えない.さらに,プロジェクトごとにファイルアップロード(Knowledge)と事前の指示(Instructions)ができるbot機能を使用できるProjects機能が6月25日に搭載されたが,これは無料ユーザーには開放されていない.

■最近はAIのアップデート,新しいツールの登場などが目まぐるしい中,課金すべきか悩むケースも多いと思われる.では,Claude-3.5-Sonnetにはどのような人が課金すべきか?代替手段はないのか?このあたりについてこの記事では扱う.

1.Claude-3.5-Sonnetの性能

■Claude-3.5-Sonnetは確かに高性能で,「LLMのベンチマークではGPT-4oを超えて最強」とSNSでは湧き上がっているが,この手のベンチマーク比較については話半分に聞いておいた方がよい(新しいモデルがでるたびにこういう騒ぎが起こるが,過剰評価であることもしばしばで,後で評価が逆転することもある).なので,LLMとしての精度だけで課金しようとするのはおすすめしない今回のアップデートは,LLMの精度向上というよりもむしろ,Claudeの新しいオプション機能による利便性が大幅に増した,というのがポイントで,ここに自分のAIを使う目的がマッチするかどうかである.
Claude-3.5-Sonnetの注目すべきポイント
・回答速度の速さ
・API利用料金の安さ
・Artifact機能
・Projects機能
(1)回答速度の速さ
■Claude-3.5-Sonnetの性能はClaude-3シリーズで最強と言われているOpusを上回っており,その回答速度はOpusの2倍である.他者のLLMとのベンチマークでの比較は参考程度にとどめておいた方がいいが,同じClaude同士の比較では確かにOpusより高性能である.
【AI】最新のClaude-3.5-Sonnetをどう使うか?課金すべきか?_e0255123_18183292.png
(2)APIの安さ
■APIを使用しない方には関係ない話であるが,最近,OpenAIもGoogleもAPIの料金の安さで競争しているかのような低コスト化が進んでおり,Anthropic社もそれに乗っかった形となった.入力トークン100万あたり$3,出力トークン100万あたり15$で,トークンコンテキストウィンドウは20万(200K)である.これはClaude-3-Opus/Sonnetのみならず,GPT-4oやGemini-1.5Proよりも安く,1000文字の入力で1円程度である($1=¥155,1文字2トークンと換算した場合).APIは従量制であるため,どの程度値段がかかるのか使用してみなければ分からないという恐怖心がある人も多いが,ここまで安くなると使いやすいのではないだろうか?
【AI】最新のClaude-3.5-Sonnetをどう使うか?課金すべきか?_e0255123_18195752.png
(3)Artifact機能
■Claude-3.5-Sonnetで最もインパクトがあるのがこの機能であろう.この機能はアプリ版では使用できず,Web版のみ可能である.Claude-3.5-Sonnetのページでアカウント(設定)をクリックし,[Feature Preview]を選択してArtifactsを[On]に設定すれば使用できる.
【AI】最新のClaude-3.5-Sonnetをどう使うか?課金すべきか?_e0255123_18211905.png
■Artifactsには以下の6つの機能が搭載されている.

- コード:プログラミング言語で書かれたコードスニペットやスクリプトを表示する.シンタックスハイライトが適用されており,コードの構文に基づいた色分けが行われて読みやすくなっている.
【AI】最新のClaude-3.5-Sonnetをどう使うか?課金すべきか?_e0255123_18221447.png
- ドキュメント:プレーンテキストやMarkdown形式のドキュメントを表示する.長文のテキスト,説明文,レポートなどに適している.
【AI】最新のClaude-3.5-Sonnetをどう使うか?課金すべきか?_e0255123_18233217.png
- HTML:HTML形式のコンテンツを表示する.HTML,CSS,JavaScriptを含む単一ファイルのウェブページを表示でき,インタラクティブな要素を含むことができる.ホームページ作成に適している.
【AI】最新のClaude-3.5-Sonnetをどう使うか?課金すべきか?_e0255123_18240022.png
- Scalable Vector Graphics (SVG):一言で言えば図形や簡単な絵などの描画機能である.SVGはウェブやその他の環境で使用される2次元のベクター画像を定義するためのXMLベースのファイル形式であり,ベクター形式のグラフィックスを表示できる.ベクター画像は数式で描画されるため,どの解像度でも鮮明に表示され,直接編集しやすく,要素の位置や形状,色などを手軽に変更できる.軽量なため,ウェブページの読み込み速度を向上させることができる.
【AI】最新のClaude-3.5-Sonnetをどう使うか?課金すべきか?_e0255123_18243874.png
- Mermaid図:Mermaid記法で書かれた図表を表示できる.具体的には,フローチャート,シーケンス図,ガントチャート,マインドマップなどの図表を簡単に作成できる.テキストベースで図表を定義できるため,修正や更新が容易である.同様の機能はGPTsにもあるが,Artifactsでは事前に日本語表記できる点が異なる.
【AI】最新のClaude-3.5-Sonnetをどう使うか?課金すべきか?_e0255123_18250418.png
- Reactコンポーネント:ReactはFacebookによって開発されたオープンソースのJavaScriptライブラリであり,主にユーザーインターフェース(UI)の構築に使用されている.要は,ウェブページの一部分を作るための「部品」のようなものである.例えば,ボタン,フォーム,カードなどのUI要素を作ることができる.ボタンやフォーム(クリックしたり,テキストを入力したりできる部品),データの表示(グラフや表で情報を見やすく表示できる),シンプルなゲーム(簡単なクイズやパズルのようなゲームを作れる)などが可能である.
【AI】最新のClaude-3.5-Sonnetをどう使うか?課金すべきか?_e0255123_18260550.png
■「Claude-3.5-Sonnetはスライドも作成できる」との話もあるが,これは間違いである.確かに,プロンプトで指示するとあたかもスライド生成ができるようには見える.しかし,このArtifact機能にはスライド生成機能はなく,上記の6つの機能を組み合わせて,プレゼンテーションのような内容を生成し,スライドを模倣しているというのが実際である.

■このArtifact機能を活用する上で肝となるのが「Preview」である.Previewは生成されたArtifactの内容をユーザーに即座に表示する機能であり,これにより,ユーザーは,コードだけでは分かりにくい作成されたコンテンツを直接視覚的に確認し,必要に応じて修正や調整を要求することができる.まさにプログラムができない人でもコードを扱いやすくするためのツールである.

■このPreviewが非常にインパクトが高いためSNSでは話題性が高いが,Artifacts機能を扱う上でのその本質はPreviewではなく,コード生成能力の高さにある.もともとClaudeはChatGPTなどの他のLLMよりもコード生成能力が高く,Claude-3.5-Sonnetではさらに精度が向上している.その精度に自信がなければ,このようなPreview機能はつけられなかっただろう.同時に,このPreviewはダウンロードはできない.もっとも,特定のデータを可視化して自分にとって理解しやすい形にする上ではその場では便利で,例えば,論文を読み込ませた上で内容・データをビジュアル化させるのは一つの手である.だが,そこでせっかく生成されたコードを活用できなければ宝の持ち腐れでもある.

(4)Projects機能
■Projects機能は,Claude-3.5-Sonnetリリースから数日遅れで追加された機能で,有料会員であるProもしくはTeamのユーザーしか使用できない.この機能は早い話が自分専用のbotを作成できる機能である.GPTsと似ているが,Webアクセス機能やActionによる外部API呼び出し機能,Advanced Data Analysis(旧Code Interpreter)ほどの機能は有していない.

- ファイルアップロード登録機能
■knowledgeとしてドキュメントやコードなどのファイルをアップロードでき,会話の際にそのファイルを参照してくれるようになる.1つのプロジェクトにつき,アップロードできるファイルの上限は200kトークンであり,書籍で言うとや500ページほどの量である(NotebookLMには遠く及ばない).

- Custom Instructions機能
■ChatGPTにもあるような,事前の指示をそのプロジェクトにおいて守らせることができる,「自分だけのチャットbot」の機能である.

2.Claude-3.5-Sonnetをどう使う?課金は必要?

■前述の通り一通りの機能を説明したが,ここからはどう使うかである.ただ普通に会話するだけならChatGPTもあるので,わざわざ課金する必要はないだろう.無料のままでいいのか,有料(月$20≒3100円のサブスクリプション)で使用するかはここが大きな分岐点である.当ブログの性質上,読者が医療従事者であるため,医療従事者を想定した内容に限定することになるが,ここの読者が使用するとなると第一に考えることと言えば学術的な内容であろう.

(1)論文の理解のための使用
■Claude-3.5-Sonnetは論文の解説がうまい.加えて,内容をデータも含めてビジュアル的に分かりやすくする上では非常に使い勝手がいい.となれば,あとは1日にどれくらいの本数の論文を読み込ませるかしだいである.
考え方

1日2~3本程度
 →無料がおすすめ

まとまった時間に何本も読み込ませたい
 →選択肢1:有料化
 →選択肢2:ChatGPT-4o(無料)を使う
(2)ガイドラインや通知文書等,まとまった情報の理解
■ガイドラインやレビュー論文,厚労省などの通知文書などを読み込ませてFAQのbot代わりに使うことも可能である.ただし,毎回アップロードするのではなく,あらかじめファイルをアップロードしたbotを作っておくと便利で,このような使い方をする際は有料のProjects機能が便利である.ただし,同様の機能を有する代替手段は無料のものも含めて多い.
考え方

多量の参照文書のbot的使い方はしない
 →無料がおすすめ

多量の参照文書のbotを作成して使用したい
 →選択肢1:有料でProjects機能を使う(Artifacts機能付きで使いたいなら特におすすめ)
 →選択肢2:既にChatGPTの有料ユーザーならGPTsを使う
 →選択肢3:Cozeで自作する(無料.モデルはClaude-3.5-Sonnetを含め様々なAIから選択できる)
 →選択肢4:NotebookLMで自作する(無料)
 →選択肢5:Poe.comで自作する(使用回数制限はあるが無料.モデルはClaude-3.5-Sonnetを含め様々なAIから選択できる)
 →選択肢6:easy-peasy.AIで自作する(有料.NotebookLMのような特化bot,GPTsのような創造性もあるbotのどちらも作成可能)
(3)論文を書く
■論文生成にも使用できるが,論文生成となればそれなりの会話頻度になるため,無料で使用するのは現実的ではないだろう.有料で使うにしても,既にChatGPT-4oが無料で使用できる他,論文生成を支援してくれるGPTsは既にいくつか公開されているので,そちらを使うのがいいだろう.
考え方

Claude-3.5-Sonnetはおすすめしない.既存の論文生成を支援してくれるGPTsを使用する.
(4)スライド作成
■アウトラインを考えてくれたり,スライドに使用するデータをまとめる上では有用だが,それは他のAIでも可能である.なにより誤解してはいけないのは,前述の通り,Claude-3.5-SonnetのArtifacts機能はスライド生成機能はなく,HTML等を使用した模倣であり,提示されたコードを使用してもスライドは作れない.
考え方

Claude-3.5-Sonnetはおすすめしない.ChatGPT-4o,あるいは既存のスライド生成を支援してくれるGPTsを使用する.
(5)データの解析
■ChatGPTのAdvanced Data Analysis(旧Code Interpreter)ように,プログラムを独自にUI上で走らせて解析してくれる機能までは備わっていないが,コード生成機能自体は全AIモデルの中でほぼトップであり,そのコードを用いて自分のPC(あるいはコードが使用できるGoogle Colaboratoryなどのプラットフォーム)で動かす上では非常に有用である.ChatGPTのAdvanced Data Analysisが精度があまりよくなくて失敗しやすいことを考えれば,Claude-3.5-Sonnetの使用はおすすめである.コード生成する上では会話回数も多くなることから,有料での使用がおすすめである.
考え方

無料はおすすめしない.

選択肢1:有料で使用する(コードを使用するための他のアプリケーションを使用する必要はある).
選択肢2:ChatGPT-4oのAdvanced Data Analysisを使用する(無料.精度は落ちるが,解析をAI上で済ませてしまいたい場合はおすすめ)

# by DrMagicianEARL | 2024-06-26 18:31 | 医学・医療とAI
多数のアップロードした文書に特化したAIチャットアプリ「NotebookLM」の強みと弱点
【AI】多数のアップロードした文書に特化したAIチャットアプリ「NotebookLM」の強みと弱点_e0255123_13162061.jpg
■Googleから新たなAIツール「NotebookLM」が試験的に無料公開された.NotebookLM自体は2023年の開発者向けカンファレンスGoogle I/O 2024の基調講演で発表されたサービスで,2023年12月8日から米国アカウントのみで使用可能となり,開発者や企業がGoogle AI StudioやGoogle Cloud Vertex AIのAPIを通してGemini-1.0Proを搭載したNotebookLMが利用できた.今回はそれが大幅アップデートされ,かつ世界200か国で公開され,SNSでもかなり話題となっている.

1.NotebookLMとは何か?

■NotebookLMは作家のSteven Johnson氏とのパートナーシップで設計されたもので,ユーザーがパソコン,Google Drive,Googleスライド,ウェブサイト,あるいはテキストの直接入力から複数のドキュメントを1つのデジタルノートスペースにアップロードし,Google最新のAIであるGemini-1.5Proを通して会話し,アップロードしたドキュメントを使用して回答できるような質問をすることができるように設計されている.

■これはプライベートRAG(Retrive-Augumented Generation)と呼ばれる機能で,入力されたクエリに関連する情報を大規模なデータベースから検索し,その情報を利用して回答を生成する手法である.NotebookLMは,ユーザーのアップロードしたローカル資料を基盤として言語モデルを構築することで,個々のニーズに最適化されたインサイトを提供する.このソースグランディングによって,AIが提供する情報の信頼性と関連性が高まる.通常のLLMモデルとは異なり,NotebookLMは入力データに書かれていないことには回答を拒否する場合があるため,事実と異なる情報を生成するリスクが低い.
【AI】多数のアップロードした文書に特化したAIチャットアプリ「NotebookLM」の強みと弱点_e0255123_15195142.png
■例えば,医学研究者がNotebookLMに複数の論文をアップロードし,特定のトピックに関する質問をすると,NotebookLMはアップロードされた論文の内容に基づいて正確な回答を生成することができる.特定の疾患についてのレビュー論文やガイドラインなどを複数アップロードすれば,その疾患について非常に詳しいボットを作成することができる.

■Gemini-1.5Proは,2024年2月8日にリリースされ,4月9日にはAPI開放,5月15日にはWeb版とGoogleアプリでGemini Advancedとして使用可能になったGoogleが誇る最新AIである.その強みはやはり,その膨大な処理能力にある.機械学習の向上によりコンテキストウィンドウで最大100万トークンもの膨大な情報を処理可能になっている.GPT-4oが12万8000トークンであることを考えると,Gemini-1.5Proは圧倒的な処理量で,これはハリーポッターの全書籍の8割の量に相当する.これによりこれまでよりも複雑な問題を解決できるようになり,情報の探索と分析の時間が節約され,生産性の向上が期待されている.NotebookLMに数十のソースをアップロードしてのプライベートRAGは他のAIにはなかなか真似できないだろう.

2.NotebookLMの機能

■ここでは,NotebookLMの機能について述べる.

(1)アップロードできるファイルの種類と数
■Notebookにアップロードできるファイルは以下の通りである.
・Googleドキュメント(Googleドライブから)
・Googleスライド(Googleドライブから)
・PDFファイル(.pdf)
・テキストファイル(.txt)
・コピペで直接入力したテキスト
・ウェブサイトURL
■アップロードファイルについての制限・応用は以下の通りである.
・アップロードできるファイル内容の上限は50万語まで.
・アップロードできるファイル数の上限は49(公開情報では50だが実際には49個までしかアップロードできない).・基本的には文書がメインだが,Googleスライドに限って言えば画像や表も可能.・ウェブサイトURLについては,そのウェブサイトがアップロード後に更新されても反映はされない.・NotionのURLでも内容を読み込むことが可能で,この場合は公開設定にした上でネット検索を可能にする必要がある.ただし,読み込みはあまりうまくいかない.・Excelファイル(あるいはCSVファイル)そのものは読み込めないが,PDFファイルもしくはJSON形式に変換した上での.txtファイルにすると読み込める.PDFファイル化する場合は,セル内改行を施しておく必要がある.
(2)質問する
■チャットボックスに質問や指示を書くことで,アップロードしたソースをもとにGemjni-1.5Proが回答する.言語は日本語でもよく,回答はあくまでソース情報のみしか生成しない(Gemini-1.5Proがもつ知識は適用されない).質問の際に使用するソースのファイルは選択が可能である(チェックボックスのon/off切り替え).なお,チャット内容は自動的には保存されないため,回答を保存したい場合は次に説明するメモ機能を使用する

■ほとんどの場合,AIの回答にはソースからの引用番号がつく.引用は直接引用であるため,引用の文章を確認することで,回答の正確性を確認したり,元の引用を見つけることができる.
【AI】多数のアップロードした文書に特化したAIチャットアプリ「NotebookLM」の強みと弱点_e0255123_13304580.png
【AI】多数のアップロードした文書に特化したAIチャットアプリ「NotebookLM」の強みと弱点_e0255123_13310315.png
(3)メモを使う
■NotebookLMにはメモ機能がついており,いくつかの使い方がある.
- メモにAIからの回答を保存する:回答を保存したい場合は,回答ボックスの右上にあるピンマークをクリックすると保存できる.保存された回答ノートは編集は不可である.
- ソースの1つから引用または要約を保存する:アップロードしたソースを読みながら,保存するテキストを選択し,メモに追加またはメモに要約を選択して新しいメモを作成できる.これらの保存されたメモは編集は不可である.
- 既存のメモを使用して新しいメモを作成する:メモを選択し,提案されたアクションの1つを選択して,その内容に基づいて新しいメモを作成する.たとえば,すべてのメモを選択し,学習ガイドの作成を選択するなどが可能.
- 新しいメモを書く:メモセクション(質問入力部位の左にある「チャットを閉じる」をクリック)の左上にある「メモを追加」をクリックすると,新規にメモを作成できる.

■作成したメモの右上にある□のチェックボックスをクリックすると,下のチャットモードが起動し,メモ内容からAIへの質問・指示が可能である.
【AI】多数のアップロードした文書に特化したAIチャットアプリ「NotebookLM」の強みと弱点_e0255123_14573570.png
■1つのノートブックには最大1000件のノートを作成できる.

(4)ノートブックの共有

■各ノートブックの右上に共有ボタンがあり,これをクリックすると別のユーザーのメールアドレス(自分のアカウントと同じドメインのみ)を追加することで共有ができる.追加されたユーザーのアクセス権に関しては閲覧者か編集者のいずれかを指定できる.
- 閲覧者:共有ノートブック内のソースとメモの読み取り専用のアクセス権を有する.
- 編集者:共有ノートブック内のソースとメモを表示,追加,削除したり,他のユーザーとさらに共有することができる.

■共有できる個人ユーザー数は最大で50人であるが,Googleグループとは共有は不可.企業アカウントでは,ノートブックを共有できるユーザー数に制限はない.

(5)ノートブックガイド
■プロンプト入力欄の右に「ノートブックガイド」というものがあり,ここをクリックすると以下の5つから選択してメモが自動作成される.
- よくある質問:FAQを自動作成
- 学習ガイド:ソース内容から問題を自動的に出題することができる
- 目次:ソースから目次を自動生成する
- タイムライン:ソース内の時系列や登場人物についての情報を自動作成する
- ブリーフィング・ドキュメント:ソース内容の概要を自動的に作成する

3.NotebookLMの弱点

■SNSではNotebookLMを賞賛する投稿であふれているが,当然ながら弱点がある.

(1)言語の壁
■NotebookLMに搭載されているAIモデルであるGemini-1.5Proは日本語能力にかなり優れており,ChatBot Arenaでも他のモデルをおさえてトップだったことが話題になっている.しかしながら,ことNotebookLMにおいては,ソースとしてアップロードした文書が英語であった場合,日本語で質問した時の精度がやや落ちているようである.質問の日本語を英語に変換した上でソースから検索するというワンステップ多い過程となるため,ここがボトルネックになっているようである.

(2)連続した会話が成立しにくい
■通常のAIチャットボットは,文書の内容だけでなく,ユーザーと繰り返す対話の文脈も考慮して回答を生成する.NotebookLMの場合は,あくまでアップロードされた文書の内容のみに基づいて回答が生成されるため,文脈を考慮した柔軟な対話が難しい.

(3)通常のGemini-1.5Proとの会話と比べて柔軟性や応用性が損なわれている
■NotebookLMではソースからの情報に特化し,それ以外の情報(元々AIが有している知識等)は出力しない仕様となっているため,柔軟な対応や応用性が損なわれている.このため,思っていた回答がなされなかったり回答を拒否されることもある.大量の文書の処理や正確性を求めるならNotebookLMがいいが,もし柔軟性や応用性を求めるならば,通常のGemini-1.5Proやその他大規模言語モデルのAIチャットボットにアップロードして質問・指示した方がいいだろう.

(4)機能性が会話に限定される
■ファイルをアップロードしてのカスタマイズしたプライベートRAGとしてのAIチャットボットにはGPTsやPoeの自己作成ボット,Cozeアプリなどがあり,これらはbotを呼び出したり,解析やウェブアクセス等の他の機能も同時に使用できる.NotebookLMは会話機能以外が一切できない仕様であり,こういった機能性を有していない.

■このため,使い勝手を知るならば,GPTs,Poe,Cozeなどを触った上でソース内容とその使用目的でNotebookLMと使い分けをした方がいいだろう.GPTs作成は有料であるが,Poeボット(一部有料のモデルもあり),Cozeは無料で使用できる.

(5)プロンプトの工夫があまり通用しない可能性
■NotebookLMは見ての通りチャットのプロンプト入力部分が非常に狭い上に改行もできない.改行したプロンプトをコピペして実行してもチャット上には反映されていない.長く複雑なプロンプトを想定したつくりにはなっていないのかもしれない.

(6)スマートフォンからは扱いづらい
■スマートフォンでもNotebooLMの使用はできるが,表示があまりよくなく,ソースをアップロードする際のエラーもでやすい.

(7)チャット履歴が自動で保存されない
■前述の通り,チャット履歴は自動では保存されず,メモに移す必要がある.

(7)メモ保存で表形式が崩れる
■チャットでは表形式で出力させることも可能だが,これをメモに保存した場合,表形式が崩れてしまう.

(8)APIがない
■NotebookLMには利用できるAPIがない.このため,外部からNotebookLMの情報をリクエストすることはできない.
# by DrMagicianEARL | 2024-06-12 15:16 | 医学・医療とAI
【AI】出版プラットフォーム「Perplexity Pages」で簡単にソース付き情報ページ作成_e0255123_13475757.png
■元GoogleのAIチームのメンバーが立ち上げたAI検索のPerplexityは,その検索機能のみならず,マルチ機能も有し,GPT-4やClaude-3など他のAIの大規模言語モデルとの連携も可能であることからこの1年で非常に人気が高まった.

■そのPerplexityが,今度は「Perplexity Pages」というサービスを開始した.このサービスは,いわゆる出版プラットフォームで,タイトルを入力するだけでそれに応じた情報をPerplexityが検索し,AIによってソース付きで文章化し,画像もつけるなど視覚的にも見映えがするコンテンツを瞬時に作成することができる.現時点で利用できるのはPerplexity Proに登録している有料会員($20/月のサブスクリプション)のみである.Google検索などで上位にきやすいという声もあり,SEO(Search Engine Optimization)対策としても重要なサービスかもしれない.

■Perplexity Pagesの使い方について,筆者自身が「Perplexity Pages入門ガイド」というPageを作成したので,そちらを参照されたい.
Perplexity Pages入門ガイド
https://www.perplexity.ai/page/Perplexity-Pages-ahVXIkl0RhGdSNprsz.m7w
【AI】出版プラットフォーム「Perplexity Pages」で簡単にソース付き情報ページ作成_e0255123_14014719.png

# by DrMagicianEARL | 2024-06-07 14:02 | 医学・医療とAI
【AI/無料で使用可能】論文/学会の抄録作成自動化・書き方学習GPT(Abstract Creator and Teacher GPT)_e0255123_14444418.png
■論文や学会のタイトル・抄録(Abstract)は,その研究の顔ともいえる重要な部分であるが,これをうまくまとめるには,基本ルールの習得と慣れが必要である.今回,NEJM(the New England Journal of Medicine)風の抄録を作成できる,もしくは抄録の作成方法を学べるGPTs「Abstract Creator and Teacher GPT」を筆者が作成したので公開する.このGPTsは,URLベースで公開しているため,ChatGPT無料ユーザーでも使用可能である
Abstract Creator and Teacher GPT
https://chatgpt.com/g/g-Gu7NbTqjw-abstract-creator-and-teacher-gpt

1.NEJM誌の抄録はなぜ評価されるのか?

■このGPTではベースの抄録の書き方をNEJM風にしている.論文・研究内容を抄録にまとめる上で非常に参考になるのはNEJMである.余計なことは書かない簡潔性と,必要な情報はしっかりと盛り込む情報量のバランスが非常によくとれており,読みやすいことでも有名である.

(1)明確さと簡潔さ
■NEJMの抄録は非常に明確で簡潔である.研究の目的,方法,結果,結論が明瞭に述べられており,読者が短時間で重要な情報を把握できるようになっている.また,NEJMは医学において特定の領域の雑誌ではないため,幅広い領域の査読者・読者が閲覧するため,誰でも分かりやすい書き方となっている.

(2)厳密な標準化
■NEJMの抄録は厳密に標準化されており,各セクションで含めるべき情報が明確に定義している.これにより,抄録の質と一貫性が保たれている.

(3)統計的詳細の提供
■NEJMの抄録は,主要な結果に対する具体的な統計的な指標(例:相対リスク,信頼区間,P値)を必ず明示的に示すしている.これにより,読者は結果の信頼性や重要性をすぐに評価できる.

(4)クリアな結論
■NEJMの抄録は,結論部分が明確で強調されており,副次評価項目がどうだった,研究者の思いなど余計なことは書かれていない.これにより,読者は研究の主要な貢献や意義をすぐに把握できる.

(5)エディトリアルサポート
■NEJMは執筆者に対して強力なエディトリアルサポートを提供しており,抄録の内容や表現を洗練するための支援を行っていて,これにより論文全体の質が高まっている.

2.Abstract Creator and Teacher GPTの機能

■本GPTsは,研究・論文内容をアップロードもしくはプロンプトに入力し,タイトル・抄録作成を指示するとタイトルと抄録が作成される他,タイトルと抄録の作成方法のレクチャーを受けることもできる.

(1)タイトル作成
■本GPTでは,過去のガイドライン等をふまえて,論文・研究内容から,論文内の重要ポイントを前面にだしたタイトル構成になるように指示している.

(2)抄録作成
■本GPTはNEJMの抄録の特性と抄録作成の基本ルールに則った抄録作成をベースとするが,勿論,研究デザイン,構成,文字数をプロンプトで指示することでカスタマイズすることも可能である.文字数制限に関してはCode Interpreter(Advanced Data Analysis)で確認するよう指示しているため,単なるプロンプト指示よりも正確である.

(3)タイトル・抄録の書き方のレクチャー
■いくらGPTsが抄録を作成してくれると言っても,自分の研究であり,その重要ポイントがどこなのか,何を伝えたいのか,などは本人でなければ分かりにくい.もっとも,ChatGPT自体は内容圧縮が得意でも,重要ポイントを選定するタスクはそこまで得意ではない(Claude-3の方が得意).やはりAIが作成するものは参考程度にすべきで,最終的には自分でタイトルと抄録を書くべきである

■タイトル・抄録の書き方・考え方については,ChatGPT自体がレクチャーもできるが,本GPTでは,学会・論文でのタイトル・抄録作成のためのガイドラインや抄録作成を効果的に学生にレクチャーする方法の論文などを3本アップロードしており,それらもChatGPTが参照した上でのレクチャーを受けることができる.

3.本GPT作成の特徴

■このGPTsの精度も知ってもらう上で,作成方法についても言及しておく.このGPTsでは,指示(Intsructions)と知識(Knowledge)を作成する上で,以下のような精度を高めるための工夫を施している.

(1)指示(Instructions)の工夫
■本GPTsの特徴は,単に指示(Instructions)に文章を入れただけというわけではない.GPTsを作成する上で,「より指示を理解して正確に回答を出力する」ための工夫を施している.具体的には,2024年5月25日にOpenAIから公開された「カスタムGPTの指示書を作成するための重要なガイドライン」を遵守し,また,GPTが理解しやすいようにYAML形式でInstructionsを構成している
カスタムGPTの指示書を作成するための重要なガイドライン
2024年5月25日 OpenAI
https://help.openai.com/en/articles/9358033-key-guidelines-for-writing-instructions-for-custom-gpts
(2)知識(Knowledge)の工夫
■知識(Knowledge)には,学会・論文でのタイトル/抄録作成のためのガイドライン等を3つアップロードしており,ChatGPTがそれらを参照して回答できるようになっている.ただし,ガイドラインをそのままpdfファイルでアップロードした場合,テキスト抽出過程が入るため,情報の解析に時間がかかってしまう.このため,pdfファイルから重要な部分をClaude-3でまとめ,それらをテキストファイルでYAML形式にしてアップロードしている.このやり方の方が階層構造をもつガイドラインを整理しやすく,プログラムやスクリプトによる解析が容易で,GPTsが読み取りやすい.また,内容がまとめられているため,ガイドライン原本よりも情報量が圧縮されているぶんより早く情報を取得できる.
# by DrMagicianEARL | 2024-05-27 14:46 | 医学・医療とAI

by DrMagicianEARL