人気ブログランキング | 話題のタグを見る
ブログトップ

EARLの医学ノート

drmagician.exblog.jp

敗血症をメインとした集中治療,感染症,呼吸器のノート.医療におけるAIについても

【AI】多数のアップロードした文書に特化したAIチャットアプリ「NotebookLM」の強みと弱点

多数のアップロードした文書に特化したAIチャットアプリ「NotebookLM」の強みと弱点
【AI】多数のアップロードした文書に特化したAIチャットアプリ「NotebookLM」の強みと弱点_e0255123_13162061.jpg
■Googleから新たなAIツール「NotebookLM」が試験的に無料公開された.NotebookLM自体は2023年の開発者向けカンファレンスGoogle I/O 2024の基調講演で発表されたサービスで,2023年12月8日から米国アカウントのみで使用可能となり,開発者や企業がGoogle AI StudioやGoogle Cloud Vertex AIのAPIを通してGemini-1.0Proを搭載したNotebookLMが利用できた.今回はそれが大幅アップデートされ,かつ世界200か国で公開され,SNSでもかなり話題となっている.

1.NotebookLMとは何か?

■NotebookLMは作家のSteven Johnson氏とのパートナーシップで設計されたもので,ユーザーがパソコン,Google Drive,Googleスライド,ウェブサイト,あるいはテキストの直接入力から複数のドキュメントを1つのデジタルノートスペースにアップロードし,Google最新のAIであるGemini-1.5Proを通して会話し,アップロードしたドキュメントを使用して回答できるような質問をすることができるように設計されている.

■これはプライベートRAG(Retrive-Augumented Generation)と呼ばれる機能で,入力されたクエリに関連する情報を大規模なデータベースから検索し,その情報を利用して回答を生成する手法である.NotebookLMは,ユーザーのアップロードしたローカル資料を基盤として言語モデルを構築することで,個々のニーズに最適化されたインサイトを提供する.このソースグランディングによって,AIが提供する情報の信頼性と関連性が高まる.通常のLLMモデルとは異なり,NotebookLMは入力データに書かれていないことには回答を拒否する場合があるため,事実と異なる情報を生成するリスクが低い.
【AI】多数のアップロードした文書に特化したAIチャットアプリ「NotebookLM」の強みと弱点_e0255123_15195142.png
■例えば,医学研究者がNotebookLMに複数の論文をアップロードし,特定のトピックに関する質問をすると,NotebookLMはアップロードされた論文の内容に基づいて正確な回答を生成することができる.特定の疾患についてのレビュー論文やガイドラインなどを複数アップロードすれば,その疾患について非常に詳しいボットを作成することができる.

■Gemini-1.5Proは,2024年2月8日にリリースされ,4月9日にはAPI開放,5月15日にはWeb版とGoogleアプリでGemini Advancedとして使用可能になったGoogleが誇る最新AIである.その強みはやはり,その膨大な処理能力にある.機械学習の向上によりコンテキストウィンドウで最大100万トークンもの膨大な情報を処理可能になっている.GPT-4oが12万8000トークンであることを考えると,Gemini-1.5Proは圧倒的な処理量で,これはハリーポッターの全書籍の8割の量に相当する.これによりこれまでよりも複雑な問題を解決できるようになり,情報の探索と分析の時間が節約され,生産性の向上が期待されている.NotebookLMに数十のソースをアップロードしてのプライベートRAGは他のAIにはなかなか真似できないだろう.

2.NotebookLMの機能

■ここでは,NotebookLMの機能について述べる.

(1)アップロードできるファイルの種類と数
■Notebookにアップロードできるファイルは以下の通りである.
・Googleドキュメント(Googleドライブから)
・Googleスライド(Googleドライブから)
・PDFファイル(.pdf)
・テキストファイル(.txt)
・コピペで直接入力したテキスト
・ウェブサイトURL
■アップロードファイルについての制限・応用は以下の通りである.
・アップロードできるファイル内容の上限は50万語まで.
・アップロードできるファイル数の上限は49(公開情報では50だが実際には49個までしかアップロードできない).・基本的には文書がメインだが,Googleスライドに限って言えば画像や表も可能.・ウェブサイトURLについては,そのウェブサイトがアップロード後に更新されても反映はされない.・NotionのURLでも内容を読み込むことが可能で,この場合は公開設定にした上でネット検索を可能にする必要がある.ただし,読み込みはあまりうまくいかない.・Excelファイル(あるいはCSVファイル)そのものは読み込めないが,PDFファイルもしくはJSON形式に変換した上での.txtファイルにすると読み込める.PDFファイル化する場合は,セル内改行を施しておく必要がある.
(2)質問する
■チャットボックスに質問や指示を書くことで,アップロードしたソースをもとにGemjni-1.5Proが回答する.言語は日本語でもよく,回答はあくまでソース情報のみしか生成しない(Gemini-1.5Proがもつ知識は適用されない).質問の際に使用するソースのファイルは選択が可能である(チェックボックスのon/off切り替え).なお,チャット内容は自動的には保存されないため,回答を保存したい場合は次に説明するメモ機能を使用する

■ほとんどの場合,AIの回答にはソースからの引用番号がつく.引用は直接引用であるため,引用の文章を確認することで,回答の正確性を確認したり,元の引用を見つけることができる.
【AI】多数のアップロードした文書に特化したAIチャットアプリ「NotebookLM」の強みと弱点_e0255123_13304580.png
【AI】多数のアップロードした文書に特化したAIチャットアプリ「NotebookLM」の強みと弱点_e0255123_13310315.png
(3)メモを使う
■NotebookLMにはメモ機能がついており,いくつかの使い方がある.
- メモにAIからの回答を保存する:回答を保存したい場合は,回答ボックスの右上にあるピンマークをクリックすると保存できる.保存された回答ノートは編集は不可である.
- ソースの1つから引用または要約を保存する:アップロードしたソースを読みながら,保存するテキストを選択し,メモに追加またはメモに要約を選択して新しいメモを作成できる.これらの保存されたメモは編集は不可である.
- 既存のメモを使用して新しいメモを作成する:メモを選択し,提案されたアクションの1つを選択して,その内容に基づいて新しいメモを作成する.たとえば,すべてのメモを選択し,学習ガイドの作成を選択するなどが可能.
- 新しいメモを書く:メモセクション(質問入力部位の左にある「チャットを閉じる」をクリック)の左上にある「メモを追加」をクリックすると,新規にメモを作成できる.

■作成したメモの右上にある□のチェックボックスをクリックすると,下のチャットモードが起動し,メモ内容からAIへの質問・指示が可能である.
【AI】多数のアップロードした文書に特化したAIチャットアプリ「NotebookLM」の強みと弱点_e0255123_14573570.png
■1つのノートブックには最大1000件のノートを作成できる.

(4)ノートブックの共有

■各ノートブックの右上に共有ボタンがあり,これをクリックすると別のユーザーのメールアドレス(自分のアカウントと同じドメインのみ)を追加することで共有ができる.追加されたユーザーのアクセス権に関しては閲覧者か編集者のいずれかを指定できる.
- 閲覧者:共有ノートブック内のソースとメモの読み取り専用のアクセス権を有する.
- 編集者:共有ノートブック内のソースとメモを表示,追加,削除したり,他のユーザーとさらに共有することができる.

■共有できる個人ユーザー数は最大で50人であるが,Googleグループとは共有は不可.企業アカウントでは,ノートブックを共有できるユーザー数に制限はない.

(5)ノートブックガイド
■プロンプト入力欄の右に「ノートブックガイド」というものがあり,ここをクリックすると以下の5つから選択してメモが自動作成される.
- よくある質問:FAQを自動作成
- 学習ガイド:ソース内容から問題を自動的に出題することができる
- 目次:ソースから目次を自動生成する
- タイムライン:ソース内の時系列や登場人物についての情報を自動作成する
- ブリーフィング・ドキュメント:ソース内容の概要を自動的に作成する

3.NotebookLMの弱点

■SNSではNotebookLMを賞賛する投稿であふれているが,当然ながら弱点がある.

(1)言語の壁
■NotebookLMに搭載されているAIモデルであるGemini-1.5Proは日本語能力にかなり優れており,ChatBot Arenaでも他のモデルをおさえてトップだったことが話題になっている.しかしながら,ことNotebookLMにおいては,ソースとしてアップロードした文書が英語であった場合,日本語で質問した時の精度がやや落ちているようである.質問の日本語を英語に変換した上でソースから検索するというワンステップ多い過程となるため,ここがボトルネックになっているようである.

(2)連続した会話が成立しにくい
■通常のAIチャットボットは,文書の内容だけでなく,ユーザーと繰り返す対話の文脈も考慮して回答を生成する.NotebookLMの場合は,あくまでアップロードされた文書の内容のみに基づいて回答が生成されるため,文脈を考慮した柔軟な対話が難しい.

(3)通常のGemini-1.5Proとの会話と比べて柔軟性や応用性が損なわれている
■NotebookLMではソースからの情報に特化し,それ以外の情報(元々AIが有している知識等)は出力しない仕様となっているため,柔軟な対応や応用性が損なわれている.このため,思っていた回答がなされなかったり回答を拒否されることもある.大量の文書の処理や正確性を求めるならNotebookLMがいいが,もし柔軟性や応用性を求めるならば,通常のGemini-1.5Proやその他大規模言語モデルのAIチャットボットにアップロードして質問・指示した方がいいだろう.

(4)機能性が会話に限定される
■ファイルをアップロードしてのカスタマイズしたプライベートRAGとしてのAIチャットボットにはGPTsやPoeの自己作成ボット,Cozeアプリなどがあり,これらはbotを呼び出したり,解析やウェブアクセス等の他の機能も同時に使用できる.NotebookLMは会話機能以外が一切できない仕様であり,こういった機能性を有していない.

■このため,使い勝手を知るならば,GPTs,Poe,Cozeなどを触った上でソース内容とその使用目的でNotebookLMと使い分けをした方がいいだろう.GPTs作成は有料であるが,Poeボット(一部有料のモデルもあり),Cozeは無料で使用できる.

(5)プロンプトの工夫があまり通用しない可能性
■NotebookLMは見ての通りチャットのプロンプト入力部分が非常に狭い上に改行もできない.改行したプロンプトをコピペして実行してもチャット上には反映されていない.長く複雑なプロンプトを想定したつくりにはなっていないのかもしれない.

(6)スマートフォンからは扱いづらい
■スマートフォンでもNotebooLMの使用はできるが,表示があまりよくなく,ソースをアップロードする際のエラーもでやすい.

(7)チャット履歴が自動で保存されない
■前述の通り,チャット履歴は自動では保存されず,メモに移す必要がある.

(7)メモ保存で表形式が崩れる
■チャットでは表形式で出力させることも可能だが,これをメモに保存した場合,表形式が崩れてしまう.

(8)APIがない
■NotebookLMには利用できるAPIがない.このため,外部からNotebookLMの情報をリクエストすることはできない.
by DrMagicianEARL | 2024-06-12 15:16 | 医学・医療とAI

by DrMagicianEARL