人気ブログランキング | 話題のタグを見る
ブログトップ

EARLの医学ノート

drmagician.exblog.jp

敗血症をメインとした集中治療,感染症,呼吸器のノート.医療におけるAIについても

【AI】GoogleのAIであるGemini Advancedに高性能のGemini-1.5Proが搭載

【AI】GoogleのAIであるGemini Advancedに高性能のGemini-1.5Proが搭載_e0255123_17073861.png
■2024年2月8日にリリースされた,Google最強のAIであるGeminiがBardと入れ替わる形で利用可能となったが,機能が不完全で,他のGoogleアプリとの連携も未完成であったこと,その後3月4日にClaude-3がリリースされたことから,Geminiを使用する人は大幅に減ったと思われる.だが,今回,Googleは大規模なアップデートを5月15日にGoogle I/O 2024で発表した.OpenAIが意図的に狙ったのかは不明だが,GPT-4oのリリースを同じ日にかぶせてきたため,Googleの発表は霞んでしまったものの,アップデート内容は必見である.何より,Googleは多数のアプリケーションを有しており,Geminiでこれらとの連携が可能になるのは大きい.

1.4月9日に開放されたGemini-1.5Pro

■Geminiには,ハイスペックで,最大で1時間の動画や70万語のテキストを扱える次世代モデル「Gemini-1.5Pro」が存在したが,一部のユーザーしか使用できない限定テストの状態であった.4月9日になってAPI経由であれば誰でも使用できるようになった(逆にWeb版やアプリではまだ利用できなかった).音声を理解する機能(音声翻訳機能はOpenAIによるテストでGPT-4oと同等レベル)やファイルを処理しやすくするAPIが搭載され,さらに開発者がモデルの出力をより詳細に制御できるようにするシステム命令やJSONモードなども搭載された.そして5月15日のアップデートではこのGemini-1.5ProがWeb版およびアプリのGemini Advancedで利用できるようになった.

■Gemini-1.5Proは,GPT-4が用いているTransformerだけでなく,Mixture-of-Expertも取り入れており,入力に応じて最も関連性の高いエキスパートのニューラルネットワークのみを選択的に活性化させることでモデルの効率性が大幅に向上した.

2.5月15日のGemini Advancedのアップデート内容

(1)Gemini-1.5ProをGemini Advancedに導入
■Gemini-1.5ProがGemini Advancedに導入されたことで,ようやくWeb版やアプリでも使用が可能になった(これによりGemini-1.0Ultraは廃止).Gemini Advancedは有料プランであり,Googleが提供するストレージ(容量)を増やす有料サービスGoogle One(https://one.google.com/about?hl=ja)にアクセスして,AI Premiumプランに登録することで利用可能となる.
【AI】GoogleのAIであるGemini Advancedに高性能のGemini-1.5Proが搭載_e0255123_17164292.png
■料金は月額$20(2900円)であり,GPT-4が利用できるChatGPT Plus会員とほぼ同額であるが,Gemini Advanced利用を含めたGoogle Oneのサービス(クラウドサービスGoogle drive,メールサービスGmail,画像保存サービスGoogle Photoなど)を保存容量を2TBまで大幅に増やして利用できるようになる他,利用者専用の特典を受けられるため,ChatGPT Plusよりお得といえる.また,最初の2ヵ月間は試用期間として無料で利用できる.

(2)日本語対応が可能となった
■Gemini Advancedでは,最もハイスペックなGemini-1.0Ultraが使用できたが,必ずしもUltraで回答されるわけではなく,無料のGemini Proとの違いが分からない,GPT-4より見劣りする,といった声が聞かれていた.これはGemini-1.0Ultraが日本語対応していないかったため,Googleアカウントの言語設定を英語に設定した上で英語で質問する必要があったからである.このため,日本人には使いづらいものであったが,今回のアップデートではGemini-1.0UltraからGemini-1.5Proに変更されて日本語対応も可能となったことから,以前よりも日本語でのチャット性能が向上している.

(3)コンテキストウィンドウ強化
■機械学習の向上によりコンテキストウィンドウで最大100万トークンもの膨大な情報を処理可能になっている.GPT-4oが12万8000トークンであることを考えるとGemini-1.5Proは圧倒的な処理量で,これはハリーポッターの全書籍の8割の量に相当する.これによりこれまでよりも複雑な問題を解決できるようになり,情報の探索と分析の時間が節約され,生産性の向上が期待される.また,約100通の電子メールを要約することが可能である.

■なお,Google AI StudioかVertex AIのwaiting listに登録する必要があるが,コンテキストウィンドウをさらに倍の200万トークンに増やすことも可能である.

(4)Googleが提供している他のサービスとの連携
プロンプトに「@」マークを入力すると,連携できる機能が選択できるBoxが現れ,Googleの他のサービス機能を呼び出せる.連携できるのはGmail,Googleドキュメント,Googleドライブ,Googleフライト,Googleホテル,Googleマップ,YouTubeである.
【AI】GoogleのAIであるGemini Advancedに高性能のGemini-1.5Proが搭載_e0255123_17133471.png
(5)ファイルアップロードが可能に
■前述の連携機能でのGoogleドライブまたはデバイスから複数のGoogleドキュメント,PDFファイル,Wordファイルをシームレスにアップロードすることが可能となった.

(6)画像認識
■以前からGeminiでは画像認識が可能であったが,Gemini-1.5ProではGPT-4oと遜色ないレベルの画像認識機能にまで向上している

(7)動画解析
■動画解析機能は全AIの中で最も優れており,GPT-4oでは困難な長い動画の解析も可能である.

(6)数カ月以内にGemini Live搭載へ
■今回のアップデートでは未搭載であるが,Gemini Advancedユーザー向けの音声会話機能「Gemini Live」が数ヵ月以内に公開されるとのことである.また,2024年後半にはGemini Live使用時にカメラを利用できるようにする予定とのことである.

3.アプリについて

■Geminiは5月からGoogleアプリで使用することができるようになった.Googleアプリを開いて,一番上の検索の横にある星マークをタップするとGeminiに切り替わる.
iOS版(App Store)
https://apps.apple.com/jp/app/google-アプリ/id284815942
アンドロイド版(Google Play)
https://play.google.com/store/apps/details?id=com.google.android.googlequicksearchbox&hl=ja&gl=US

by DrMagicianEARL | 2024-05-16 17:39 | 医学・医療とAI

by DrMagicianEARL