【AI】GoogleのAIであるGemini Advancedに高性能のGemini-1.5Proが搭載
1.4月9日に開放されたGemini-1.5Pro
■Geminiには,ハイスペックで,最大で1時間の動画や70万語のテキストを扱える次世代モデル「Gemini-1.5Pro」が存在したが,一部のユーザーしか使用できない限定テストの状態であった.4月9日になってAPI経由であれば誰でも使用できるようになった(逆にWeb版やアプリではまだ利用できなかった).音声を理解する機能(音声翻訳機能はOpenAIによるテストでGPT-4oと同等レベル)やファイルを処理しやすくするAPIが搭載され,さらに開発者がモデルの出力をより詳細に制御できるようにするシステム命令やJSONモードなども搭載された.そして5月15日のアップデートではこのGemini-1.5ProがWeb版およびアプリのGemini Advancedで利用できるようになった.
■Gemini-1.5Proは,GPT-4が用いているTransformerだけでなく,Mixture-of-Expertも取り入れており,入力に応じて最も関連性の高いエキスパートのニューラルネットワークのみを選択的に活性化させることでモデルの効率性が大幅に向上した.
2.5月15日のGemini Advancedのアップデート内容
(1)Gemini-1.5ProをGemini Advancedに導入
■Gemini-1.5ProがGemini Advancedに導入されたことで,ようやくWeb版やアプリでも使用が可能になった(これによりGemini-1.0Ultraは廃止).Gemini Advancedは有料プランであり,Googleが提供するストレージ(容量)を増やす有料サービスGoogle One(https://one.google.com/about?hl=ja)にアクセスして,AI Premiumプランに登録することで利用可能となる.
(2)日本語対応が可能となった
■Gemini Advancedでは,最もハイスペックなGemini-1.0Ultraが使用できたが,必ずしもUltraで回答されるわけではなく,無料のGemini Proとの違いが分からない,GPT-4より見劣りする,といった声が聞かれていた.これはGemini-1.0Ultraが日本語対応していないかったため,Googleアカウントの言語設定を英語に設定した上で英語で質問する必要があったからである.このため,日本人には使いづらいものであったが,今回のアップデートではGemini-1.0UltraからGemini-1.5Proに変更されて日本語対応も可能となったことから,以前よりも日本語でのチャット性能が向上している.
(3)コンテキストウィンドウ強化
■機械学習の向上によりコンテキストウィンドウで最大100万トークンもの膨大な情報を処理可能になっている.GPT-4oが12万8000トークンであることを考えるとGemini-1.5Proは圧倒的な処理量で,これはハリーポッターの全書籍の8割の量に相当する.これによりこれまでよりも複雑な問題を解決できるようになり,情報の探索と分析の時間が節約され,生産性の向上が期待される.また,約100通の電子メールを要約することが可能である.
■なお,Google AI StudioかVertex AIのwaiting listに登録する必要があるが,コンテキストウィンドウをさらに倍の200万トークンに増やすことも可能である.
(4)Googleが提供している他のサービスとの連携
プロンプトに「@」マークを入力すると,連携できる機能が選択できるBoxが現れ,Googleの他のサービス機能を呼び出せる.連携できるのはGmail,Googleドキュメント,Googleドライブ,Googleフライト,Googleホテル,Googleマップ,YouTubeである.
■前述の連携機能でのGoogleドライブまたはデバイスから複数のGoogleドキュメント,PDFファイル,Wordファイルをシームレスにアップロードすることが可能となった.
(6)画像認識
■以前からGeminiでは画像認識が可能であったが,Gemini-1.5ProではGPT-4oと遜色ないレベルの画像認識機能にまで向上している.
(7)動画解析
■動画解析機能は全AIの中で最も優れており,GPT-4oでは困難な長い動画の解析も可能である.
(6)数カ月以内にGemini Live搭載へ
■今回のアップデートでは未搭載であるが,Gemini Advancedユーザー向けの音声会話機能「Gemini Live」が数ヵ月以内に公開されるとのことである.また,2024年後半にはGemini Live使用時にカメラを利用できるようにする予定とのことである.
3.アプリについて
■Geminiは5月からGoogleアプリで使用することができるようになった.Googleアプリを開いて,一番上の検索の横にある星マークをタップするとGeminiに切り替わる.
iOS版(App Store)
https://apps.apple.com/jp/app/google-アプリ/id284815942
アンドロイド版(Google Play)
https://play.google.com/store/apps/details?id=com.google.android.googlequicksearchbox&hl=ja&gl=US