Googleは、AIモデルGemini 1.5シリーズの大幅なアップデートを発表した。新たにリリースされた「Gemini-1.5-Pro-002」と「Gemini-1.5-Flash-002」は、性能の向上と大幅な価格引き下げを実現し、特に開発者にとっては価格引き下げの恩恵は大きそうだ。
Gemini 1.5は継続的にアップデート中
今回のアップデートでは、Gemini 1.5シリーズの性能が全面的に向上している。特筆すべき改善点として、MMLU-Pro(より難易度の高いMMMLUベンチマーク)で約7%の向上が見られた。さらに、数学関連のベンチマークであるMATHとHiddenMathでは、驚異の20%という大幅な性能向上を達成している。
視覚認識やコード生成のタスクにおいても、2%から7%の改善が確認されており、AIの汎用性がさらに高まったことを示している。Googleは、これらの改善に加えて、モデルの応答の有用性も向上させたとしている。
新モデルの特徴として、より簡潔な応答スタイルが採用されている。これにより、要約や質問応答、情報抽出などのタスクにおいて、デフォルトの出力長が従来モデルと比較して5%から20%短縮されている。この変更は、モデルの使いやすさの向上とコスト削減につながると期待されている。
さらに注目すべき点は、Gemini 1.5 Proの大幅な価格引き下げだ。10月1日から、128,000トークン未満のプロンプトに対して、入力トークンが64%、出力トークンが52%、インクリメンタルキャッシュトークンが64%の価格削減が実施される。これにより、AI開発のコストが大幅に低減されることになる。
開発者に嬉しい数々の改善
Googleは、開発者がより複雑なAIアプリケーションを構築できるよう、レート制限も大幅に引き上げた。有料版の1.5 Flashは毎分2,000リクエスト(RPM)、1.5 Proは1,000RPMまで処理可能となり、それぞれ従来の1,000RPMと360RPMから大幅に向上している。
さらに、新モデルではレイテンシーの削減も実現している。開発者は2倍高速な出力と3倍低いレイテンシーを期待できる。これにより、リアルタイム性の高いアプリケーションの開発が可能になると考えられる。
Googleは、AIコンテンツの安全性フィルターに関しても変更を加えた。新しい-002モデルでは、デフォルトではAIコンテンツ安全性フィルターを適用せず、代わりに開発者が要件に基づいてフィルターを使用できるようにした。これにより、開発者はより柔軟にモデルを利用できるようになる。
さらに、Googleは「Gemini-1.5-Flash-8B-Exp-0924」という改良版の実験的モデルもリリースした。このモデルは、テキストとマルチモーダルの両方のユースケースで大幅な性能向上を実現している。
これらの更新されたGemini 1.5モデルは、Google AI StudioとGemini APIを通じて開発者が利用可能となっている。また、大規模企業やGoogle Cloudの顧客向けには、Vertex AI上でも新しいGemini 1.5モデルが利用可能だ。
なお、Gemini Advancedユーザーに向けては、近日中にGemini 1.5 Pro-002のチャット最適化版がリリースされる予定だという。
Xenospectrum’s Take
Googleの継続的なGeminiシリーズのアップデートは、AI業界に大きな影響を与える可能性がある。性能向上と価格引き下げの両立は、AI開発の民主化をさらに推し進めるだろう。特に、数学や長文脈理解、視覚タスクでの改善は、AIの応用範囲を大きく広げる可能性を秘めている。
一方で、AIコンテンツ安全性フィルターのデフォルト解除は、開発者に大きな自由度を与える反面、AIの倫理的利用に関する責任も増大させる。この点については、業界全体での議論と基準作りが今後さらに重要になるだろう。
Gemini 1.5シリーズの進化は、GoogleがAI分野でのリーダーシップを強化する動きと見ることができる。現在のAI業界ではやはりGoogleの動きには注目せざるを得ず、同社の動向が今後、他の大手テック企業や新興AIスタートアップに与える影響に注目したいところだ。
Source
コメント