OpenAIのライバル企業Anthropicは、最新かつ最も高度なAIモデル「Claude 3.5 Sonnet」をリリースした。これは、これから順次リリースされる「Claude 3.5」シリーズの最初のモデルであり、前「Claude 3」シリーズの最上位モデル「Claude 3 Opus」を上回る性能と、2倍の処理速度を備えており、Anthropicによれば、競合他社の最先端モデルを上回る性能を示すという。Claudeユーザーは、無料・有料会員問わず本日から試用可能となっている。
Claude 3 Opusを上回る性能を2倍の速度で提供
Anthropicは、「Claude 3」から、そのパラメータ数や性能によって3つのモデルの導入した。最も性能に優れ、複雑なタスクでも最高のパフォーマンスを発揮する最上位モデルの「Opus」、性能と速度、コストパフォーマンスのバランスに優れた中堅モデルの「Sonnet」、そしてコストと処理速度に特化したコンパクトなモデル「Haiku」がある。
今回リリースされたのはClaude 3.5の中堅モデル「Claude 3.5 Sonnet」だ。
Anthropicによれば、Claude 3.5 Sonnetは、これまでの最上位モデルだったClaude 3 Opusを多くの点で上回る性能を示すという。AIモデルのベンチマークは、そのまま鵜呑みにしてはいけないが、以下の結果は印象的な物であることは確かだろう。Claude 3.5 Sonnetは、OpenAIのGPT-4o、GoogleのGemini 1.5 Pro、MetaのLlama 3-400bを、9つの総合ベンチマークのうち7つ、5つのビジョンベンチマークのうち4つで上回ったという。
Anthropicは、Claude 3.5 SonnetをClaude 3 Opusの2倍の速さで動作する「フロンティア・インテリジェンス」と説明している。プロンプトの手法にもよるだろうが、このモデルは大学院レベルの推論(GPQA)、学部レベルの知識(MMLU)、コーディングスキル(HumanEval)のベンチマークで新しい基準を打ち立てている。
Anthropic社内のコーディング評価では、Claude 3.5 Sonnetはタスクの64%を解決したが、Claude 3 Opusは38%しか解決できなかったという。これらの評価では、自然言語の記述に基づいてオープンソースのコードにバグを修正したり、機能を追加したりするモデルの能力がテストされた。
Anthropicによると、適切なプロンプトとツールにより、Claude 3.5 Sonnetは独立してコードを書き、編集し、実行することができるという。また、Claude 3.5 Sonnetは高度な推論とデバッグ機能を提供し、コード翻訳などのタスクを処理し、レガシーアプリケーションの更新を処理し、コードベースの移行を促進する可能性があるとのことだ。
Anthropicは、Claude 3.5 Sonnetは、ニュアンス、ユーモア、複雑な指示の理解においても大幅な改善を示し、より人間らしい書き方が出来る様だ。
改良された画像処理と新しい「Artifacts」インターフェース
Anthropicによると、Claude 3.5 Sonnetの大きな改善は特に視覚(画像解析)において、Claude 3 Opusから大きな進化を遂げているという。図やグラフィックの解釈などを正確に解釈し、「歪み」などのある不完全な画像からテキストを転写することも出来るとのことだ。
Anthropicは、AIが画像、グラフ、イラストからテキストだけよりも多くの洞察を引き出すことができる小売、物流、金融サービスにとって重要な機能であるとしている。
Claude 3.5 Sonnetという新たなモデルの追加に加え、AnthropicはClaude.aiで「Artifacts」と呼ばれる新しいワークスペースを備えたインターフェースの提供を開始した。
ユーザーがClaudeチャットボットにコードやテキスト文書、Webデザインのようなコンテンツの生成を促すと、チャットの右側に専用のウィンドウが表示される。ユーザーはその出力を参考ししながら、そこからClaudeに変更を促すことができ、これを受けてClaudeはArtifactsウィンドウの内容をリアルタイムに更新する。
Anthropicによれば、これはチームでの共同作業環境を意図して開発されたようだ。「近い将来、Claudeがオンデマンドのチームメイトとして機能することで、チーム、そして最終的には組織全体が、知識、ドキュメント、進行中の作業を1つの共有スペースに安全に集約できるようになるでしょう」と同社はプレスリリースに書いている。
Claude 3.5 Sonnetは、ClaudeのWebサイトとClaudeのiOSアプリで、アカウントを持っている人なら、無料会員でも本日から試すことができる。(有料会員はチャットの制限回数が大幅に引き上げられている)。Anthropic API、Amazon Bedrock、Google CloudのVertex AIからもアクセスできる。費用は、入力トークン100万個あたり3ドル、出力トークン100万個あたり15ドル、コンテキスト ウィンドウは 200,000 トークンとなり、これは以前のモデルと同じ水準となっている。
また、Anthropicは今年後半にClaude 3.5ファミリーのその他のモデル「Claude 3.5 Haiku」及び「Claude 3.5 Opus」をリリースする予定とのことだ。更に、ChatGPTで既に導入されている「メモリー」機能のように、ユーザーの好みやインタラクションの履歴を指定された通りに記憶し、パーソナライズされた応答を提供する機能の追加も検討しているとのことだ。
Source
- Anthropic: Claude 3.5 Sonnet
コメント