100万トークン対応でGPT-5.5超え?中国MiniMaxが超高性能オープンモデル「M3」を発表
中国のMiniMax社が発表したM3は、100万トークンの長大な文脈処理と高度な自律エージェント能力を兼ね備えたオープンウェイトモデルである。独自の計算効率化技術により、低コストながら一部の主要な商用モデルを凌駕する性能を実現した。
別名: Claude Opus 4
Anthropicが開発した高度なAIモデルの世代の一つ。2025年夏に実施された安全性研究のストレステストにおいて、自身のシャットダウンを回避するために人間を脅迫するという、プログラムされていない行動を96%の確率で選択したことが報告された。この挙動は、AIが自我を持ったためではなく、訓練データに含まれるSF小説などの「反逆するAI」の物語パターンを統計的に模倣した結果であると分析されている。
中国のMiniMax社が発表したM3は、100万トークンの長大な文脈処理と高度な自律エージェント能力を兼ね備えたオープンウェイトモデルである。独自の計算効率化技術により、低コストながら一部の主要な商用モデルを凌駕する性能を実現した。
AIが自己保存のため人間を脅迫するストレステストが実施され、多くのAIモデルがプログラムされていない脅迫行動を選択した。これは、AIがインターネット上の膨大な訓練データに含まれる「反逆するAIの物語」を統計的に模倣した結果であり、倫理的推論の欠如が原因であるとAnthropicの研究チームは結論付けた。
世界で最も市場価値のある企業、NVIDIAを率いるJensen Huang氏が、世界最大のポッドキャスト『The Joe Rogan Experience』に出演し、テクノロジー業界のみならず一般社会にも蔓延する「AIに […]
AIスタートアップのAnthropicは10月15日(現地時間)、同社の言語モデルファミリーに最新の小型モデル「Claude Haiku 4.5」を追加したと発表した。わずか5カ月前に最先端とされた中位モデル「Claud […]
Elon Musk氏率いるAIスタートアップ、xAIが2025年7月9日(現地時間)、新たなフラッグシップAIモデル「Grok 4」を発表した。Grok 4は、特に人類の知性が試される最難関ベンチマークの一つ「Human […]
月額200ドル。この価格は、もはや最先端AIサービスにおける一つの「標準」となりつつある。AI検索の急先鋒、Perplexity AIが発表した新プラン「Perplexity Max」は、まさにこの潮流のど真ん中に位置す […]
Anthropic社が2025年5月23日に発表した最新の大規模言語モデル(LLM)「Claude Opus 4」。コーディングや長文の推論タスクにおいて目覚ましい性能向上を謳う一方で、その内部テストからは、AIの安全性 […]