Google、Gemini 3発表。AI性能競争の王座奪還か
Googleは2025年11月19日(現地時間)、同社の最新かつ最も高性能なAIモデル群「Gemini 3」を正式に発表した。主要な性能評価指標(ベンチマーク)で競合を軒並み上回り、独立系分析機関からは「市場で最も知的な […]
Term
ソフトウェア工学の課題解決能力を測定する、検証済みのベンチマーク。
全 35 件 / 3 ページ
Googleは2025年11月19日(現地時間)、同社の最新かつ最も高性能なAIモデル群「Gemini 3」を正式に発表した。主要な性能評価指標(ベンチマーク)で競合を軒並み上回り、独立系分析機関からは「市場で最も知的な […]
中国のAIスタートアップMoonshot AIが発表したオープンソースモデル「Kimi K2 Thinking」が、主要な性能ベンチマークでOpenAIのGPT-5やAnthropicのClaude Sonnet 4.5 […]
AIスタートアップのAnthropicは10月15日(現地時間)、同社の言語モデルファミリーに最新の小型モデル「Claude Haiku 4.5」を追加したと発表した。わずか5カ月前に最先端とされた中位モデル「Claud […]
AI企業Anthropicは9月30日、最新モデルClaude Sonnet 4.5を発表した。同社は「世界最高のコーディングモデル」と明言し、複雑なエージェント構築とコンピューター操作において最強のモデルであると位置づ […]
Metaが、AIによるコード生成の常識を大きく変える可能性を持った新しい研究モデル「Code World Model(CWM)」を発表した。これは単に既存のコードを学習し、次に来るテキストを予測する従来のモデルとは一線を […]
OpenAIが、ソフトウェア開発を大きく変える可能性を秘めた新型AIモデル「GPT-5 Codex」を発表した。このモデルで特筆すべきはこれまでのどちらかと言えば漸進的な性能向上に留まらない、その持久力にある。GPT-5 […]
AI開発企業Anthropicが、新たに130億ドル(約1.95兆円)という驚異的な規模の資金調達を完了した。これにより、同社の評価額は1,830億ドル(約27.45兆円)に達したことも併せて明らかになった。これは、AI […]
OpenAIが、待望の次世代AIモデル「GPT-5」を正式に発表した。単なる性能向上に留まらず、AIとの関わり方を根底から変えうる「思考能力」を搭載し、無料ユーザーを含む全ChatGPTユーザーに提供される。同社はこの最 […]
中国のAIスタートアップ、Moonshot AIが発表したオープンソースモデル「Kimi K2」がAI業界に波紋を広げそうだ。これは単なる高性能な大規模言語モデル(LLM)の登場ではなく、AI開発の根底に横たわる「経済学 […]
フランスのAIスタートアップMistral AIが、エンタープライズ向けAIコーディングアシスタント「Mistral Code」を発表した。これは、市場をリードするMicrosoftのGitHub Copilotや他のシ […]
Anthropic社が2025年5月23日に発表した最新の大規模言語モデル(LLM)「Claude Opus 4」。コーディングや長文の推論タスクにおいて目覚ましい性能向上を謳う一方で、その内部テストからは、AIの安全性 […]
フランスのAIスタートアップMistral AIが、新たなオープンソースLLM(大規模言語モデル)「Devstral」を公開した。240億パラメータという、近年の巨大モデルと比較すると軽量な設計でありながら、主要なソフト […]