Chatbot Arenaは公平に運営されているのか?研究が人気のAIベンチマークにおける大手テック企業優遇の偏りを指摘
学術研究から誕生したプラットフォームであるChatbot Arenaは、競争の激しいAI業界において急速に主要なベンチマークとなった。ユーザーの好みによるクラウドソーシングで構成される「Chatbot Arena LLM […]
Tech Product
Meta社が開発・公開しているオープンな大規模言語モデル。
全 224 件 / 19 ページ
学術研究から誕生したプラットフォームであるChatbot Arenaは、競争の激しいAI業界において急速に主要なベンチマークとなった。ユーザーの好みによるクラウドソーシングで構成される「Chatbot Arena LLM […]
Microsoft CEOのSatya Nadella氏が2025年4月29日、同社のコードベースの約20〜30%が人工知能(AI)によって生成されていることを明らかにした。この発言はMetaが主催する初のLlamaCo […]
Metaは初のAI開発者会議「LlamaCon」で、一般ユーザー向けのスタンドアロンAIアシスタントアプリ「Meta AI」と、開発者向けのプラットフォーム「Llama API」を発表した。これにより、OpenAIのCh […]
中国のテクノロジー大手Alibabaは、最新の大規模言語モデル(LLM)ファミリー「Qwen3」を発表した。複数のベンチマーク評価において、OpenAIの「o1」やDeepSeekの「R1」といった競合モデルを上回る性能 […]
MetaとBooz Allen Hamiltonが共同開発したAI技術スタック「Space Llama」が、国際宇宙ステーション(ISS)の米国国立研究所に配備された。オープンソースのAIモデルLlama 3.2を基盤と […]
人気法廷バトルゲーム『逆転裁判』が、最新AIモデルの推論能力を測る意外なベンチマークとして使用され、話題を呼んでいる。カリフォルニア大学サンディエゴ校のHao AI Labが行ったこのテストでは、OpenAIやGoogl […]
MIT発のAIスタートアップLiquid AIが、スマートフォンなどのエッジデバイス向けに設計された新しいAIモデル「Hyena Edge」を発表した。これは、現在主流のTransformerアーキテクチャに代わる可能性 […]
Microsoft Researchが、AIの世界に新たな可能性を示す超軽量大規模言語モデル(LLM)「BitNet b1.58 2B4T」を発表した。このモデルは、AppleのM2チップを含む一般的なCPUでも効率的に […]
OpenAIは最新のAI推論モデル「o3」と「o4-mini」をリリースした。この新モデルは同社が「史上最も高性能な推論モデル」と位置づける画期的な進化を遂げたAIシステムだ。特筆すべきは「画像で思考する」能力と、複数の […]
AIによるコード生成が急速に進化し、ソフトウェア開発の現場を変えつつある。しかし、開発プロセスにおいて最も時間と労力を要すると言われる「デバッグ」作業においては、AIはまだ人間の熟練プログラマーに遠く及ばないのが実情だ。 […]
TikTokの親会社であるByteDanceが、新たな高性能推論AI「Seed-Thinking-v1.5」を発表した。MoEアーキテクチャと独自の強化学習技術を駆使し、主要ベンチマークでGoogleのGemini 2. […]
ここ1週間、AIチャットボットが公式にチューリング・テストに合格したというニュース見出しがいくつか出ている。 これらのニュース報道は、カリフォルニア大学サンディエゴ校の2人の研究者による最近のプレプリント研究に基づいてお […]