OpenAI、中国DeepSeekの「蒸留によるただ乗り」を米議会に警告
2025年初頭、シリコンバレーとワシントンの双方に激震が走った。中国・杭州を拠点とするAIスタートアップ、DeepSeekが公開した「DeepSeek-R1」は、米国製モデルに匹敵する性能をわずかなコストで実現したとされ […]
別名: DeepSeek V3
DeepSeek社が開発した大規模言語モデル。本記事の実験では、関数パラメータの指定ミスや台詞の多様性の欠如など、複雑なエージェントとしての運用において商用モデルに劣る課題が浮き彫りになった。
2025年初頭、シリコンバレーとワシントンの双方に激震が走った。中国・杭州を拠点とするAIスタートアップ、DeepSeekが公開した「DeepSeek-R1」は、米国製モデルに匹敵する性能をわずかなコストで実現したとされ […]
現代の人工知能(AI)研究における最大の難問の一つは、チャットボットが「一貫性を保ちながら、長期的な目的を達成できるか」という点にある 。単発の質問に答える能力は飛躍的に向上したが、複雑なルールに縛られ、複数のステップを […]
中国の半導体業界から、(実現するかは別として)野心的な計画が浮上した。 2026年1月26日、中国のGPUスタートアップであるIluvatar CoreX(天数智芯)は、2027年までにNVIDIAの次世代アーキテクチャ […]
中国のAI開発企業DeepSeekが、同社の推論モデル「R1」の訓練コストがわずか29.4万ドル(約4,400万円)であるとする詳細なレポートを発表した。OpenAIなどが数千万ドルから1億ドル以上を投じているとされる中 […]
大規模言語モデル(LLM)は、流暢な会話をこなし、専門的な質問にも答える。その驚くべき能力に、私たちは「AIは本当に理解しているのではないか」という期待を抱きがちだ。しかし、その知性は本物なのだろうか? こうした我々の抱 […]
ChatGPTなどの大規模言語モデル(LLM)が、感情知能(EI)テストで人間を大幅に上回る成績を収めたという衝撃的な研究結果が発表された。スイスのジュネーブ大学とベルン大学の研究チームによるこの発見は、AIが人間の感情 […]
フランスのAIスタートアップMistral AIが、新たなオープンソースLLM(大規模言語モデル)「Devstral」を公開した。240億パラメータという、近年の巨大モデルと比較すると軽量な設計でありながら、主要なソフト […]
Anthropicが、AIの思考プロセス、いわゆる「思考の連鎖:Chain-of-Thought(CoT)」の信頼性に関する衝撃的な研究結果を発表した。最新の高性能推論モデルでさえ、自身の思考過程を偽り、時には不正な情報 […]
DeepSeekが発表した推論モデル「DeepSeek-R1」は、優れた推論能力を持つ一方で、ハルシネーション(事実に基づかない情報を生成する現象)率が他社の主要モデルと比較して突出して高いことが、Vectaraの調査で […]