AIが数学を解けて雑談で詰まる理由は、欠陥ではなく設計の必然だった
Claude Opus 4.6はSWE-bench Verifiedで80.8%のスコアを記録し、プロのエンジニアが数時間かけて解くGitHub上の実際のバグ修正を自動で解決できるレベルに達している。数学オリンピック問題 […]
AD
Claude Opus 4.6はSWE-bench Verifiedで80.8%のスコアを記録し、プロのエンジニアが数時間かけて解くGitHub上の実際のバグ修正を自動で解決できるレベルに達している。数学オリンピック問題 […]
Microsoftは2026年4月7日、Bing Blogでオープンソースのテキスト埋め込みモデルシリーズ「Harrier」を公開した。検索、取得、ランキング、文脈整理を支える埋め込み層を強化するもので、同社は多言語ベン […]
人工知能がクリエイティブな領域を次々と開拓する中、厳密な構造的整合性と物理法則の遵守が求められる建築設計のプロセスにおいて、画期的なブレイクスルーが報告された。Japan Advanced Institute of Sc […]
GitHubが、GitHub Copilotによるプルリクエスト内の「agent tips」表示を停止した。発端になったのは、豪州のソフトウェア開発者Zach Manson氏が、自身のプルリクエスト本文にRaycastを […]
生成AIが社会のあらゆる階層に浸透していく中で、一つの切実な問いが浮かび上がっている。AIから真の価値を引き出し、自らの知的生産性を劇的に高められる人々と、散発的な利用で終わってしまう人々の間に存在する決定的な差異はどこ […]
「あなたは〇〇の専門家です」という一文から大規模言語モデルへの指示を書き始めるユーザーは非常に多い。この手法は長らく、人工知能から高品質で精緻な回答を引き出すための代表的なテクニックとして、数多くのガイドブックで推奨され […]
AppleがSiriの外部AI連携を広げる準備に入った可能性が浮上している。Bloomberg Newsが関係者情報として伝え、Reutersも追った内容によれば、AppleはiOS 27で「Extensions」と呼ば […]
現代社会に深く浸透したChatGPTやGeminiなどの大規模言語モデル(LLM)は、革新的なアイデアを生み出す強力な思考のパートナーとして広く認識されている。多くのユーザーが業務の効率化や企画立案、あるいは日常の課題解 […]
現代のソフトウェア開発において最も深刻なパラドックスは、AIエージェントの能力向上と比例して、その基盤となる人類の知識のエコシステムが破壊されているという事実だ。2008年に誕生し、2014年には月間20万件以上の質問が […]
大規模言語モデル(LLM)を中核に据えたAIエージェントのコーディング能力は、ここ数年で飛躍的な進化を遂げている。与えられた要件定義に基づいて関数を生成したり、既知のバグを特定してパッチを当てたりするタスクにおいて、AI […]
OpenAIから、新たな小型言語モデル群「GPT-5.4 mini」および「GPT-5.4 nano」がリリースされた。これらはすでにChatGPT、Codex、そしてAPI経由で利用可能となっている。前世代のGPT-5 […]
Mistral AIは2026年3月16日、新モデル「Mistral Small 4」を発表した。Apache 2.0ライセンスで公開するオープンソースモデルで、推論、画像入力、コーディング支援を単一モデルに統合した点を […]
AD