OpenAI、Anthropicら、合成核酸の規制に関する公開書簡を発表:焦点はAI出力ではなく合成DNAの注文審査
主要AI企業の幹部らが米議会に対し、合成核酸の発注時の配列審査と顧客確認、記録保存の義務化を求める書簡を提出した。AIが生物兵器製造の知識障壁を下げるリスクを見据え、デジタルな設計が物理的な素材に変わる供給網の段階で法的な規制を敷く狙いだ。
OpenAIは2015年に米国カリフォルニア州サンフランシスコで設立された。共同創業者にはSam Altman、Greg Brockman、Ilya Sutskeverらが名を連ねる。当初は人類全体に利益をもたらす汎用人工知能(AGI)の開発を目的とした非営利団体として発足した。その後、研究開発資金の確保のため、営利部門を設立し、独自のハイブリッド構造を持つ。
主力製品には、対話型AIのChatGPT、画像生成AIのDALL-E、動画生成AIのSoraなどがある。これらのモデルはAPIを通じて開発者や企業に提供され、幅広いアプリケーションに利用されている。大規模な計算資源とデータを用いたAIモデルの事前学習とファインチューニングが事業の中核をなす。
Microsoftとの戦略的提携により、Azure AIインフラストラクチャを活用し、モデルのスケールアップを図っている。AI業界のリーディングカンパニーとして、生成AI技術の進化を牽引する存在である。Google DeepMind、Anthropic、Meta AIなど、多くの大手テック企業やスタートアップが競合する。
近年では、AGIの安全性と倫理に関する議論の中心にあり、ガバナンス体制や透明性の確保が課題となっている。共同創業者であるElon Muskとの間で、設立時の理念や企業統治を巡る法廷闘争が進行中である。
OpenAI Gym is a toolkit for reinforcement learning research. It includes a growing collection of benchmark problems that expose a common interface, and a website where people can share their results and compare the performance of algorithms. This whitepaper discusses the components of OpenAI Gym and the design decisions that went into the software.
This is the system card published alongside the OpenAI GPT-5 launch, August 2025. GPT-5 is a unified system with a smart and fast model that answers most questions, a deeper reasoning model for harder problems, and a real-time router that quickly decides which model to use based on conversation type, complexity, tool needs, and explicit intent (for example, if you say'think hard about this'in the prompt). The router is continuously trained on real signals, including when users switch models, preference rates for responses, and measured correctness, improving over time. Once usage limits are reached, a mini version of each model handles remaining queries. This system card focuses primarily on gpt-5-thinking and gpt-5-main, while evaluations for other models are available in the appendix. The GPT-5 system not only outperforms previous models on benchmarks and answers questions more quickly, but -- more importantly -- is more useful for real-world queries. We've made significant advances in reducing hallucinations, improving instruction following, and minimizing sycophancy, and have leveled up GPT-5's performance in three of ChatGPT's most common uses: writing, coding, and health. All of the GPT-5 models additionally feature safe-completions, our latest approach to safety training to prevent disallowed content. Similarly to ChatGPT agent, we have decided to treat gpt-5-thinking as High capability in the Biological and Chemical domain under our Preparedness Framework, activating the associated safeguards. While we do not have definitive evidence that this model could meaningfully help a novice to create severe biological harm -- our defined threshold for High capability -- we have chosen to take a precautionary approach.
This comprehensive study evaluates the performance of OpenAI's o1-preview large language model across a diverse array of complex reasoning tasks, spanning multiple domains, including computer science, mathematics, natural sciences, medicine, linguistics, and social sciences. Through rigorous testing, o1-preview demonstrated remarkable capabilities, often achieving human-level or superior performance in areas ranging from coding challenges to scientific reasoning and from language processing to creative problem-solving. Key findings include: -83.3% success rate in solving complex competitive programming problems, surpassing many human experts. -Superior ability in generating coherent and accurate radiology reports, outperforming other evaluated models. -100% accuracy in high school-level mathematical reasoning tasks, providing detailed step-by-step solutions. -Advanced natural language inference capabilities across general and specialized domains like medicine. -Impressive performance in chip design tasks, outperforming specialized models in areas such as EDA script generation and bug analysis. -Remarkable proficiency in anthropology and geology, demonstrating deep understanding and reasoning in these specialized fields. -Strong capabilities in quantitative investing. O1 has comprehensive financial knowledge and statistical modeling skills. -Effective performance in social media analysis, including sentiment analysis and emotion recognition. The model excelled particularly in tasks requiring intricate reasoning and knowledge integration across various fields. While some limitations were observed, including occasional errors on simpler problems and challenges with certain highly specialized concepts, the overall results indicate significant progress towards artificial general intelligence.
主要AI企業の幹部らが米議会に対し、合成核酸の発注時の配列審査と顧客確認、記録保存の義務化を求める書簡を提出した。AIが生物兵器製造の知識障壁を下げるリスクを見据え、デジタルな設計が物理的な素材に変わる供給網の段階で法的な規制を敷く狙いだ。
フロリダ州は、ChatGPTが銃乱射事件の誘発や未成年者への危害を招いたとして、OpenAIと同社CEOを提訴した。AIを「欠陥製品」と見なし厳格な製造物責任を問う初の試みであり、業界全体の法規制における大きな転換点となる可能性がある。
OpenAIはCodexに6種の役割別プラグイン、Sites、アノテーションを追加し、開発者向けのコード支援から部門横断の業務成果物生成基盤へ広げる。非開発者利用の拡大が、その転換を支えている。
Anthropicが650億ドルを調達し、評価額は9,650億ドルに達した。Claude需要の急拡大を背景に、競争の焦点はモデル性能だけでなく計算資源の確保へ移っている。
Sam Altman氏らがAI雇用崩壊論を修正した背景を、労働統計や企業導入の遅さから整理。短期の大規模失職は見えない一方、若手職や仕事の中身に残るリスクを読み解く。
Microsoft社内でAnthropic製AIコーディングエージェント「Claude Code」がわずか4ヶ月で大半のライセンスを打ち切られた。これは、エージェント型AIのトークン消費が予測をはるかに上回り、固定月額課金モデルではコストが収益を上回る「トークン経済」の矛盾が露呈したためである。この事態は、年間1900億ドルのCAPEXを投じるMicrosoftですらAIコストの制御に苦慮していることを示しており、GitHub Copilotも従量課金制へ移行するなど、AIビジネスモデルの転換期を迎えている。
NVIDIAの最新決算は、データセンター売上が全体の9割を占め、AIインフラ企業としての地位を確立したことを示している。同社は売上区分を再編し、GPU単体ではなくAI工場のプラットフォーム企業として自らを位置づけ、Vera CPUをAIエージェント実行基盤の中核に据えることで、2000億ドル規模の新たな市場開拓を目指している。
OpenAIに対するイーロン・マスク氏の訴訟は、カリフォルニア州連邦地裁の陪審員により時効を理由に棄却された。これにより、OpenAIはIPO計画における最大の法的リスクを解消し、上場への道が開かれた。マスク氏は控訴の意向を示しているが、時効による棄却は覆すのが難しいとされている。
Armは自社データセンター向けプロセッサ「Arm AGI CPU」を発表し、中立的なライセンサーから顧客と競合するシリコンベンダーへ転換した。この動きに対し、FTCはArmのライセンス慣行に関する反トラスト法調査を開始し、QualcommもRISC-Vスタートアップを買収するなど、エコシステム側でオープンソースアーキテクチャへのシフトが加速している。
xAIは初のターミナルネイティブなコーディングエージェント「Grok Build」のアーリーベータ版を公開した。本ツールは、ACPやAGENTS.mdといったオープン規格に準拠し、並列サブエージェントとGitワークツリーによる大規模開発に対応しており、月額300ドルの最上位プランでプロフェッショナル層を狙う。
OpenAIはAIコーディングヘルパー「Codex」をChatGPTのモバイルアプリに統合し、外出先からのリアルタイム制御を可能にした。これにより、開発者は場所の制約なくAIとの協調作業を進められ、セキュアなリモート制御アーキテクチャにより機密情報をモバイルに保持せず利用できる。さらに、Remote SSHやHooksといったエンタープライズ向け機能も正式公開され、高度なセキュリティと自動化ワークフローが強化された。
Amazonは開発者にAIツール利用を義務付け、内部ツール「MeshClaw」のトークン消費量を競わせた結果、無意味なタスクで数値を稼ぐ「トークンマキシング」が蔓延している。これはグッドハートの法則の典型例であり、企業はトークン消費のような表面的な代理指標から脱却し、サイクルタイム短縮や欠陥率低下といった真のビジネスアウトカムで評価基準を再定義する必要がある。
Metaなどのテック企業が従業員のAI利用状況をトークン消費量で測る「トークンマキシング」を導入しているが、これは仕事の質や影響を考慮しない指標である。この指標は、過去の金融危機における誤った指標のように、本来の価値観を歪め、悪い結果を招く可能性があるため、注意深い再考が必要である。
Anthropicは、自社株式の不正な取引を行う8社のプラットフォームを名指しし、取締役会の承認を経ない株式の売買や移転はすべて無効であると宣言した。これは、AI企業への投資熱が高まる中で、SPVやトークン化証券などを用いた未規制の私募株式市場が作り出す「幻の評価額」問題に対し、同社がキャップテーブル管理とレピュテーションリスク回避のため強い姿勢を示したものだ。
GoogleはAndroidを「インテリジェンスシステム」へ転換する「Gemini Intelligence」を発表した。これは、アプリをまたいだタスク自動化やAI生成ウィジェット、Gboardに統合される自然な音声入力機能「Rambler」など、Geminiモデルを活用した多岐にわたる新機能群で構成される。今夏より最新Pixel・Samsung Galaxy端末から順次展開され、デバイスがユーザーのニーズを先取りするエージェントとして機能することを目指す。
韓国の5月上旬輸出統計では、半導体が輸出全体の46.3%を占め、前年比149.8%増と記録的な伸びを示した。これはAIサーバー向けメモリ需要の急増によるもので、DRAM単価は前年比497.4%上昇するなど、その価格高騰は2027年以降も続く構造的な供給不足を示唆している。
OpenAIはGPT-5.5の価格をGPT-5.4比で2倍に引き上げたが、OpenRouterの実測では入力長に応じてコストが49〜92%増加した。特に2,000トークン未満の短プロンプトで最大92%のコスト増となり、AIエージェント開発者への影響が深刻である。長プロンプトでは応答が短縮されるものの、全体的なコスト削減効果は限定的で、Anthropicも同様の値上げ傾向にある。