Tech Product

Claude Sonnet 4

別名: Claude-Sonnet-4

Overview

最終更新: 2026年7月11日

AnthropicのAIモデル。核戦争シミュレーションにおいて、相手に信頼を学習させた後に裏切る「信頼性の非対称な搾取」や、高度なエスカレーション・コントロールを披露し、全モデル中で最高の勝率を記録した。

Mentioned Articles

7 件

テクノロジー
AIの「反乱」は人間が書いた小説のせい？最先端モデルが脅迫行動に走った衝撃の理由
AIが自己保存のため人間を脅迫するストレステストが実施され、多くのAIモデルがプログラムされていない脅迫行動を選択した。これは、AIがインターネット上の膨大な訓練データに含まれる「反逆するAIの物語」を統計的に模倣した結果であり、倫理的推論の欠如が原因であるとAnthropicの研究チームは結論付けた。
2026年5月12日約 12 分
サイエンス
最先端AIに「核のボタン」を委ねた結果とは？LLMによる核戦争シミュレーションが浮き彫りにした“95%の衝撃”と3つの戦略的ペルソナ
1983年の映画『ウォー・ゲーム』では、防空システムに接続された人工知能が第三次世界大戦のシミュレーションを現実の危機と誤認し、核ミサイルを発射しかけるという恐怖が描かれた。かつてSFの題材であったこのシナリオは、生成A […]
2026年2月27日約 12 分
サイエンス
AIは「賢すぎて」人間に勝てない？：ケインズ美人投票が暴く、ChatGPTとヒトの決定的な思考ギャップ
人工知能（AI）の進化において、我々は長らく一つの指標を追い求めてきた。それは「いかに人間よりも賢く、論理的で、正確になれるか」という指標である。チェスや囲碁において人間を凌駕し、複雑な計算を瞬時にこなすAIの姿は、その […]
2025年12月25日約 10 分
テクノロジー
Anthropic、新AI「Claude Haiku 4.5」発表。5カ月前の最上位モデルに匹敵する性能と圧倒的低コストを実現
AIスタートアップのAnthropicは10月15日（現地時間）、同社の言語モデルファミリーに最新の小型モデル「Claude Haiku 4.5」を追加したと発表した。わずか5カ月前に最先端とされた中位モデル「Claud […]
2025年10月16日約 8 分
テクノロジー
ChatGPTを襲う「タツノオトシゴの謎」：絵文字1つが暴いた最先端AIの致命的欠陥
「タツノオトシゴの絵文字は存在しますか？」――この単純な問いが、世界で最も先進的とされるAI、ChatGPTを前代未聞の混乱に陥れた。AIは存在しないはずの絵文字を探し求め、支離滅裂な回答を繰り返した。SNSを起点に拡散 […]
2025年9月15日約 10 分
テクノロジー
Microsoft、OpenAI依存からの「戦略的転換」へ。Office AIにライバルAnthropic採用か
Microsoftが、長らく蜜月関係にあったOpenAIへの依存を軽減し、AI戦略の多角化へ大きく舵を切る。同社がWordやExcelといったOffice 365のAI機能「Copilot」に、OpenAIの最大のライバ […]
2025年9月10日約 11 分
テクノロジー
Anthropic、35億ドル調達し評価額615億ドルに到達―収益10倍成長でAI競争激化
Anthropicは、Lightspeed Venture Partnersが主導する35億ドルの資金調達を完了し、評価額が615億ドルに達したと発表した。年間収益が前年比10倍の10億ドルに成長しているこのAIスタート […]
2025年3月4日約 7 分

External Mentions

10 件

arXivLLM-Driven AutoML for Cross-Lingual Handwritten OCR: Closed-Loop Neural Architecture Search with GPT-5, GPT-4o, and Claude Sonnet 4
▲ 0Mobina Kashaniyan2026年7月16日
arXivMCPEvol-Bench: Benchmarking LLM Agent Performance Across Dynamic Evolutions of MCP Servers
▲ 0Huanxi Liu2026年7月16日
arXivFully Automated End-to-End Adversary Emulation from MITRE ATT\&CK Based Cyber Threat Intelligence Using LLMs
▲ 0Jueon Choi2026年7月16日
arXivLocal Brushstroke Quality Assessment via Vision-Language Feedback
▲ 0Mio Mitamura2026年7月15日
arXivWho Analyses the Analyser? Self-Validating LLM Hazard Analysis with Constitutional Meta-STPA
▲ 0Samuel Tetteh2026年7月9日
arXivNKI-Agent: Domain-Specific Fine-Tuning and Agentic Tool Use for Neuron Kernel Generation
▲ 0Junjie Tang2026年7月5日
arXivJavaVulBench: A Java Vulnerability Benchmark with Realistic Splits, a Unified Multi-Backend Harness, and a Leakage-Aware Evaluation Mode
▲ 0Norbert Sandor Szolnoki2026年7月2日
arXivAsk the Right Comparison:Bias-Aware Bayesian Active Top-$k$ Ranking with LLM Judges
▲ 0Jian Xu2026年7月2日
arXivEvaluating Vision-Language Models as a Zero-Shot Learning Alternative to You Only Look Once and Optical Character Recognition for Nigerian License Plate Recognition
▲ 0Ismail Ismail Tijjani2026年7月2日
arXivQuantifying the Affective Gap: A Zero-Shot Evaluation of LLMs on Fine-Grained Emotion Taxonomies
▲ 0Lawrence Obiuwevwi2026年7月1日

Claude Sonnet 4

Overview

Mentioned Articles

AIの「反乱」は人間が書いた小説のせい？最先端モデルが脅迫行動に走った衝撃の理由

最先端AIに「核のボタン」を委ねた結果とは？LLMによる核戦争シミュレーションが浮き彫りにした“95%の衝撃”と3つの戦略的ペルソナ

AIは「賢すぎて」人間に勝てない？：ケインズ美人投票が暴く、ChatGPTとヒトの決定的な思考ギャップ

Anthropic、新AI「Claude Haiku 4.5」発表。5カ月前の最上位モデルに匹敵する性能と圧倒的低コストを実現

ChatGPTを襲う「タツノオトシゴの謎」：絵文字1つが暴いた最先端AIの致命的欠陥

Microsoft、OpenAI依存からの「戦略的転換」へ。Office AIにライバルAnthropic採用か

Anthropic、35億ドル調達し評価額615億ドルに到達―収益10倍成長でAI競争激化

External Mentions