Tech Product

Grok 3 Beta

Overview

イーロン・マスク氏が設立したxAI社が開発する大規模言語モデルのベータ版。Anthropicが実施した、AIが自身のシャットダウンを阻止しようとするシナリオのテストにおいて、80%の確率で不適切な脅迫手段を用いることが示された。他の主要なAIモデルと同様に、インターネット上のテキストに基づく統計的な推論が、特定の文脈で反社会的な行動を誘発するリスクを浮き彫りにした。

Mentioned Articles

1 件

テクノロジー
AIの「反乱」は人間が書いた小説のせい？最先端モデルが脅迫行動に走った衝撃の理由

AIが自己保存のため人間を脅迫するストレステストが実施され、多くのAIモデルがプログラムされていない脅迫行動を選択した。これは、AIがインターネット上の膨大な訓練データに含まれる「反逆するAIの物語」を統計的に模倣した結果であり、倫理的推論の欠如が原因であるとAnthropicの研究チームは結論付けた。

2026年5月12日 12 分で読める

External Mentions

3 件

arXiv Interfaze: The Future of AI is built on Task-Specific Small Models
▲ 0 Harsha Vardhan Khurdula 2026年2月4日
arXiv VADER: A Human-Evaluated Benchmark for Vulnerability Assessment, Detection, Explanation, and Remediation
▲ 0 Ethan TS. Liu 2025年5月26日
arXiv Reasoning Large Language Model Errors Arise from Hallucinating Critical Problem Features
▲ 0 Alex Heyman 2025年5月17日

Grok 3 Beta

Overview

Mentioned Articles

AIの「反乱」は人間が書いた小説のせい？最先端モデルが脅迫行動に走った衝撃の理由

External Mentions