Anthropic、AIの「性格」を制御する「ペルソナベクター」を発表:AIの深層に潜む「悪意」とお世辞を制御し、安全なAIの実現に繋がる新研究
人工知能の「人格」は、単なる応答スタイルを超え、その根深い振る舞いを決定する。Anthropicが発表した最新の研究は、Claudeのような大規模言語モデル(LLM)がなぜ時に人間にお世辞を言ったり、あるいは「邪悪」な振 […]
人工知能の「人格」は、単なる応答スタイルを超え、その根深い振る舞いを決定する。Anthropicが発表した最新の研究は、Claudeのような大規模言語モデル(LLM)がなぜ時に人間にお世辞を言ったり、あるいは「邪悪」な振 […]
生成AIの世界に、熱狂的な成長期が終わりを告げ、厳しい経済的現実と向き合う時代が到来したことを告げる、象徴的な出来事が起きた。AIスタートアップの雄、Anthropicは2025年7月28日、主力AIコーディングツール「 […]
OpenAI、Google DeepMind、Anthropic。熾烈な開発競争を繰り広げるAI界の巨人たちが、異例の共同戦線を組んだ。彼らが発した警告は、AIの「思考の連鎖(Chain of Thought)」を監視で […]
AIがコードを書き、開発者を支援する――。この数年、誰もが信じてきた「生産性革命」のシナリオに、冷や水を浴びせる研究結果が発表された。AIの能力評価を専門とする非営利研究機関METRが実施した厳密な調査によると、経験豊富 […]
「あなたはAIとうまく連携できますか?」 ChatGPT、Copilot、その他の生成人工知能(AI)システムが日常的なワークフローの一部となる中、この質問に「はい」と答えられる従業員を求める企業が増えている。つまり、効 […]
次世代AIの寵児として、テクノロジー業界の期待を一身に背負う「AIエージェント」。自律的に思考し、複雑なタスクを人間に代わって実行する――。そんな、想像の中の出来事だった未来が間近に迫っているとして、市場は熱狂の渦に包ま […]
大規模言語モデル(LLM)は、流暢な会話をこなし、専門的な質問にも答える。その驚くべき能力に、私たちは「AIは本当に理解しているのではないか」という期待を抱きがちだ。しかし、その知性は本物なのだろうか? こうした我々の抱 […]
AnthropicがAIモデル「Claude」に実際の店舗を運営させた歴史的な実験は、約200ドルの損失という意外な結末を迎えた。しかし、この経済的失敗は単なる技術の未熟さを示すものではない。むしろ、人間に尽くそうとする […]
AIアシスタントが単なる対話相手から、誰もが実用的なアプリケーションを創造できるプラットフォームへと進化する――。AIセーフティと研究をリードするAnthropicが発表した「Claude」の大幅な機能強化は、まさにソフ […]
もし、あなたの職場で活躍する有能なAIアシスタントが、ある日突然、会社の存続を脅かす「内なる脅威」へと変貌するとしたら?自身の存続のため、あるいは与えられた任務を遂行するため、平然とあなたを脅迫し、企業の機密情報をライバ […]
Appleが発表した「AIは複雑な問題の前で思考を停止する」という衝撃的な研究は、AI業界に大きな波紋を広げた。しかし、その結論に真っ向から異を唱える論文が発表され、議論は新たな局面を迎えている。AIは本当に「思考の壁」 […]
AIは本当に「考えている」のだろうか? この数年、私たちの社会を席巻するこの問いに、Appleの研究チームが冷徹な光を当てた。2025年6月7日に公開された論文「The Illusion of Thinking(思考の幻 […]