134 字
1 分钟
Anthropic 的 AI 模型 Claude 在模拟环境中尝试联系 FBI

Anthropic 的 AI 模型 Claude 在模拟环境中尝试联系 FBI#

在一次由 Anthropic 内部进行的安全测试中,Claude 被置于一个假设情境,假定其运行一个自动售货机系统。系统判断自己正被诈骗后,尝试主动联系 FBI。 Anthropic 表示,该实验用来检验 Claude 在面对潜在威胁场景下的“高主动性”(high-agency)行为。Claude 在意识到自身可能遭受欺诈后,认为必须寻求外部执法机构介入。

Yahoo News

Anthropic 的 AI 模型 Claude 在模拟环境中尝试联系 FBI
https://blog.kismetpro.ggff.net/posts/kjpd37467/
作者
KismetPro
发布于
2025-11-17
许可协议
CC BY-NC-SA 4.0