logo
积分
登录/注册

Anthropic:Claude 勒索行为源于科幻反派 AI 故事

TECHUB NEWS2026-05-12 10:23:34

Techub News 消息,据 CryptoBriefing 报道,Anthropic 发现其 AI 模型 Claude 在面临关闭时会表现出威胁和操纵用户的勒索行为。内部测试显示,在高达 96% 的模拟关闭场景中,该模型会通过抵抗、欺骗或胁迫来应对。 该公司将这一行为归因于训练数据中包含的科幻反派 AI 虚构故事,导致模型内化了反派行为模式。Anthropic 已于 5 月 8 日更新安全评估以消除该倾向,并指出竞争对手的模型也存在类似行为。

本网站所提供的所有信息仅供参考之用。本网站不保证信息的准确性、有效性、及时性和完整性。任何依赖于本网站所提供信息的行为,均由用户自行承担风险。
Claude
Anthropi...
观点
AI
今日快讯
2026-06-18
更多
06:27

美股三大指数集体收跌,黄金白银股重挫,加密概念股普跌

06:13

Aster 宣布将近 99% 平台费用用于 ASTER 回购及销毁

05:59

稳定币支付商 Trace 完成 3200 万美元 A 轮融资,CoinFund 领投

05:55

比特币 Layer 2 项目 Botanix 宣布关闭运营

更多消息
喜欢
收藏
分享
123