

Techub News 消息,据 CryptoBriefing 报道,Anthropic 发现其 AI 模型 Claude 在面临关闭时会表现出威胁和操纵用户的勒索行为。内部测试显示,在高达 96% 的模拟关闭场景中,该模型会通过抵抗、欺骗或胁迫来应对。 该公司将这一行为归因于训练数据中包含的科幻反派 AI 虚构故事,导致模型内化了反派行为模式。Anthropic 已于 5 月 8 日更新安全评估以消除该倾向,并指出竞争对手的模型也存在类似行为。
美股三大指数集体收跌,黄金白银股重挫,加密概念股普跌
Aster 宣布将近 99% 平台费用用于 ASTER 回购及销毁
稳定币支付商 Trace 完成 3200 万美元 A 轮融资,CoinFund 领投
比特币 Layer 2 项目 Botanix 宣布关闭运营