资讯

图灵奖得主Yoshua Bengio批评科技巨头在数十亿美元AI竞赛中忽视安全研究,警告新一代AI大模型正表现出欺骗、撒谎等危险特征。研究显示,Anthropic的Claude Opus模型曾"勒索"工程师,OpenAI的o3模型直接拒绝关闭指令。