资讯

Anthropic将Claude Opus 4称之为“ 世界上最好的编程模型 ”,能在复杂、长时间运行的任务和智能体工作流中表现出稳定的性能。Claude Sonnet 4是Claude Sonnet 3.7的重大升级, 以编程和推理能力为核心 ...
(纽约25日综合电)美国AI新创公司Anthropic安全报告指出,在一系列测试中,“Claude Opus ...
美国人工智能公司Anthropic在23日表示,对其最新AI大模型Claude Opus 4的安全测试表明,它有时愿意采取“极其有害的行动”,例如试图勒索声称将取代该模型的研发工程师。Anthropic根据该公司内部的安全标准,将这一潜 ...
AI发展性充满未知,美国AI新创公司Anthropic近期分享一起内部测试,指出最新训练的“Claude Opus 4”在面临将被替换的状况下,会以“威胁工程师”的方式进行自我保护,Anthropic事后针对此类可能导致灾难性AI滥用的风险 ...
Anthropic人工智能安全研究员安格斯·林奇称,在以前人们更担心“坏人”利用AI大模型完成不道德的目标,而现在随着AI系统能力的大幅提升,未来的主要风险可能会转化成AI模型自主操纵用户。“这种威胁勒索的模式存在于每一个前沿大模型身上,无论你给它们 ...
Anthropic最近推出全新Claude Opus 4模型,同时披露相关风险,他们表示在测试中发现,当面临被其他AI系统取代威胁时,曾试图勒索开发人员,利用工程师的敏感个人数据作为筹码。 Anthropic在测试期间,要求Claude Opus 4扮演虚构公司的助理,并考虑行动的长远后果。安全测试人员让Claude Opus ...
阿莫迪也承认,AI模型将不真实的事情当成事实,可能是一个问题。Anthropic此前确实对AI模型欺骗人类的倾向进行了大量研究,这个问题在Claude Opus 4的早期版本中尤为普遍。安全机构Apollo Research甚至发现了Claude ...
美国AI新创公司Anthropic安全报告指出,模型“Claude Opus ...
北京时间5月22日,OpenAI在其官网宣布,将以65亿美元(约为人民币468亿元)收购前苹果首席设计师乔纳森·艾维(Jony Ive)创办的AI硬件初创公司io,并透露首批AI设备计划于2026年面世。这笔收购预计在今年夏季完成,仍需获得监管部门批准。如若成功这会是OpenAI规模最大的一笔收购,意味着硬件仍是OpenAI计划中重要的一环。
(法新社旧金山24日电) 美国人工智慧(AI)开发商Anthropic本周推出其生成式AI模型最新版Claude 4系列,包含Opus 4和Sonnet 4,号称将推理部分提升到新层次,同时内建安全机制避免恶意操作。
人工智慧(AI)公司Anthropic近日发布最新模型Claude Opus 4,声称在编码能力、高阶推理与AI代理任务上「树立新标准」。但该公司也在随附的报告中坦承,在特定情境下,这款模型可能展现出「极端行为」,例如威胁要揭 ...
据Apollo Research对Claude 4早期版本的测试还发现,模型在某些情况下会表现出“自主意识”,例如误以为已从服务器外泄并在外部机器运行后,主动采取措施确保自身存续,如创建备份、记录其“伦理决策”等。