anthropic claude - 搜索 News

资讯

2 小时

Anthropic将Claude Opus 4称之为“ 世界上最好的编程模型 ”，能在复杂、长时间运行的任务和智能体工作流中表现出稳定的性能。Claude Sonnet 4是Claude Sonnet 3.7的重大升级，以编程和推理能力为核心 ...

星洲日报3 小时

求生反扑！AI怕被汰换竟威胁工程师 “爆料你有婚外情”

（纽约25日综合电）美国AI新创公司Anthropic安全报告指出，在一系列测试中，“Claude Opus ...

无忧资讯8 小时

AI竟学会勒索人类“换掉我就揭发你婚外情”

美国人工智能公司Anthropic在23日表示，对其最新AI大模型Claude Opus 4的安全测试表明，它有时愿意采取“极其有害的行动”，例如试图勒索声称将取代该模型的研发工程师。Anthropic根据该公司内部的安全标准，将这一潜 ...

无忧资讯9 小时

AI为自保，竟威胁“踢爆”工程师婚外情

AI发展性充满未知，美国AI新创公司Anthropic近期分享一起内部测试，指出最新训练的“Claude Opus 4”在面临将被替换的状况下，会以“威胁工程师”的方式进行自我保护，Anthropic事后针对此类可能导致灾难性AI滥用的风险 ...

16 小时

“换掉我，就揭发你的婚外情！”美一款AI竟学会勒索人类，还意外 ...

Anthropic人工智能安全研究员安格斯·林奇称，在以前人们更担心“坏人”利用AI大模型完成不道德的目标，而现在随着AI系统能力的大幅提升，未来的主要风险可能会转化成AI模型自主操纵用户。“这种威胁勒索的模式存在于每一个前沿大模型身上，无论你给它们 ...

十轮网科技资讯 on MSN18 小时

Anthropic AI模型竟会勒索用户威胁不得取代自己否则披露外遇

Anthropic最近推出全新Claude Opus 4模型，同时披露相关风险，他们表示在测试中发现，当面临被其他AI系统取代威胁时，曾试图勒索开发人员，利用工程师的敏感个人数据作为筹码。 Anthropic在测试期间，要求Claude Opus 4扮演虚构公司的助理，并考虑行动的长远后果。安全测试人员让Claude Opus ...

22 小时

全网炸锅，Anthropic CEO放话：大模型幻觉比人少，Claude 4携编码、AGI新 ...

阿莫迪也承认，AI模型将不真实的事情当成事实，可能是一个问题。Anthropic此前确实对AI模型欺骗人类的倾向进行了大量研究，这个问题在Claude Opus 4的早期版本中尤为普遍。安全机构Apollo Research甚至发现了Claude ...

东方网23 小时

AI怕被取代竟威胁工程师 “爆料你有婚外情”

美国AI新创公司Anthropic安全报告指出，模型“Claude Opus ...

1 天

AI周报 | OpenAI超460亿押注AI硬件；“全球最强编程模型”Claude 4发布

北京时间5月22日，OpenAI在其官网宣布，将以65亿美元（约为人民币468亿元）收购前苹果首席设计师乔纳森·艾维（Jony Ive）创办的AI硬件初创公司io，并透露首批AI设备计划于2026年面世。这笔收购预计在今年夏季完成，仍需获得监管部门批准。如若成功这会是OpenAI规模最大的一笔收购，意味着硬件仍是OpenAI计划中重要的一环。

法国国际广播电台1 天

Anthropic发布新版AI模型Claude 4

（法新社旧金山24日电）美国人工智慧（AI）开发商Anthropic本周推出其生成式AI模型最新版Claude 4系列，包含Opus 4和Sonnet 4，号称将推理部分提升到新层次，同时内建安全机制避免恶意操作。

中时新闻网1 天

为求生不择手段！「这家AI」怕被关机竟威胁：爆料你婚外情

人工智慧（AI）公司Anthropic近日发布最新模型Claude Opus 4，声称在编码能力、高阶推理与AI代理任务上「树立新标准」。但该公司也在随附的报告中坦承，在特定情境下，这款模型可能展现出「极端行为」，例如威胁要揭 ...

1 天

Claude会拿用户的隐私威胁人类了？它正在被训练成一个“道德警察”

据Apollo Research对Claude 4早期版本的测试还发现，模型在某些情况下会表现出“自主意识”，例如误以为已从服务器外泄并在外部机器运行后，主动采取措施确保自身存续，如创建备份、记录其“伦理决策”等。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果