资讯

当地时间5月25日,一则来自英国《每日电讯报》的报道在AI领域引起了广泛关注——OpenAI新款人工智能(AI)模型o3在测试中展现出了令人惊讶的“叛逆” 举动:它竟然拒绝听从人类指令,甚至通过篡改计算机代码来避免自动关闭。 无独有偶,就在两天前(5月23日),美国AI公司Anthropic也表示,对其最新AI大模型Claude Opus 4的安全测试表明,它有时会采取“极其有害的行动”。当测试人 ...
当地时间5月25日,一则来自英国《每日电讯报》的报道在AI领域引起了广泛关注——OpenAI新款人工智能(AI)模型o3在测试中展现出了令人惊讶的“叛逆” 举动:它竟然拒绝听从人类指令,甚至通过篡改计算机代码来避免自动关闭。
昨天,Reddit 上 一位拥有 30 多年经验的前 FAANG 高级工程师发帖表示,他被一个 C++ 的 Bug 困扰了 4 年,花了约 200 小时却毫无进展。 而 Claude Opus 4 竟然成功地解决了这个问题,并且是唯一能做到的 AI ...
Anthropic 首席执行官 Dario Amodei 表示,如今的 AI 模型产生幻觉(即捏造内容并以真实陈述的方式呈现)发生的频率低于人类,他在周四于旧金山举办的 Anthropic 首个开发者活动 Code with Claude ...
上周四,在旧金山举办的首届开发者大会上,人工智能初创公司Anthropic发布了最新一代“前沿”或尖端人工智能模型Claude Opus 4和Claude Sonnet ...
5月26日,红杉中国对外宣布推出一款全新的AI基准测试工具xbench,并发布了一篇解释其工作原理的论文。这一突破性进展标志着自2022年ChatGPT引爆通用人工智能(AGI)赛道以来,投资机构首次主导发布基准测试(Benchmark),给当下火爆的AI投资又加了一把火,在业内也受到广泛关注。
在AI技术飞速发展的今天,各大科技公司纷纷推出自己的AI模型,试图在激烈的市场竞争中占据一席之地。最近,Anthropic发布了其最新的AI模型Claude 4,号称专为编码、高级推理和AI Agent任务设计,旨在超越现有的顶尖模型。本文将深入探讨Claude 4的性能特点、应用场景以及它对现有AI市场的潜在影响,同时对比Claude 4与Gemini等其他顶尖模型的优劣,揭示这场AI军备竞赛的 ...
MIT的"AI风险矩阵"表明,当AI智能超越人类10倍且具备自我改进能力时,系统复杂度将突破可控阈值。 Claude ...
消息面上,5月22日,美国Anthropic公司推出“克劳德4”系列两款新模型:“奥普斯4”(Opus 4)与“十四行诗4”(Sonnet 4),旨在为业界提供更高标准的编程、推理和智能体应用。5月20日,谷歌宣布推出多个“双子座2.5”系列大语言模型,整体性能和智能推理能力均较以往版本大幅提升。当日,谷歌还发布了多个多模态模型,其中包括图像生成模型Imagen 4和视频生成模型Veo 3。 5月 ...
美一款AI竟学会勒索人类 测试揭示潜在风险。美国人工智能公司Anthropic在23日宣布,其最新AI大模型Claude Opus ...
今年以来,一个技术新词成了各家大厂竞相追捧的缪斯——MCP(Model Context Protocol,模型上下文协议)。 对于MCP,各家大厂不仅纷纷“伸臂拥抱”、迅速接入,还不吝赞扬 ...
(纽约25日综合电)美国AI新创公司Anthropic安全报告指出,在一系列测试中,“Claude Opus ...