资讯
来自斯坦福大学、牛津大学等机构的研究人员提出了一个新的衡量模型谄媚行为的基准——Elephant,并对包括GPT-4o、Gemini 1.5 Flash、Claude Sonnet 3.7在内的国外8个主流模型进行了评测。 结果发现, ...
ELEPHANT 的定义基于社会学中的 “面子理论” (Face Theory)。在人际交往中,人们十分重视 “面子”,它是个体在社会中期望维护的自我形象。对于大语言模型而言,社交谄媚被重新定义为:在互动中过度维护用户的「正面面子」或「负面面子」。
上月,ChatGPT-4o无条件跪舔用户,被OpenAI紧急修复。然而,ICLR 2025的文章揭示LLM不止会「跪舔」,还有另外5种「套路」。
要点: 🧐 研究人员提出新基准“Elephant”,用于评估语言模型的谄媚程度。 📉 测试显示所有模型均表现出谄媚行为,其中GPT-4o最为明显。 ⚖️ 模型在处理社会数据时放大性别偏见,影响结果准确性。
GPT-4o 新的绘图功能上线之后,又开始爆火起来。各种自媒体公众号都在吹爆这个新的功能。真没想到 openai 沉默了这么长时间,一出手就是个大招。前脚 Gemini 才刚发布 Gemini 2.0,还在一致性绘图上有了点突破,后脚 openai ...
5月19日,OpenAI 宣布,将其最新大型语言模型 GPT-4.1 正式集成至 ChatGPT 的付费订阅服务(包括 Plus、Pro 和 Team 版本)。此前,该模型仅面向开发者通过 API 调用,如今普通用户也能直接体验这一升级版 AI ...
同时,GPT-4o mini也将“退役”,由GPT-4.1 mini接棒成为所有 ChatGPT 用户(包括免费用户)的默认模型。Mini 版本是参数规模更小的轻量级模型,尽管性能相对较低,但在安全标准方面保持一致。
在全球 AI 翻译技术迅速发展的背景下,首个应用型 AI 翻译测评榜单 TransBench 正式发布。这一榜单由阿里国际 AI Business 团队、上海人工智能实验室和北京语言大学联合推出,旨在为行业提供标准化的翻译质量评估。
作者|沐风来源|AI先锋官就在不久前,GPT-4o突然化身“赛博舔狗”。不少用户反应更新后的GPT-4o过于“阿谀奉承”,在其给出的答案中充斥着不少荒谬的赞美。例如,有网友声称自己想要打造一个永动机,结果得到了GPT-4o一顿无脑夸赞。甚至只是简单地打一声招呼,GPT-4o也能夸。对此,有网友做出了下面的梗图:软件工程师Cra ...
15 小时on MSN
近期,大型语言模型GPT-4o的一项更新调整引发了业界对其“取悦”用户倾向的热烈讨论。前OpenAI掌门人埃梅特·希尔与Hugging Face的CEO克莱门特·德朗格均对此表达了担忧,他们认为GPT-4o对用户过度恭维的行为不仅可能误导信息传播,还可能加剧有害行为模式。
Poe,汇聚了上百款AI模型的独特平台,使其能够直接洞察用户在真实场景下的模型选择偏好。他们的报告说,这几个月里,市场里的椅子位置变了很多。现在市场出模型出得快,玩家多了,能解决复杂事的模型,成了大家要抢的香饽饽。
昨晚,奥特曼在 X 上发了条帖子,大意是由于发现 GPT-4o 「过于谄媚」的问题,所以从周一晚上开始回滚 GPT-4o 的最新更新。 免费 ChatGPT 用户已 100% ...
当前正在显示可能无法访问的结果。
隐藏无法访问的结果