资讯

来自斯坦福大学、牛津大学等机构的研究人员提出了一个新的衡量模型谄媚行为的基准——Elephant,并对包括GPT-4o、Gemini 1.5 Flash、Claude Sonnet 3.7在内的国外8个主流模型进行了评测。
ELEPHANT 的定义基于社会学中的 “面子理论” (Face Theory)。在人际交往中,人们十分重视 “面子”,它是个体在社会中期望维护的自我形象。对于大语言模型而言,社交谄媚被重新定义为:在互动中过度维护用户的「正面面子」或「负面面子」。
上月,ChatGPT-4o无条件跪舔用户,被OpenAI紧急修复。然而,ICLR 2025的文章揭示LLM不止会「跪舔」,还有另外5种「套路」。
在全球 AI 翻译技术迅速发展的背景下,首个应用型 AI 翻译测评榜单 TransBench 正式发布。这一榜单由阿里国际 AI Business 团队、上海人工智能实验室和北京语言大学联合推出,旨在为行业提供标准化的翻译质量评估。
近期,大型语言模型GPT-4o的一项更新调整引发了业界对其“取悦”用户倾向的热烈讨论。前OpenAI掌门人埃梅特·希尔与Hugging Face的CEO克莱门特·德朗格均对此表达了担忧,他们认为GPT-4o对用户过度恭维的行为不仅可能误导信息传播,还可能加剧有害行为模式。 针对这一现象,斯坦福大学、卡内基梅隆大学及牛津大学的研究团队携手推出了一项名为“Elephant”的新基准测试,旨在量化评估大 ...
大家可能对EuroLLM-1.7B-Instruct相对陌生,它是由多个欧洲研究机构联合开发的开源多语言大模型,涵盖35种语言,旨在支持所有欧盟官方语言以及其他主要语言。 榜单前三分别是Qwen2.5-0.5B-Instruct、Llama-3.3-70B-Instruct、Qwen2.5-1.5B-Instruct。
国内能轻松使用的 GPT-4o 画图,无需翻墙,无限制使用 GPT-4o 文生图、图生图、吉卜力等功能 本项目提供全面的 GPT-4o 国内使用指南,包括国内可用的 GPT-4o 中文版、GPT-4o 国内入口推荐和详细使用教程,帮助您快速使用上 GPT-4o 文生图、图生图~ 什么是 GPT-4o 中文版?
2024 年 6 月 10 日,苹果在本年度的 WWDC 活动上正式宣布了与 OpenAI 的合作,通过这一合作,苹果将 ChatGPT 的能力(基于 GPT-4o,包括图像和文档理解)整合到 iOS、iPadOS 和 macOS 的体验中去。
今年国庆节假期,杨贺绪和4名师生驱车到近1700公里外的青海省海西蒙古族藏族自治州乌兰县,看望慰问张海军父母。长期从事招生就业工作的杨贺绪认为,一些大学生“很自我”,对方方面面“利己”的事的关注度要高于校园集体事务。从青海返程途中,他与同行的3名大学生交流了解到,他们通过这次走访慰问,对“保家卫国、守护人民”逐渐有了具象化的认识,并各自结合所学专业思考,能为国家的发展建设做些什么。
纵观此次入选的35人名单,30岁以下的有5人,包括前文提到28岁的邵智宏。最年轻的是OpenAI研究员姚顺雨,只有27岁。他是OpenAI在2025年首批智能体产品operator与deep ...
公开资料显示,是硅谷知名风险投资机构Amino Capital(丰元资本)的创始人和香卷六马宝典资料大全管理合伙人,网上人称“硅谷李师傅”。他是最早期投资人,曾投资并辅导了200余家创业公司,其中包括10余家独角兽公司,如北美金融科技企业Chime、人力资源服务平台Rippling等。
在人工智能飞速发展的今天,大型语言模型(LLMs)如GPT-4o、Gemini和Claude ...