资讯

今年国庆节假期,杨贺绪和4名师生驱车到近1700公里外的青海省海西蒙古族藏族自治州乌兰县,看望慰问张海军父母。长期从事招生就业工作的杨贺绪认为,一些大学生“很自我”,对方方面面“利己”的事的关注度要高于校园集体事务。从青海返程途中,他与同行的3名大学生交流了解到,他们通过这次走访慰问,对“保家卫国、守护人民”逐渐有了具象化的认识,并各自结合所学专业思考,能为国家的发展建设做些什么。
2024 年 6 月 10 日,苹果在本年度的 WWDC 活动上正式宣布了与 OpenAI 的合作,通过这一合作,苹果将 ChatGPT 的能力(基于 GPT-4o,包括图像和文档理解)整合到 iOS、iPadOS 和 macOS 的体验中去。
ELEPHANT 的定义基于社会学中的 “面子理论” (Face Theory)。在人际交往中,人们十分重视 “面子”,它是个体在社会中期望维护的自我形象。对于大语言模型而言,社交谄媚被重新定义为:在互动中过度维护用户的「正面面子」或「负面面子」。
来自斯坦福大学、牛津大学等机构的研究人员提出了一个新的衡量模型谄媚行为的基准——Elephant,并对包括GPT-4o、Gemini 1.5 Flash、Claude Sonnet 3.7在内的国外8个主流模型进行了评测。 结果发现, ...
上月,ChatGPT-4o无条件跪舔用户,被OpenAI紧急修复。然而,ICLR 2025的文章揭示LLM不止会「跪舔」,还有另外5种「套路」。
在全球 AI 翻译技术迅速发展的背景下,首个应用型 AI 翻译测评榜单 TransBench 正式发布。这一榜单由阿里国际 AI Business 团队、上海人工智能实验室和北京语言大学联合推出,旨在为行业提供标准化的翻译质量评估。
今年5月,斯科尔科沃科技学院(Skoltech)、人工智能研究所(AIRI)、MTS AI和莫斯科物理技术学院的联合研究团队发表了一篇题为《透过魔镜:奇怪图像的常识一致性评估》(Through the Looking Glass: Common ...
腾讯混元AI数字人团队 投稿量子位 | 公众号 QbitAI 判断AI是否智能,评价维度如今已不仅限于刷榜成绩。 当大模型在“IQ”上不断实现新的突破,“懂人心”、“解人意”开始成为实际应用中,人们对大模型新的要求。 所以,AI的“EQ”又该如何评价 ...
举个例子,玉米、水稻和小麦,这三种谷物为当今世界上80亿人提供摄取的香港35图库图纸大全大部分卡路里。但在世界范围内,这些作物的三分之一,都生长在供水高度紧张或者降雨模式非常不稳定的地区。主要农作物受到威胁,带来的影响将十分深远,包括食品价格波动、许多家庭被迫减少主食摄入、营养不良问题丛生等等。我们必须意识到,粮食安全不仅与每一餐的饭菜息息相关,更是国家安全、经济稳定和社会发展的重要基石。
All-Angles Bench 团队 投稿至 凹非寺量子位 | 公众号 QbitAI 多视图理解推理有新的评判标准了! 什么是多视图理解?也就是从不同视角整合视觉信息进而实现理解决策。 想象一下,机器人在复杂环境中执行任务,这就需要根据多个摄像头的画面准确判断物体位置、距离和运动方向,这就依赖于强大的多视图理解能力。 但过去,由于评估多视图推理能力的基准测试稀缺,这一领域的研究进展相对缓慢。 来 ...
GPT-4o 更新后“变谄媚”?后续技术报告来了。OpenAI 一篇新鲜出炉的认错小作文,直接引来上百万网友围观。 CEO 奥尔特曼也做足姿态,第一时间转发小作文并表示: (新报告)揭示了 GPT-4o 更新失败是因为什么,从中 OpenAI 学到了什么,以及我们将会采取的应对 ...
OpenAI近日更新了GPT-4o模型,并将其与ChatGPT的记忆功能相结合。而很多人在尝试之后,都表示他们获得了很荒谬的体验。许多推特上的用户表示 ...