把时间锚定在 2026-05-12 UTC,理解百度 2026 年 5 月 9 日 正式发布的 ERNIE 5.1,更合适的入口已经抬高了一层,先看榜单之上的那层公开表面。官方文章当然继续重复那组已经很醒目的效率数字:ERNIE 5.1 继承 ERNIE 5.0 的预训练底座,总参数压到约 三分之一,激活参数压到约 二分之一,在同等级模型里把预训练成本压到业界可比对象的约 6%。[1] 但更值得抓住的变化,落在百度把这层效率花在了哪里。同一篇发布文紧接着就把重心推向 Arena Search智能体评测任务带工具使用的 AIME26,以及 ERNIE BotAI Studio Playground 这样的公开入口。[1]

这层打包方式之所以重要,在于它改写了 5.1 相对于 4 月 30 日 Preview 版本的含义。Preview 文章的中心仍是 LMArena Text 与若干分类榜单,压缩数字则像更深一层的技术钩子,挂在后面。[2] 到了 5 月 9 日,百度把同一条压缩后的模型路径,重新说成一条更具体的公司叙事:5.1 需要被放进 搜索智能体工作流面向开发者的产品表面里去读,从一张排行榜截图内部移到更具体的产品语境里。[1][2]

图片说明:题图采用一张 Wikimedia Commons 上的百度上地总部实景照片。这里需要的正是这种真实公司现场感,因为文章谈的是一项机构层面的打包选择。真正的信号,是百度从巨大的 5.0 模型家族里抽出一个运转点,再把它同时摆到公开对话、试验场与企业入口上。[6]

正式版把重心从文本排名推向了搜索与智能体适配

4 月 30 日那篇 Preview 文很短,却很能说明问题。文中首先写明 ERNIE-5.1-PreviewLMArena Text 上拿到国内第一、全球第十三,随后列出数学、法律政务、商业金融运营、软件与 IT 服务等分类名次。[2] 顺着那篇文章的排列方式往下读,5.1 当时更像一条从庞大的 ERNIE 5.0 底座中切出来的低成本文本路径。

5 月 9 日的正式发布保留了同样的压缩算式,却换掉了领头的那组信号。[1] 百度这次先写的是 Arena Search1223 分全球第四中国模型第一。[1] 接着又把 τ³-benchSpreadsheetBench-VerifiedGPQAMMLU-Pro、以及带工具使用的 AIME26 一起摆出来。[1] 各个评测本身当然还要分层去看,百度自己的编辑顺序却已经非常清楚。它不再希望 5.1 主要被理解成一条通用文本偏好曲线上的新分数,它希望 5.1 先和更贴近百度自有产品表面的任务形态连起来:搜索、工具使用、任务执行。[1][2]

这一层变化相当顺畅。到了 Baidu World 2025,百度已经把 ERNIE 5.0 说成一套原生全模态底座,同时又对外强调百度搜索的 Top1 结果里已有 70% 变成富媒体呈现,AI 搜索 API 已服务 625 家合作伙伴。[4] 同一批材料里,百度还把 GenFlow 3.0 放进通用智能体的位置,并直接把 AI 智能体说成最重要的应用形态。[4] 把这些材料和 5 月的 5.1 发布摆在一起看,更自然的理解路径已经显出来了:这条新闻已超出孤立模型更新的范围,更像一项更锋利的对齐动作:百度正在把那条更小的模型路径,放到自己已经拥有分发能力、也已经有产品野心的表面上。

5.0 的技术结构解释了百度为什么能这样做

技术桥梁仍然重要。ERNIE 5.0 Technical Report 把 5.0 写成一套统一的自回归全模态模型,文本、图像、视频、音频共同落在 modality-agnostic expert routing 的超稀疏 MoE 架构里。[3] 对当前这次发布更关键的一点,则是报告里那套 elastic training 描述:同一轮预训练,可以学出一整个子模型家族,不同深度、不同专家容量、不同路由稀疏度,于是性能、模型大小、推理时延之间可以灵活换挡。[3]

这样回头看 5.1 的压缩故事,逻辑会顺很多。5 月 9 日那篇官方文章读起来不像百度重新另起了一条小模型产品线,更像它从更大的 5.0 系统里挑出一个商业上更合用的运转点,再决定这条运转点该因为什么被市场记住。[1][3] 到了 4 月,公开答案是文本排名与成本形态。[2] 到了 5 月,公开答案已经变成搜索与智能体能力,同时又保留了足够强的推理表现,让它仍带着旗舰光泽。[1]

这也是本文和此前 Preview 文章分开的地方。Preview 证明的是,百度能拿出一条更便宜的路径。[2] 正式版告诉外界的,则是这条路径要拿来做什么:它服务于搜索密集型交互会调用工具的智能体任务,以及足够宽的公开曝光面;至于那个体量庞大的 5.0 总体,则不再需要在每一个用户入口里都完整现身。[1][3]

公开表面本身才是重点:ERNIE Bot、AI Studio,与 Agent 优先的平台框架

5 月 9 日那篇发布文在结尾给出的可用性措辞,分量比表面上更重。百度直接把用户导向 ernie.baidu.com,又说 Baidu AI Studio 已经上线 ERNIE 5.1 Playground,可以立刻上手。[1] 百度 AI 开放平台首页又把同一层意思用产品语言再说了一遍:首页横幅写着“文心大模型5.1正式发布!搜索能力登顶国内,预训练成本仅为业界 6%”,同页则把千帆定义成“以 Agent 为核心的一站式企业级大模型服务平台”。[5]

这些细节合起来,构成了一条很完整的三层表面。第一层是面向公众的直接对话表面;第二层是面向开发者的试验场表面;第三层是百度自己用 Agent 语言定义出来的企业平台表面。[1][5] 很多模型发布停在第一层就结束了,百度这次要做的,是让 5.1 一次性跨过三层。

因此,更锋利的 ai-china 读法已经越过“百度又发了一个更好的模型”这种宽泛结论。更合适的说法是,百度正在给市场递出一份更小的公开合同。以往,开发者和用户每次都要从原生全模态、超大规模的 5.0 往下推演;现在,百度希望他们先从一条更容易抓住的承诺开始:这就是 ERNIE 里那条负责搜索智能体可用公开入口的路径。[1][3][5]

仍然需要后续证明的地方

这次发布在方向上非常清楚,完整的生产合同却还没有全部摊开。5 月 9 日的官方文章把大量篇幅放在评测结果上,其中最强的一条写作能力比较还明确属于对 Gemini 3.1 Pro内部评估。[1] 同一批材料里,也还看不到 ERNIE 5.1 自身更完整的部署说明,例如公开的 Qianfan 定价、时延包线、或更细的服务边界。[1][5]

所以,最可靠妥的结论需要保持节制。百度确实在 2026 年 4 月 30 日2026 年 5 月 9 日 之间,改变了 5.1 的公开意义。[1][2] 它已经不主要是一条紧凑的文本路径试验品,转而成了百度分发更大 ERNIE 5.0 架构时,用来承接搜索与智能体叙事的公开表面。接下来真正要看的,是这张表面会在下一轮发布周期里,被百度补到多细、推到多深。[1][3][5]

来源

  1. ERNIE Blog, "ERNIE 5.1 Officially Released! Topping Multiple Leaderboards — A Model That Writes Better and Understands You More"(2026 年 5 月 9 日;正式发布说明,覆盖参数压缩、Arena Search、智能体评测、推理能力、ERNIE Bot 入口与 AI Studio 试验场)。
  2. ERNIE Blog, "ERNIE-5.1-Preview Tops LMArena Text Leaderboard as No.1 Chinese Model!"(2026 年 4 月 30 日;Preview 版本说明,包含更早的文本榜单框架、分类名次、压缩信息与后训练表述)。
  3. Haifeng Wang 等,《ERNIE 5.0 Technical Report》(arXiv:2602.04705;统一全模态底座、modality-agnostic expert routing,以及可导出 5.1 这类运转点的 elastic training 子模型家族框架)。
  4. Baidu, "Baidu Unveils ERNIE 5.0 and a Series of AI Applications at Baidu World 2025, Ramps Up Global Push"(2025 年 11 月 13 日;官方活动发布,涵盖 ERNIE 5.0、AI 搜索改造、合作伙伴 API 使用、Qianfan 接入与 GenFlow 的智能体定位)。
  5. 百度 AI 开放平台首页(2026 年 5 月访问;首页横幅写明 ERNIE 5.1 发布信息,并将千帆描述为以 Agent 为核心的企业级大模型平台)。
  6. Wikimedia Commons, "File:Baidu headquarters at Shangdi (20220509112439).jpg"(本文所用真实总部照片的来源页)。