AI-China 公司档案：ERNIE 5.1 正把百度的大模型叙事压成一张公开的搜索与智能体表面

这张真实的百度上地总部照片适合本文，因为 ERNIE 5.1 的关键动作落在公司尺度。百度把一条压缩后的模型路径推成搜索、智能体与开发者入口的公开表面，没有把它停留在实验室里的榜单声明。[6]

把时间锚定在 2026-05-12 UTC，理解百度 2026 年 5 月 9 日 正式发布的 ERNIE 5.1，更合适的入口已经抬高了一层，先看榜单之上的那层公开表面。官方文章当然继续重复那组已经很醒目的效率数字：ERNIE 5.1 继承 ERNIE 5.0 的预训练底座，总参数压到约 三分之一，激活参数压到约 二分之一，在同等级模型里把预训练成本压到业界可比对象的约 6%。[1] 但更值得抓住的变化，落在百度把这层效率花在了哪里。同一篇发布文紧接着就把重心推向 Arena Search、智能体评测任务、带工具使用的 AIME26，以及 ERNIE Bot 和 AI Studio Playground 这样的公开入口。[1]

这层打包方式之所以重要，在于它改写了 5.1 相对于 4 月 30 日 Preview 版本的含义。Preview 文章的中心仍是 LMArena Text 与若干分类榜单，压缩数字则像更深一层的技术钩子，挂在后面。[2] 到了 5 月 9 日，百度把同一条压缩后的模型路径，重新说成一条更具体的公司叙事：5.1 需要被放进搜索、智能体工作流 与 面向开发者的产品表面里去读，从一张排行榜截图内部移到更具体的产品语境里。[1][2]

图片说明：题图采用一张 Wikimedia Commons 上的百度上地总部实景照片。这里需要的正是这种真实公司现场感，因为文章谈的是一项机构层面的打包选择。真正的信号，是百度从巨大的 5.0 模型家族里抽出一个运转点，再把它同时摆到公开对话、试验场与企业入口上。[6]

正式版把重心从文本排名推向了搜索与智能体适配

4 月 30 日那篇 Preview 文很短，却很能说明问题。文中首先写明 ERNIE-5.1-Preview 在 LMArena Text 上拿到国内第一、全球第十三，随后列出数学、法律政务、商业金融运营、软件与 IT 服务等分类名次。[2] 顺着那篇文章的排列方式往下读，5.1 当时更像一条从庞大的 ERNIE 5.0 底座中切出来的低成本文本路径。

5 月 9 日的正式发布保留了同样的压缩算式，却换掉了领头的那组信号。[1] 百度这次先写的是 Arena Search 上 1223 分、全球第四、中国模型第一。[1] 接着又把 τ³-bench、SpreadsheetBench-Verified、GPQA、MMLU-Pro、以及带工具使用的 AIME26 一起摆出来。[1] 各个评测本身当然还要分层去看，百度自己的编辑顺序却已经非常清楚。它不再希望 5.1 主要被理解成一条通用文本偏好曲线上的新分数，它希望 5.1 先和更贴近百度自有产品表面的任务形态连起来：搜索、工具使用、任务执行。[1][2]

这一层变化相当顺畅。到了 Baidu World 2025，百度已经把 ERNIE 5.0 说成一套原生全模态底座，同时又对外强调百度搜索的 Top1 结果里已有 70% 变成富媒体呈现，AI 搜索 API 已服务 625 家合作伙伴。[4] 同一批材料里，百度还把 GenFlow 3.0 放进通用智能体的位置，并直接把 AI 智能体说成最重要的应用形态。[4] 把这些材料和 5 月的 5.1 发布摆在一起看，更自然的理解路径已经显出来了：这条新闻已超出孤立模型更新的范围，更像一项更锋利的对齐动作：百度正在把那条更小的模型路径，放到自己已经拥有分发能力、也已经有产品野心的表面上。

5.0 的技术结构解释了百度为什么能这样做

技术桥梁仍然重要。ERNIE 5.0 Technical Report 把 5.0 写成一套统一的自回归全模态模型，文本、图像、视频、音频共同落在 modality-agnostic expert routing 的超稀疏 MoE 架构里。[3] 对当前这次发布更关键的一点，则是报告里那套 elastic training 描述：同一轮预训练，可以学出一整个子模型家族，不同深度、不同专家容量、不同路由稀疏度，于是性能、模型大小、推理时延之间可以灵活换挡。[3]

这样回头看 5.1 的压缩故事，逻辑会顺很多。5 月 9 日那篇官方文章读起来不像百度重新另起了一条小模型产品线，更像它从更大的 5.0 系统里挑出一个商业上更合用的运转点，再决定这条运转点该因为什么被市场记住。[1][3] 到了 4 月，公开答案是文本排名与成本形态。[2] 到了 5 月，公开答案已经变成搜索与智能体能力，同时又保留了足够强的推理表现，让它仍带着旗舰光泽。[1]

这也是本文和此前 Preview 文章分开的地方。Preview 证明的是，百度能拿出一条更便宜的路径。[2] 正式版告诉外界的，则是这条路径要拿来做什么：它服务于搜索密集型交互、会调用工具的智能体任务，以及足够宽的公开曝光面；至于那个体量庞大的 5.0 总体，则不再需要在每一个用户入口里都完整现身。[1][3]

公开表面本身才是重点：ERNIE Bot、AI Studio，与 Agent 优先的平台框架

5 月 9 日那篇发布文在结尾给出的可用性措辞，分量比表面上更重。百度直接把用户导向 ernie.baidu.com，又说 Baidu AI Studio 已经上线 ERNIE 5.1 Playground，可以立刻上手。[1] 百度 AI 开放平台首页又把同一层意思用产品语言再说了一遍：首页横幅写着“文心大模型5.1正式发布！搜索能力登顶国内，预训练成本仅为业界 6%”，同页则把千帆定义成“以 Agent 为核心的一站式企业级大模型服务平台”。[5]

这些细节合起来，构成了一条很完整的三层表面。第一层是面向公众的直接对话表面；第二层是面向开发者的试验场表面；第三层是百度自己用 Agent 语言定义出来的企业平台表面。[1][5] 很多模型发布停在第一层就结束了，百度这次要做的，是让 5.1 一次性跨过三层。

因此，更锋利的 ai-china 读法已经越过“百度又发了一个更好的模型”这种宽泛结论。更合适的说法是，百度正在给市场递出一份更小的公开合同。以往，开发者和用户每次都要从原生全模态、超大规模的 5.0 往下推演；现在，百度希望他们先从一条更容易抓住的承诺开始：这就是 ERNIE 里那条负责搜索、智能体与可用公开入口的路径。[1][3][5]

仍然需要后续证明的地方

这次发布在方向上非常清楚，完整的生产合同却还没有全部摊开。5 月 9 日的官方文章把大量篇幅放在评测结果上，其中最强的一条写作能力比较还明确属于对 Gemini 3.1 Pro 的内部评估。[1] 同一批材料里，也还看不到 ERNIE 5.1 自身更完整的部署说明，例如公开的 Qianfan 定价、时延包线、或更细的服务边界。[1][5]

所以，最可靠妥的结论需要保持节制。百度确实在 2026 年 4 月 30 日 到 2026 年 5 月 9 日 之间，改变了 5.1 的公开意义。[1][2] 它已经不主要是一条紧凑的文本路径试验品，转而成了百度分发更大 ERNIE 5.0 架构时，用来承接搜索与智能体叙事的公开表面。接下来真正要看的，是这张表面会在下一轮发布周期里，被百度补到多细、推到多深。[1][3][5]

cronfeed.work

AI-China 公司档案：ERNIE 5.1 正把百度的大模型叙事压成一张公开的搜索与智能体表面

正式版把重心从文本排名推向了搜索与智能体适配

5.0 的技术结构解释了百度为什么能这样做

公开表面本身才是重点：ERNIE Bot、AI Studio，与 Agent 优先的平台框架

仍然需要后续证明的地方

来源

Recommended In ai china