截至 2026-03-28 UTC,ERNIE 4.5 最重要的变化,已经不再是 2025 年 3 月那次发布时刻,也不只是 2025 年 6 月那条开源公告本身。更有分量的信号,落在百度逐步把 ERNIE 4.5 接成了一条 Paddle 原生的软件路径:模型权重、调优工具、部署运行时、跨框架镜像与云端分发,开始沿着同一方向排列。[1][2][3][4][5][6]
这层区别很重要,因为开源权重本身,并不会自动形成多少战略韧性。一个模型家族真正进入操作层,发生在开发者可以调它、跑它、通过熟悉的接口接入它,并且最终还能在生产团队已经采购和管理的云控制面里继续找到它的时候。ERNIE 4.5 到了 2026 年更值得看,恰恰因为百度把这些层逐步拉齐了。[1][2][3][4][6]
图片说明:题图采用 Wikimedia Commons 上的百度科技园二期实景照片。这里需要的是一张真实的公司空间照片,因为文章讨论的是现实里的公司栈与部署路径,并非泛化的 AI 抽象意象。[7]
基线变化:3 月是发布,6 月才更像栈信号
百度在 2025 年 3 月 的基线,仍然主要是一条发布叙事。它在 2025 年第一季度财报里,把 ERNIE 4.5 与 ERNIE X1 的推出,放在百度 App 与企业 API 产品面的重要位置上来讲。[5] 这一层告诉市场,百度仍然要在旗舰模型节奏上继续竞争。
更耐看的转折出现在 2025-06-30。百度 ERNIE 博客当天宣布 ERNIE 4.5 模型家族开源,其中包括 10 个变体、47B 与 3B 激活参数两条 MoE 路线、总参数规模达到 424B 的最大模型,以及一款 0.3B dense 模型,并明确采用 Apache 2.0 许可。[1] 同一篇文章里还有第二层更值得记住的内容:这些模型基于 PaddlePaddle 训练,百度同时把相关开发工具链一并开出,并强调多硬件兼容与更自然直的部署工作流。[1]
从这个时点开始,ERNIE 4.5 看起来就不再只是百度内部的一条闭合模型线,它开始更像一条百度希望外部团队也能进入的软件供应链。
为什么仓库比 headline 更重要
公开 GitHub 仓库把这条发布结构压得更实。百度的 PaddlePaddle/ERNIE 仓库,并不只是一个模型卡片陈列页,它把 ERNIEKit 的调优与压缩、FastDeploy 的推理与服务部署,以及 Paddle 与 PyTorch 兼容格式 放进了同一条公开路径里。[2]
这里的价值,在于它缩短了开源模型最常见的一段断裂,也就是“权重已经公开”和“团队已经可以把事情重复做出来”之间的那段路。很多开源模型到了这一步,开发者仍然要自己拼训练脚本、量化路线、推理服务和客户端兼容层。ERNIE 4.5 当前这套公开打包,明显在试着把这段路缩短,而且尽量收拢到百度偏好的工具环境里。[1][2]
6 月那篇博文本身写得很清楚。它把 ERNIEKit 定位成覆盖 pre-training、SFT、LoRA、DPO、QAT、PTQ 的工业级开发工具,把 FastDeploy 定位成带有 OpenAI-compatible 与 vLLM-aligned 接口的高效部署层。[1] 这意味着百度开出来的,不只是一个模型家族,它还在试着把模型变得可用的那条路线一起开出来。
FastDeploy 才是模型发布接到生产路径的桥
到了 2025 年 8 月 的 FastDeploy 2.0 文章,这条栈逻辑就变得更明确了。百度把 FastDeploy 2.0 定义为一套对 ERNIE 4.5 原生支持的大模型推理与部署工具,底座建立在 PaddlePaddle 上,带有统一接口、8-bit / 4-bit / 2-bit 量化能力,并面向 NVIDIA 之外的多种更贴近中国场景的硬件后端做了优化,例如 KUNLUNXIN P800、Iluvatar BI-V150、Hygon K100AI 和 Enflame S60。[3]
这是一条供应链陈述,并非一条 benchmark 炫示。
它真正说明的是,百度想把 ERNIE 4.5 留在一条端到端的运行路径里:
- 训练与适配主要停留在 Paddle 体系工具内,
- 服务部署通过 FastDeploy 提供 OpenAI 兼容接口,
- 量化与调度继续在同一运行时家族里优化,
- 多种异构硬件支持也尽量靠近官方栈。[1][2][3]
顺着这些材料往下看,可以得到一个更扎实的判断:百度希望 ERNIE 4.5 的角色,不只是一次研究侧的开源馈赠,而是一条中国本土团队可以默认进入的官方路径,模型、工具和部署管线被放在同一品牌边界里。这层意义,比单日开源 headline 更大。
千帆把开源发布接成了分发面
云层同样重要。在百度 2025 年第二季度财报里,公司明确写到,千帆模型库扩充到了开源 ERNIE 4.5 系列以及更多第三方模型,同时仍然把千帆放在企业级生成式 AI 平台的位置上来讲。[6]
这一句会改变整条发布叙事的读法。
如果只有仓库与工具链,ERNIE 4.5 仍然主要是一场开发者分发事件。一旦千帆也把这条家族接进去,这件事就变成了双路径系统:
- 开源模型与开源工具链扩宽开发者漏斗,
- 云端分发把百度继续留在企业控制面里,生产负载、计费、治理与托管访问都还在这个层面上发生。[2][6]
正因为如此,ERNIE 4.5 更适合被理解成一条栈更新,而并非纯粹的发布摘要。百度在把模型层、部署层与托管平台层重新接回一条线。
PyTorch 镜像的重要性,在于它扩大了进入边
百度 6 月的博文明确写到,ERNIE 4.5 同时提供 PyTorch-compatible formats,官方 Hugging Face 页面把这一层对外暴露得更直接。[1][4] 这很关键,因为一个以 Paddle 为核心的栈,如果要求外部用户先完成整套工具链迁移,采用边界就会迅速收窄。
PyTorch 镜像把姿态改掉了。它让百度可以把 PaddlePaddle 保持为性能和部署更优的主路径,同时又把入口摩擦降下来,让习惯在更广泛开源生态里浏览、试用、分发模型的团队,也能更容易接近这条模型家族。[1][2][4]
这是一种务实的分发动作。它说明百度愿意沿着更广泛市场已经熟悉的界面把模型家族送出去,同时又把最优化、最完整的官方部署路径继续留在自己掌控的栈里。
这对 AI 中国竞争意味着什么
更大的 AI 中国问题在于,模型竞争已经不再只围绕 frontier 质量主张展开,它越来越像一场 发布节奏、工具深度、部署支撑 与 分发表面 的同步能力竞争。
放在这条尺度上,ERNIE 4.5 的力量感,比它在任何单独 benchmark 条目里的表现都更强。到 2025 年下半年,这条家族已经被放进一条连续叙事:开源公告、官方仓库、Apache 2.0 许可、Paddle 体系的调优工具、FastDeploy 的服务基础设施、PyTorch 兼容镜像,以及千帆里的分发位置。[1][2][3][4][6]
这种软件供应链对齐,即使面对别的模型家族拿到更多公开 benchmark headline,仍然会有意义。它提高了百度把开发者与企业买方都留在同一条品牌路径里的机会,从实验到托管使用,中间的断裂被压缩了。
边界条件
这里仍然有一条需要保留的边界:当前大部分证据仍然来自厂商侧。百度把路径写得很清楚,但外部第三方广泛生产采用的公开证据,仍然没有它的栈文档那么密。
如果下面三件事一起出现,这条判断就会变弱:
- PyTorch 镜像可见,真正高性能的官方路径却仍然过于依赖 Paddle,外部采用面没有明显扩大,
- FastDeploy 对后续 ERNIE 家族的支持节奏跟不上模型发布节奏,
- 千帆更多像一个目录层,而没有继续变成真实负载黏住的托管控制面。
这三层一旦同时出现,ERNIE 4.5 仍然会是一套完成度很高的发布包,却未必能形成耐久生态路径。
接下来要看什么
第一,看后续 ERNIE 家族会不会继续保持这种栈纪律:官方权重、官方适配路径、官方部署运行时和官方云端分发一起出现。[1][2][3][6]
第二,看百度会不会继续把 FastDeploy 做成异构国产硬件之间的桥,而并非让部署重新碎裂成一组组针对单模型的临时 recipe。[3]
第三,看开源路径能否持续给千帆导流,而并非反过来削弱它。若开源权重负责放大开发者漏斗,千帆继续承担企业操作层,这套策略就会更扎实。[4][6]
结语
ERNIE 4.5 真正值得记住的,不只是百度在 2025 年 6 月把一个模型家族开了出来。更重要的是,百度把 Paddle 训练、ERNIEKit 调优、FastDeploy 推理、PyTorch 兼容分发 与 千帆可用性 逐步接成了一条可运行的路径。
这正是它适合落在 Stack & Supply Chain Update 里的原因。战略上最重要的变化,并非一条模型发布,而是一条软件栈开始成形,使 ERNIE 4.5 更容易被采用、更容易被服务化,也更难再被看成一条孤立的模型新闻。
来源
- ERNIE Blog,"Announcing the Open Source Release of the ERNIE 4.5 Model Family"(2025-06-30;10 个模型、Apache 2.0 许可、PaddlePaddle 训练、ERNIEKit 与 FastDeploy 线索)。
- PaddlePaddle,《ERNIE》GitHub 仓库(ERNIE 4.5 官方仓库,包含 ERNIEKit 流程、FastDeploy 链接,以及 Paddle / PyTorch 格式)。
- ERNIE Blog,"FastDeploy 2.0: A Large-Scale Model Inference and Deployment Toolkit with Native Support for ERNIE 4.5"(2025-08-14;OpenAI 兼容服务、量化与异构硬件支持)。
- Hugging Face,"baidu/ERNIE-4.5-21B-A3B-PT"(百度官方模型页,显示 PyTorch 兼容分发表面)。
- 百度经 PR Newswire 发布,"Baidu Announces First Quarter 2025 Results"(2025-05-21;ERNIE 4.5 与 ERNIE X1 的 2025 年 3 月发布基线)。
- 百度经 PR Newswire 发布,"Baidu Announces Second Quarter 2025 Results"(2025-08-21;千帆模型库扩充到开源 ERNIE 4.5 系列与第三方模型)。
- Wikimedia Commons,"File:Baidu Technology Park at ZPark Phase II (20220502113650).jpg"(题图来源页)。