截至 2026-06-17T14:07:23Z UTC,观看 Nathan Lambert 这场 2025 年开放模型格局演讲时,最有用的入口并不是把它当成某个月里哪一个模型胜出的记分牌。它更像是一次关于发布文化已经改变的诊断。这场演讲对 ai-china 报道有价值,因为它把 DeepSeek、Qwen 与更广泛的中国开放模型浪潮放在一种生态行为里理解:实验室学会了让模型权重、推理配方、尺寸阶梯与部署表面传播得更快,快到常规前沿模型评论很难及时消化。[1][2]
这个区分很重要,因为公开的 AI-China 讨论经常被两种单薄叙事夹住。一种叙事说,中国只是复制或商品化前沿工作。另一种叙事说,某次 DeepSeek 式冲击证明了永久性逆转。Lambert 的框架比这两种都更有用。真正有意义的变化,是一种可以反复执行的发布规范正在出现:发布有能力的开放权重模型,解释足够多的配方细节来建立可信度,让下游开发者快速比较和改造,再用由此形成的采用压力,让闭源在位者保持诚实。[1][2][5]
封面图也属于这个框架。阿里巴巴的 Qwen 只是其中一个角色,但它的开放权重发布节奏,已经成为 Lambert 所描述的中国发布模式中最清楚的例子之一。阿里巴巴杭州总部的真实照片,让这篇文章连回公司、团队、园区与云分发通道,而不是停留在抽象的“AI 竞赛”图像里。[3][6]
首先要看见的,是从模型排名转向模型规范
这场演讲最有力的一步,是把“开放模型”处理成一种行为类别,而不只是许可证标签。[1][2] 这对于理解中国 AI 很必要。排行榜可以告诉你,在某个时点上 DeepSeek-R1 或某个 Qwen 变体是否接近公开 benchmark 顶部。它却无法说明,围绕这次发布形成的材料,是否会让模型在下一波应用中更容易被检查、微调、量化、托管、路由或比较。
DeepSeek-R1 是解释这种规范为何重要的最清楚例子。它的技术报告强调,通过强化学习产生推理能力、主线 R1 模型的 cold-start 路径,以及把能力蒸馏到更小的 dense 模型中。[4] 这里重要的 AI-China 信号不只在于模型表现出色,还在于这次发布把一套推理配方变成了全球生态都可以讨论、测试和模仿的对象。闭源模型可以给用户留下强烈印象;开放权重推理模型则可以重置外界对其他实验室解释义务的预期。
Qwen 展示了互补的模式。Qwen3 发布时,把整个家族组织在多个 dense 与 mixture-of-experts 模型、thinking 与 non-thinking 混合行为、广泛多语言支持,以及开放权重分发周围。[3] 这种包装形态很重要,因为它让不同用户可以从不同入口进入:研究者研究能力,开发者寻找可部署 checkpoint,云客户需要托管 API,产品团队测试是否只把推理路由给更难的任务。
到中国相关段落附近,开放性变成了一套压力系统
可以把 Lambert 对中国的强调读成一种压力系统论证。[1][2] 开放发布改变市场,并不要求它们击败每一个专有模型。它们只要足够强、足够便宜、足够清楚、足够频繁,就能把默认问题从“哪一个闭源 API 最好?”改写为“这个任务为什么不能跑在一个开放的中国模型上,或者跑在它的本地衍生版本上?”
围绕这场演讲的书面记录里,也能看到这种压力。Lambert 的配套文章说,2025 年的开放模型讨论受到 DeepSeek 开启中国开放模型规范、Qwen 占据主导,以及开放生态更大范围重排的塑造。[2] Stanford HAI 的政策简报从另一个角度抵达相近的高层关切:中国的开放权重生态已经足够多样,也足够全球扩散,政策分析必须越过单一公司或某个 DeepSeek 时刻。[5]
由此形成的,是一个生态故事,而不是英雄实验室故事。DeepSeek 让推理发布显得具有战略后果。Qwen 让家族宽度与部署包装显得日常化。其他中国实验室随后也在同一片预期场中竞争:模型卡、checkpoint、demo、API 访问与快速下游移植,都成为发布本身的一部分。结合这场演讲与相关来源,我的推断是,这才是真正的竞争变化。中国 AI 不只是在交付模型,也在让更快的公开证明周期成为常态。
工程注释关注的是摩擦
对技术观看者来说,实际问题是摩擦。从读到公告到让模型变得可用,中间隔着多少步骤?工程师能不能在不从社交帖里重新拼接所有信息的情况下,识别模型尺寸、许可证边界、上下文行为、推理模式、服务路径与预期取舍?团队能不能把一个本地开放权重选项与托管端点放在一起比较,而不用猜测不同变体之间到底变了什么?
这正是 Qwen3 包装方式有启发性的地方。它的公开发布材料并不只是说“新模型”。它把家族、模式行为、语言宽度与开放可得性都放进采用表面里。[3] DeepSeek-R1 的报告从研究侧做了相近的事情,把强化学习与蒸馏选择变成公共讨论的一部分。[4] 这两次发布并不相同,但它们共享一种规范:能力主张到来时,会带着足够多的外围材料,让下游测试迅速展开。
限制同样重要。开放权重并不会消除治理、安全、评估或供应链问题。它们还会放大这些问题,因为一个被广泛复制的模型家族,会出现在包装器、fork、量化变体与托管端点里,每一种都有不同的运行保障。正因如此,Lambert 的演讲不适合被读成简单的开源鼓励。困难问题在于,这种发布文化究竟会产生可信的采用,还是只会产生更快的采用。
持久信号是发布节奏加解释
视频里最耐久的洞察,是开放模型竞争如今存在于节奏与解释的配对之中。[1][2] 只有节奏、缺少解释,会制造噪声:很多模型名,很少信心。只有解释、缺少节奏,会留下值得尊敬的论文,却很难塑造开发者行为。中国开放模型浪潮之所以产生后果,是因为实验室开始把两者结合起来:频繁发布,同时给出足够的技术与产品框架,让其他人快速评估。
对 AI-China 观察者来说,这会改变检查清单。不要只问最新中国模型是否登上某个 benchmark 顶部。要问这次发布是否让自身变得可用。权重是否开放?推理与非推理模式是否清楚?更小的蒸馏模型是否属于策略的一部分?模型家族是否足够宽,能够适配不同成本与延迟包络?从研究发布到云端点、本地推理栈或应用表面,是否存在一条路径?
Lambert 的演讲值得嵌入,是因为它让这张检查清单变得可见。故事的重心并不是“DeepSeek 发生了”,也不是“Qwen 很强”。故事在于,中国实验室帮助开放模型发布规范变得难以忽视。一旦这种规范存在,每一家闭源前沿实验室、每一个开放权重竞争者、每一个企业买家,都必须回应一条新的基线:当能力可以下载、测试、改造和解释时,它会更有说服力。[1][2][5]
来源
- PyTorch,《Mapping the Open Model Landscape in 2025 - Nathan Lambert, Ai2》,YouTube 视频。
- Nathan Lambert,Interconnects AI 上的《The State of Open Models》(2025 年演讲配套文章,讨论 DeepSeek、Qwen 与开放模型生态变化)。
- Qwen Team,《Qwen3: Think Deeper, Act Faster》(官方发布文章,介绍 Qwen3 家族、混合推理模式、语言覆盖与开放权重分发)。
- DeepSeek-AI,《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》(关于 R1、R1-Zero、强化学习与蒸馏的 arXiv 技术报告)。
- Stanford HAI,《Beyond DeepSeek: China's Diverse Open-Weight AI Ecosystem and Its Policy Implications》(关于单一 DeepSeek 时刻之外扩散效应的政策简报)。
- Wikimedia Commons,《File:Alibaba group Headquarters.jpg》(本文配图来源使用的真实照片)。