截至 2026-03-27 UTC,中国 AI 开发者工具里最清楚的一条变化,已经不再停在裸模型 API 那一层。变化继续往上移动,进入了打包的编码产品表面:模型接入、客户端整合、额度设计、工作流默认值,被一起包进同一个订阅或同一个编码计划里。[1][2][3][4][5][6]
顺着这些文档往下读,会看到一个方向越来越明确:国内模型厂商正在试图通过编码订阅抓住开发者,而不只通过 token 价目表抓住开发者。 这组证据还不足以证明编码席位会立刻成为主要收入来源,但已经足够说明产品设计正在朝哪里倾斜。Qwen Code 与智谱 GLM Coding Plan 都在把模型调用改写成一个带有独立规则、独立接入方式、独立留存逻辑的工作表面。[2][3][4]
配图说明:封面使用的是 2025 年上海世界人工智能大会的一张真实现场照片。这里采用会议现场影像,更贴合本文讨论的市场层竞争与开发者入口之争,也让视线从单一厂商的合成物料上移开。[7]
2026Q1 到底发生了什么
Qwen 现在已经不再只是一个模型家族名称。Qwen Code 首页把自己直接摆成一套编码代理表面,终端是起点,向外延伸到 Visual Studio Code、Zed IDE、JetBrains IDEs、GitHub Actions、MCP、LSP、token caching 与 sandboxing。[1] 这层变化很重要,因为它把分发从一次性试用,推成日常习惯。只要一个供应商同时进入终端、IDE 与自动化链路,它争夺的就不只是 benchmark 关注,而是每天的工作流份额。
Qwen Code 在 2026-03-03 的 weekly update 里,把商业信号写得更直接。Qwen Team 表示,OAuth 认证对应的模型已经升级到 qwen3.5-plus,并且带有每天 1000 次免费调用。[2] 这已经是很有分量的补贴。开发者如果在编码客户端里每天拿到这样的使用量,形成的就不再只是 API 试用关系,而更像是一个席位产品的行为循环。
阿里云在 Qwen Code 的 provider 文档里,把这层结构从接入侧继续坐实。"Alibaba Cloud Coding Plan" 这一路径会在工具里自动配置 qwen3.5-plus、qwen3-coder-plus 与 qwen3-max-2026-01-23,同时把 China 与 International 两套区域接入流程明确分开。[3] 也就是说,这个包卖的已经不只是"一个 endpoint",而是一条编码专用通道,里面包含预设模型、区域化接入与更低的初始化摩擦。
智谱走的是平行路线,只是订阅形态更直接。GLM Coding Plan 在官方文档里被定义成一套可跨 Claude Code、Kilo Code、Cline、OpenCode、TRAE、CodeBuddy 与 OpenClaw 使用的编码订阅。[4] 页面同时说明,自 1 月 23 日 10:00(UTC+8) 起,由于需求过高,Lite、Pro、Max 三档新库存改为每天 10:00(UTC+8)释放。[4] 这种语言已经并非普通 API 页面会使用的语言,而是典型的产品分层语言。
它的额度设计又把这层打包逻辑推得更完整。智谱写得很清楚,套餐按 5 小时与 7 天两个周期刷新,Lite、Pro、Max 三档在每 5 小时约可处理 80 / 400 / 1600 次 prompts,每周约可处理 400 / 2000 / 8000 次 prompts。[4] Pro 档还包含联网搜索、网页读取与开源仓库 MCP 合计每月 1000 次调用额度;整个套餐则被描述成折算后约等于月费 15 到 30 倍 的 API 可用价值。[4] 这里卖的已经是席位经济,模型算力只是被包在里面。
为什么真正的变化发生在 API 之上
第一层影响在获客。把免费量或结构化额度放进编码客户端,远比一张普通模型卡更有牵引力,因为开发者从好奇走向日常使用所需要跨过的步骤更少。Qwen 的每天 1000 次免费调用,加上智谱的套餐式 prompt 预算,本质上都在把第一轮高频试用从裸 API 账单里挪出来,放进带包装的产品关系里。[2][4]
第二层影响在接口占位。智谱的 Claude Code 接入指南,把这件事写得几乎没有遮掩:ANTHROPIC_DEFAULT_SONNET_MODEL 与 ANTHROPIC_DEFAULT_OPUS_MODEL 可以直接映射到 glm-5-turbo 与 glm-5,同时再叠加高峰与非高峰的不同抵扣规则。[5] 这一步很关键,因为厂商没有要求开发者先放弃原有工具习惯,而是把国产模型的经济结构嵌进一个已经熟悉的编码客户端里。
OpenCode 页面的做法也是同一方向。智谱在 OpenCode 指南里把它定义成一款 CLI + TUI AI 编程代理工具,同时具备 IDE 插件整合能力;使用 GLM Coding Plan 时,还要接入专门的 coding endpoint,也就是 https://open.bigmodel.cn/api/coding/paas/v4,而并非通用 API 表面。[6] 一旦供应商开始给编码流量单独设立端点,它就已经把软件开发场景视作一条独立的变现通道,而并非聊天补全需求的附属部分。
这正是市场读法需要调整的地方。分发如果停留在客户端层面,原始 token 定价就不再构成全部竞争故事。真正的争夺,开始转向谁能组合出更有吸引力的一整包内容:
- 熟悉的客户端兼容性,
- 被补贴或被平滑过的使用量,
- 预设好的模型默认值,
- 内置的 MCP 与工具能力,
- 以及在真正开始干活之前更少的配置决策。[1][3][4][5][6]
模型能力当然还在核心位置,只是模型能力转化收入的地方变了。厂商现在试图卖出的,不再只是一个模型,而是一张可以工作的编码席位。
这更像捆绑分发,不只是功能扩展
很容易出现一种较弱的读法,认为这些页面只是给 API 外面多包了一层便利功能。顺着现有文档继续往下看,更强的读法会更成立:厂商正在搭建一个捆绑分发表面。
Qwen 的文档已经把终端、IDE 扩展、GitHub Actions、MCP 与配置层放进同一个产品框架里。[1][3] 智谱则再往前走一步,把多工具兼容、额度设计、专用 coding endpoint、MCP 配额,以及 GLM in Excel (Beta)、智谱 AI 输入法 这类相邻权益放进同一个订阅语境里。[4] 当这些部件开始归到同一张套餐下面时,真正重要的产品就已经并非孤立模型接口,而是整包的开发者工作流。
这套捆绑的经济目的并不复杂。它可以通过补贴首轮使用降低获客成本,通过进入日常编码节奏抬高留存,也可以因为客户评估对象变成"模型智能 + 客户端便利 + 工具接入"的混合包,而削弱最直接的 token 单价对比。[2][3][4]
接下来最该盯住什么
接下来真正重要的事情,已经比再来一次 headline benchmark 波动更具体。
第一,看 Qwen 会不会长期维持每天 1000 次免费调用这个水平,还是在用户规模稳定后缩窄补贴。[2] 如果收紧得很快,当前阶段更接近获客投放;如果保持较久,Qwen 更像是在认真构建长期席位策略。
第二,看智谱每天放量与 5 小时额度制度会不会逐步放松。[4] 如果这类供给约束持续出现,说明需求强度很高,但算力与交付能力仍在受压;如果这些摩擦逐步消失,而工具覆盖继续扩张,GLM Coding Plan 作为分发表面的可信度会更高。
第三,看更多厂商会不会开始提供编码专用 endpoint、客户端层模型别名,以及打包的 MCP 或工具权益。[3][5][6] 只要这类结构开始普遍化,中国 AI 开发者变现的重心就会很清楚地继续上移,离开裸模型 API,落到工作流产品层。
核心判断
把这些 2026Q1 文档合在一起看,比"中国 AI 竞争激烈"更有用的结论其实更窄,也更可强制执行:编码订阅正在成为国内模型厂商把模型能力转成重复性开发者习惯的真正分发表面。 API 依然重要,只是它看起来已经不再等于完整产品。
来源
- Qwen Team, "Qwen Code" 文档首页(终端、IDE、GitHub Actions、MCP 与工具表面概览)。
- Qwen Team, "Qwen Code Weekly: Insight Analytics, Clipboard Images, Terminal Capture"(2026 年 3 月 3 日;qwen3.5-plus OAuth 与每天 1000 次免费调用)。
- Qwen Team, Alibaba Cloud Coding Plan 的 "Model Providers" 文档(自动配置模型、区域化接入与 coding plan 整合)。
- 智谱AI开放文档, "GLM Coding Plan 套餐概览"(工具覆盖、库存释放时间、额度设计、MCP 配额与订阅框架)。
- 智谱AI开放文档, 面向 GLM Coding Plan 的 "Claude Code" 指南(Anthropic 风格模型别名与编码套餐规则)。
- 智谱AI开放文档, 面向 GLM Coding Plan 的 "OpenCode" 指南(CLI + TUI 定位、IDE 整合与专用 coding endpoint)。
- Wikimedia Commons, "File: Emmanuel R. Goffi, keynote at the World AI Conference (WAIC) 2025 in Shanghai-1.jpg" 文件页。