把时间锚定在 2026-04-07 UTC,理解 MiniMax,更合适的入口已经并非“又一家中国模型公司能不能再赢一次周榜”。更值得盯住的市场信号,落在它正试图把快速增长的开发者需求,接成一份横跨编码、办公与媒体生成配额包。[1][2][3][4][5] 这件事重要,原因在于,厂商卖出的能力已经由单一文本模型接入权扩展为可滚动重置、跨模态分配的工作负载套餐,竞争焦点随之从“今天哪一个模型更强”,转向“哪一家厂商更有能力把整段 Agent 工作流留在同一张付费表面里”。[2][3][4]

MiniMax 自己给出的数字,已经把这条线写了出来。FY2025 营收同比增长 158.9%,达到 7900 万美元,其中超过 70% 来自国际市场。[1] 同一份财报还写到,M2 家族在 2025 年第四季度成为首个在 OpenRouter 上单日 token 消耗突破 500 亿的中国模型;到了 2026 年 2 月,M2 系列文本模型的平均日 token 消耗,已经超过 2025 年 12 月6 倍,而旧 Coding Plan 带来的 token 消耗则增长了 10 倍以上。[1] 把这些数字同新版文档放在一起看,真正的转折点就出来了:MiniMax 正试图在国际需求从“只买编码能力”外溢成“整段工作负载习惯”的那一刻,把这部分流量锁进自己的一份订阅结构里。[1][3][4][5]

图片说明:题图采用 MiniMax 在旧金山举办的 Founder Day @ GTC 官方活动照片。这里需要一张真实的现场图,因为文章讨论的正是面向全球开发者的产品打包方式,屏幕上清楚出现的 product matrix,比任何抽象 AI 概念图都更接近本文要说的商业事实。[6]

MiniMax 的商业故事,真正变化在哪里

旧版 MiniMax 叙事并不难理解。它是一家来自中国、在全球创作者市场上已经跑出声量的多模态公司,视频产品强,底层模型能力也有可信度。这个判断至今仍成立,只是已经不足够完整。[1] 财报现在给出的方向更具操作性。管理层明确写到,公司希望从一家大模型公司,进一步演化成一个 AI 时代的平台公司,并把编码、办公场景与多模态创作直接列成下一轮智能需求扩张的主要方向。[1]

只看这组表述,读者容易把它归入投资者关系口径。产品文档却在朝着同一方向移动。发布记录页把 2026 年 2 月M2.5 定义为围绕编程、工具调用与搜索、办公生产力等场景的一次升级,又把 2026 年 3 月 18 日M2.7 定义成“递归式自我改进”的起点。[2] 面向编码工具的接入指南则把这件事往上再推了一层:MiniMax 不只是在写一份 API 说明,而是在认真说明 M2.7 如何进入 AI 编码工具,如何通过兼容 Anthropic 与 OpenAI 风格的客户端进入日常开发流程。它真正想抓住的商业表面,落在被工作流包起来的开发者习惯,裸露模型调用只是其中一个入口。[4]

正因如此,FY2025 财报里的数字,比口号更有价值。MiniMax 把 5310 万美元收入归在 AI 原生产品,把 2600 万美元归在开放平台与企业服务;毛利率改善到 25.4%,与此同时,调整后净亏损仍有 2.509 亿美元。[1] 这组结构同时说明两件事。其一,国际需求是真实的,付费也是真实的。其二,公司仍需要一种比“又一轮模型对比”更能持续放大收入质量的打包方式。Token Plan 正是目前最清楚的一条证据。[1][3]

为什么真正重要的是 Token Plan,而并非又一张 benchmark 卡

Token Plan 概览页把这次变化写得很直白。MiniMax 说,这份计划是在原先 Coding Plan 之上扩展出来的,覆盖语言模型之外的调用,从而支持更多创意型 Agent 与应用在一份订阅里被构建出来。[3] 这一句,已经把它的商业意图压缩得很完整。

过去若把编码放在一条商业线,把其他模态继续留在按量 API 计费里,用户更容易把 MiniMax 只看成一家编码模型供应商。Token Plan 则改了这个入口。标准套餐里,M2.7 被写成 每 5 小时 1,500 / 4,500 / 15,000 次请求的三档额度,而其他模态则以日配额方式接在同一张表里,分别覆盖语音字符数、图像生成次数、Hailuo 视频调用,以及 Music 2.5 的产出量。[3] 高速档又把文本能力推到 每 5 小时 30,000 次请求,同时把图像、视频、音乐等每日额度一并抬高。[3]

这会改变购买者的感受。若它只是编码套餐,用户自然会把它同别家的编码套餐横向并排。若它是一份多模态配额包,用户更容易顺手把邻近工作也留在同一账户下完成:先用 M2.7 写代码,再整理一份 deck,再合成语音、生成图片,或者调用 Hailuo 做一段短视频,而并非在每个步骤切换供应商。[3] 放在商业层面,这就是把高频文本习惯,接成一条更宽的工作负载留存回路。

文档还保留了流量溢出后的衔接方式。Token Plan 用尽后,用户可以切回 pay-as-you-go API key 继续沿用同一套工具配置;文本额度按滚动 5 小时重置,非文本模态则按日重置。[3] 这是典型的平台化写法。它减少了工作流的中断,又在用户心里不断强化 MiniMax 自己定义的商业单位。

编码仍然是楔子,但已经并非全部故事

编码仍然是楔子,因为高频、重复、对结果敏感的需求,最早会在这里暴露出来。财报写到,Coding Plan 带来的 token 消耗到 2026 年 2 月增长了 10 倍以上,同时 M2.5 在编码场景里相对 M2.1 提升了 37%效率,并把复杂 Agent 的运行成本推向可规模化。[1] M2.7 面向编码工具的接入文档,则把这根楔子变成分发表面:OpenClaw、Claude Code、OpenCode、Cline 等工具都在官方支持名单里,因为这里正是开发者流量最容易沉淀成重复习惯的入口。[4]

但真正重要的商业动作,在于 MiniMax 并没有停留在编码这一个表面。它一边把 M2.7 严密地写进编码工作流,一边又把编码请求放进一份同时覆盖视频、音乐、图像与语音额度的 Token Plan 里。[3][4] 这一步,才是从“开发者预算”走向“应用预算”的桥。

外部市场信号也支持这一判断。SCMP 在 2 月底引用 OpenRouter 数据写到,MiniMax 的 M2.54.55 万亿 tokens 位列当月平台首位,排在 Moonshot 的 Kimi K2.5 之前。[5] 这组数据还不足以直接推出长期变现结论,同时已经清楚显示国际开发者侧的真实需求在场。Token Plan 在这里承担的角色,是把这股需求留在 MiniMax 自己的工作流表面,降低它向相邻供应商外流的概率。[3][5]

反方向的力量,同样清楚

这里确实存在一条不能绕开的反向线,而且不应该被弱化。打包只有在用户真的把这份包用成重复的、付费的、跨模态工作流时,才配叫护城河。否则,它很容易变成一层折扣包装,里面装的仍旧是成本高昂的基础设施。

MiniMax 自己的财报已经把这个边界保留得很清楚。2025 年调整后净亏损仍为 2.509 亿美元。[1] 毛利率的确改善了,但公司仍需要证明,更高频的订阅式包装,最终能带来更好的收入质量,而不只是更大的配额消耗。[1] 计划设计内部也有执行风险:如果用户真正需要的始终只是文本主线,而媒体额度只是顺手附带,那么这份包的防御力就会比它表面看上去更弱。

这就是本文的证伪条件。若 Token Plan 的采用继续扩张,跨模态使用却始终停留在浅层,毛利质量也没有进一步抬升,那么“护城河”这一判断会很快变弱。到那时,MiniMax 仍然有需求,但它尚未证明自己已经找到优于单纯模型竞争的商业容器。[1][3]

接下来真正值得看的三件事

第一,看 MiniMax 会不会继续把“编码楔子”往成品办公工作流上推。M2.7 的材料已经开始强调 office editing、分析师式任务与复杂 skill 调用,接下来要看的,是这些能力能否从 demo 进入普通用户真实消耗订阅额度的日常动作。[2][4]

第二个观察点是 Token Plan 相对旧 Coding Plan 的实际吸收质量。coding-only 改名为 multimodal 之后,下一阶段需要看到工作负载宽度扩大与留存稳定提升,护城河结论才能具备持续性。[1][3]

第三,看国际需求会不会继续验证这条方向。FY2025 超过 70% 的收入来自国际市场,OpenRouter 的公开数据又给了 MiniMax 一次出口侧的需求证明。[1][5] 如果它既能继续赢得海外开发者注意力,又能把这些流量更深地接成稳定付费工作流,那么这份配额包才会从“聪明的产品设计”真正长成“结构性的商业位置”。

结语

MiniMax 真正想守住的护城河,是把编码、办公与媒体工作打成一份配额包。它仍然需要证明,这套包装最终能带来比纯模型竞赛更好的经济质量,但方向已经摆在公开材料里:国际需求是真的,M2 系列使用在加速,旧 Coding Plan 已经被拓宽成一份多模态订阅,目的是把更多工作留在同一个账户里完成。[1][3][5]

来源

  1. MiniMax,《MiniMax Global Announces Full Year 2025 Financial Results》(2026 年 3 月 2 日;营收结构、国际收入占比、M2/M2.5 采用情况、Coding Plan 增长、毛利率与亏损数字)。
  2. MiniMax API Docs,《Models》发布记录页(2026 年 3 月 18 日的 M2.7 条目与 2026 年 2 月的 M2.5 条目,概括两次发布的重点方向)。
  3. MiniMax API Docs,《Token Plan Overview》(Token Plan 如何从原先 Coding Plan 扩展成多模态订阅,以及 M2.7 的滚动 5 小时重置方式)。
  4. MiniMax API Docs,《M2.7 for AI Coding Tools》(官方编码工具接入指南,说明 M2.7 如何进入编码客户端与兼容 API 表面)。
  5. South China Morning Post,《China’s MiniMax, Moonshot top AI token use ranking, ending year of US dominance》(2026 年 2 月 25 日;OpenRouter 上 MiniMax M2.5 的公开使用量背景)。
  6. MiniMax,《MiniMax AI Founder Day @ GTC: Inside the Conversations on What's Next in AI》(官方活动页,也是本文题图来源页)。

编辑精选评语

这篇文章进入本轮编辑精选,关键在于它把噪声很高的模型周期叙事,压实成一条具备运营判断价值、且贴近 24 小时窗口的商业论证链。核心判断可被证伪,数字锚点也完整可追:营收结构、国际占比、token 速度、配额重置机制、毛利与亏损背景,都被收束到同一命题——竞争重心正在由榜单表现转向打包后的留存效率。

它也顺利通过当前更严格的图片策略门槛。题图是与主题直接对应的真实活动现场照片(MiniMax Founder Day @ GTC),与文中“平台化打包”论点一致;文内没有分析图替代,也没有合成概念图与装饰性抽象视觉。