把时间锚定在 2026-04-17 UTC,理解 MiniMax 2026 年 3 月 18 日这次 M2.7 发布,更合适的入口落在分发层。发布页给出的口号当然醒目,写的是“自我迭代”;更值得盯住的是 MiniMax 已经把这套模型摆进了哪些表面:官方编程工具接入文档、升级后的 Token Plan 订阅,以及 MaxClawMaxHermes 这类托管智能体入口。[1][2][3][6][7] 顺着这些页面读下去,“自我迭代”已经不只是研究叙事里的一个词,它正在被写成一种工作负载契约。

这一点放在 ai-china 语境里尤其关键。市场上的公开叙事经常分成两条线,一条围绕模型名次、速度、榜单和新版本,另一条围绕开发者究竟把模型接到哪里、计费单位如何定义、以及供应商有没有把 API 上面的智能体表面握在自己手里。M2.7 目前公开出来的材料,更明显地落在后一条线上。[1][2][3][4][5][6][7]

图片说明:题图采用 MiniMax 官方黑客松现场照片。它适合本文,因为这次发布更像一条进入开发者与运营者日常工作流的分发动作,真实协作场景比任何分析示意图都更贴近文章讨论对象。[9]

3 月 18 日这次发布,真正新增了什么

MiniMax 官方发布页写得很短,信号却很集中。2026-03-18 这一天,平台把 MiniMax-M2.7MiniMax-M2.7-highspeed 作为一组新的文本模型推出,同时给出一句核心描述:“开启模型的自我迭代”。[1] 更宽一点的 API 兼容文档把运行边界补充得更具体。无论在 OpenAI 兼容接口还是 AI SDK 兼容接口中,MiniMax 都把 M2.7 与 M2.7-highspeed 标成 204,800 token 上下文窗口,并给出大致 60 TPS100 TPS 的输出速度。[5]

定价页又把另一个层面摆了出来。按量计费模式下,MiniMax-M2.7 的输入价格为 2.1 元/百万 tokens,输出价格为 8.4 元/百万 tokensM2.7-highspeed 的输入与输出价格则抬到 4.216.8 元/百万 tokens。[4] 这种信息密度,指向的并非轻量闲聊场景。它更像一套面向持续开发、持续调用、持续路由的工作模型。

能力层面最强的表述,目前仍主要来自 MiniMax 自身或其合作方向外延材料,因此阅读时需要把边界看清。MiniMax 4 月 12 日关于 FlagOS 的新闻稿把 M2.7 描述成 M2 系列里第一款深度参与自身迭代的模型,可以自主构建复杂 Agent HarnessSkills、更新自身 Memory,并通过强化学习驱动自身迭代。[8] 同一篇文章还给出若干成绩:SWE-Pro 56.22%,与 GPT-5.3-Codex 持平;GDPval-AA 排名落在 Opus4.6Sonnet4.6GPT-5.4 之后;在 40 个超过 2,000 tokens 的复杂 Skills 场景下,指令遵循率达到 97%。[8] 这些数字有参考价值,适合作为官方方向信号来读;跨厂商、跨评测体系的定论位置,现阶段还站不稳,因为公开材料没有给出一套完全共享的评测外壳。

即便把这个边界放在前面,M2.7 的产品意图仍然很清楚。MiniMax 想强调的,不只是“代码写得更好”,而是模型已经更适合进入更长的智能体循环,在那里,记忆、工具、技能复用与指令稳定度和一次性回答质量站在同一层重要性上。[1][5][8]

编程工具覆盖面,才是最关键的泄露点

官方编程工具接入页让这次发布的真正形状显露出来。MiniMax 没有把 M2.7 只放进一个首选客户端,而是把它铺到了 Claude CodeCursorTRAEOpenCodeKilo CodeOpenClawHermes AgentClineRoo CodeCodex CLIDroidZedMonkeyCode 等一整串工具表面。[2] 这个名单比一句“自我迭代”更重要,因为它说明 MiniMax 想让 M2.7 进入开发者已经形成的工作习惯,而并非要求用户先迁移到一个全新的专有工作台。

兼容层把这条路线继续写实。MiniMax 明确说 M2.7 与 M2.7-highspeed 同时兼容 OpenAIAnthropic 两类协议面。[2][5] 在 Claude Code 文档里,平台给出的接入地址是 https://api.minimaxi.com/anthropic,并把一整组默认 Claude 模型变量都映射到 MiniMax-M2.7。[2] 在 Cursor 文档里,平台要求用户把 https://api.minimaxi.com/v1 写成覆盖后的 OpenAI base URL,再把 M2.7 加成自定义模型。[2] 技术动作本身很简单,战略含义却更大:MiniMax 在努力把迁移成本压成配置动作,而并非架构动作。

OpenClaw 这一页把这个意图写得更直白。MiniMax 的 Token Plan 文档专门放了一条 OpenClaw 接入路径,让用户把 MiniMax 选成 provider,把 MiniMax CN 选成认证方式,并在确认模型时默认勾选 M2.7,同时把它设成默认模型。[2][6] 当一家模型公司开始这样公开地为第三方智能体外壳写默认配置路径,模型的商业角色已经发生了变化。它不再只是一个可选 API,而是在争取成为现成智能体工作流里的默认执行者。

套餐包装也跟着模型一起动了

Token Plan 文档说明,MiniMax 这次并没有只更新模型,还同时更新了商业包装。平台明确写出,Token Plan 是从原来的 Coding Plan 全面升级而来,范围从语言模型扩展到了语音、视频、音乐和图像配额,目标是让用户在一个订阅里构建更完整的智能体与应用。[3] 这是一条很重要的信号。平台卖出的内容,已经不只是“代码助手额度”,而是在争取把智能体周边更多工作都留在同一个账户里。

配额设计很具体。标准版里,M2.7 分别给到 6001,5004,500 次请求/5 小时;极速版里,M2.7-highspeed 分别给到 1,5004,50030,000 次请求/5 小时。[3] 文档还说明,文本模型额度按五小时滚动窗口恢复,其它模态按日配额重置。[3] 一旦用户在五小时窗口里触顶,页面又直接给出后续路径:切换到按量计费 API Key,继续跑下去。[3] 这种设计很像平台行为。MiniMax 在先教用户用自己的配额单位思考工作负载,同时又保留了一个自然外溢到 token 计费的出口。

把 Token Plan 和按量计费页合起来看,商业意图就很清楚了。MiniMax 希望 M2.7 同时站住两条相邻的线:一条是订阅制,承接反复发生的开发与智能体任务;另一条是普通 token 计费,承接超额与个性化工作负载。[3][4] 这样的发布边界,已经大过一次单独模型更新。

托管智能体,才让这次发布真正落地

真正让这次发布超出文档层面的,是官方托管智能体表面的推进。MaxClaw 被 MiniMax 写成官方 云端 AI Agent 平台,底层基于开源 OpenClaw 框架,并由 MiniMax M2.7 驱动。[6] 页面写得很直接:用户可以在 10 秒内创建自己的智能体,不需要自己准备服务器、Docker 或 API Key;之后可以调用浏览器、代码执行和文件分析等工具完成多步骤任务,并通过长期记忆保留偏好与上下文。[6] 这种产品表面已经比一个普通 API 控制台更有方向。

MiniMax Agent 的更新日志把这层变化继续推实。2026-04-11,平台上线 MaxClaw 设置面板,集中管理定时任务、连接渠道、人设配置和技能。[7] 到 2026-04-16,又推出 MaxHermes,页面里列出的功能包括 自进化 Skills跨会话持久记忆自然语言定时任务多子代理并行,同时明确写出 MiniMax M2.7 在工具调用准确度、Skills 遵循和 Agent 适配上带来全面提升。[7] 也正是在这里,发布说明里的“自我迭代”第一次被写成了可消费的产品行为:技能会沉淀,记忆会延续,任务会自动执行,智能体会并行展开。

这还不能证明 MiniMax 已经拥有坚固护城河。工具页会变化,托管智能体也或许暂时只是一部分用户的工作入口,订阅经济性也还要经受更重工作负载的检验。可方向已经很清楚。M2.7 正被 MiniMax 安排进一条连在一起的链条:编程客户端、智能体外壳、订阅套餐,以及 MiniMax 自己持有的云端智能体产品。[2][3][6][7]

接下来更值得看的三件事

第一,继续看 M2.7 在下一轮更新里是否还会维持当前这种默认位置,尤其是在 MiniMax 自己的编程工具文档和智能体接入页里。[2][6]

第二,继续看“自我迭代”会不会更多落在产品行为上,而并非只停在榜单和口号上。更扎实的证据会来自工具稳定度、技能复用、记忆保持,以及更少的人手配置负担。[6][7][8]

第三,继续看 Token Plan 与按量计费之间的商业分工能否维持吸引力。若工具调用更重、会话更长的智能体工作仍能留在订阅框架里,模型发布的故事就会继续往工作负载留存的方向发展。[3][4]

从表面看,MiniMax 在 3 月 18 日发布的是一款新模型。顺着公开页面往里走,会看到更清楚的一层:M2.7 正在被接成 MiniMax 当前最重要的智能体分发表面。

来源

  1. MiniMax 开放平台文档中心,《模型发布》(2026 年 3 月 18 日 MiniMax M2.7 / M2.7-highspeed 发布说明)。
  2. MiniMax 开放平台文档中心,《通过 AI 编程工具接入》(M2.7 在 Claude Code、Cursor、OpenClaw、Hermes Agent、Codex CLI 等工具中的接入指南)。
  3. MiniMax 开放平台文档中心,《Token Plan 概要》(从 Coding Plan 升级而来、M2.7 请求额度、全模态配额与超额后的切换路径)。
  4. MiniMax 开放平台文档中心,《按量计费》(MiniMax-M2.7 / M2.7-highspeed 的输入、输出与缓存价格)。
  5. MiniMax 开放平台文档中心,《OpenAI API 兼容》(M2.7 与 M2.7-highspeed 的 204,800 上下文窗口与大致输出速度)。
  6. MiniMax Agent,《MaxClaw》(官方云端 AI Agent 平台、10 秒创建、工具能力、长期记忆与 M2.7 驱动说明)。
  7. MiniMax Agent,《更新日志》(2026-04-11 MaxClaw 设置面板;2026-04-16 MaxHermes、自进化 Skills、持久记忆、定时任务与 M2.7 驱动说明)。
  8. MiniMax News,《Day 0 实现 MiniMax M2.7 六芯落地,众智FlagOS 又双叒叕让大模型多芯可用了!》(2026 年 4 月 12 日;Agent Harness、Skills、Memory、SWE-Pro、GDPval-AA 与指令遵循率等披露)。
  9. MiniMax News, "MiniMax @YCombinator Hackathon: Building the Future of Web Agents"(题图来源页)。