截至 2026-04-10 UTC,回看 Kimi AI 这支时长 40 秒 的短片 《Meet Kimi Agentic Slides!》,最值得先换掉的一种看法,是别把它当成又一条“AI 帮你做出更漂亮 PPT”的通用广告。[1] 官方视频说明其实已经写得更具体。它强调 agentic search、把 PDF、图片和文档变成 slides、提供 designer-level visuals,同时强调结果仍然 fully editable,并支持 PPTX export。[1] 对应的产品页也把同一件事说得更清楚。Kimi Slides 并非一个没有分层的魔法输入框;页面直接把 AdaptiveVisual 两种模式分开,其中 Adaptive 对应 30-60 分钟deep researchstructured delivery,而 Visual 对应 5-10 分钟Nano Banana Pro 的视觉加速。[2] 真正值得重看的,正是这个拆分。

这支短片之所以适合放进 ai-china,是因为它把 Moonshot 更大的产品逻辑压缩成了一条很短的工作流。先有资料,再生成 deck,接着展示 deck 仍然可编辑,最后再给出一条更快的视觉模式,使视觉处理保持独立,不去覆盖研究链路。[1][2] 从这个层面展开,这支视频真正想说服观众的,已经越过“做出更漂亮幻灯片”这一层,转向一条更完整的产品叙事:Moonshot 能把研究、文件、综合整理、版式组织、后续编辑与导出,全部路由到同一个 slide 表面上。

只要把其他官方页面放到视频旁边,这个判断就会更扎实。Kimi Docs 被写成一套 AI document agent,能够生成 Word 和 PDF,并支持修订、批注、插图与封面设计等正式文档场景。[3] Kimi Agent Swarm 则被写成一套可生成最多 100 个 sub-agents 的多代理系统,用来并行完成研究与文档综合。[4] 因而,Slides 这支短片看起来就不像一条孤立的功能秀,而更像同一家产品族谱里的又一个工作产物出口。顺着视频与书面来源一起看,我的判断是,Moonshot 正在试图让“slides”被理解成一个把上游研究与资料处理转化为可交付成果的工作表面,而不只是视觉包装的附属层。[1][2][3][4]

配图说明:题图使用 Moonshot AI 开放平台博客中 AWS 中国峰会展台的真实照片。这里适合用这张图,因为这支短片从头到尾都在讲包装与分发。它并没有停在单个 benchmark 结论或某一页漂亮视觉上,而是在推销一个入口,在这里,资料、可编辑输出与导出被组织为同一个产品表面。[5]

开头那一下真正立起来的是资料路由,并非设计

这支视频开头几秒很关键,因为它并非从一份已经做好的 keynote 成品开始的。[1] 画面先把一组资料围绕在 "Kimi Agentic Slides" 标题周围,随后闪出一页标题为 "Introducing Kimi K2 Thinking" 的文档,再把这份资料转成一页已经排版好的幻灯片。[1] 即便没有旁白,这个顺序本身也已经教给观众一套工作流语法:先有研究材料,再有演示对象。视频真正要求观众理解的,是幻灯片生成其实是一层叠在资料之上的转换器。

这一点很重要,因为很多 slide demo 仍然在把自己包装成“输入一句 prompt,再选一个风格”的魔法生成器。Kimi 自己的产品页并不这样说。页面把 Adaptive 模式直接和 deep researchstructured delivery 绑在一起,这意味着 deck 的任务并不只是装饰,而是整理和编排材料。[2] 视频开头这一段和这套产品描述咬得很紧。我更倾向于把 Moonshot 的用意理解成:不要把它看成“从零做 slides”,而要把它看成把证据、文件和已有工作路由进演示形态。[1][2]

视频中段真正拿出来做证明的,是“可编辑”而并非“好看”

整支短片最强的一刻,是它不再只展示生成后的页面,而是把观众带进 slide editor 本身。[1] 其中一帧很明确地把产物放进一个带有字体控制和文本块的编辑界面,而并非把 deck 当成已经压扁的静态渲染来展示。这是一个很有策略意味的选择。因为如果结果只是几张好看的幻灯片截图,用户仍然需要去别的工具里把它们重建一遍。把“可编辑”摆到镜头前,实际上是在卖一种可以被交接和继续加工的工作产物。

这时候,Kimi Docs 页面反而变得很有参考价值。那一页讲的是一套面向修订、批注和正式交付场景的 document agent,并不只是“AI 写了一份看起来不错的文档”。[3] Slides 这支短片看起来正在借用同样的逻辑。只有当产物在生成之后仍然可被操控,它才真正适合进入工作流程。因此,视频用编辑界面给出一层保证,官方说明又进一步把 PPTX export 直接写了出来。[1] 这比“视觉效果很好”更像一条商业承诺。它说明 Moonshot 很清楚,只有当 slide generation 能跨过 demo 输出与常规办公软件之间的边界,它才会变成一条更耐用的产品线。

最后一转揭示了为什么 Moonshot 要把研究和视觉样式拆开

只要把视频结尾和 Slides 产品页放在一起看,这条广告就不会再落回“AI 帮你做得更好看”这一类普通营销片的叙述框架。[1][2] 页面明确把 AdaptiveVisual 区分开。Adaptive 更慢,绑定的是研究与结构;Visual 更快,绑定的是 Nano Banana Pro 的视觉加速。[2] 这个拆分很值得重看,因为它实际上承认了这里存在两类不同的工作。一类工作负责搜集证据、消化资料、搭建 deck 的骨架;另一类工作负责更快地做视觉润色。

这条区分也和 Moonshot 更大的产品栈是一致的。Kimi Agent Swarm 被定义成一套可规模化并行研究、综合整理与多视角分析的系统。[4] Kimi Docs 则把同样的上游能力转成正式文档。[3] 按这个角度看,Kimi Slides 就成了演示输出端:先把材料组织好,再决定任务需要多少视觉加速。[2][3][4] 因而,这支短片真正推销的,并不只是 Nano Banana Pro 的风格效果。它是在压缩地证明,Moonshot 可以把思考层视觉层拆开,同时又不逼用户离开这套产品。

当然,这里仍有清楚的边界。一支 40 秒的短片,不能证明团队已经会持续依赖 Kimi Slides 来做商业演示、融资 deck 或内部评审材料。它最多只能展示产品想要用户接受的工作语法。但这套语法本身已经很有信息量。Moonshot 正在把 slides 营销成一个路由型输出表面,在这里,搜索、文件、结构、可编辑性和导出被视为一件连起来的事。[1][2] 对 ai-china 来说,这才是这支短片更重要的地方。它真正的竞争性表述落在执行栈层面:Moonshot 想把演示生成放进与 research agents、document agents 同一条执行栈里,并把视觉加速明确处理成另一种模式,不把它误当成整个产品本身。[1][2][3][4]

来源

  1. Kimi AI,《Meet Kimi Agentic Slides!》,官方 YouTube 视频,发布于 2025 年 11 月 28 日。
  2. Kimi,《Kimi Slides | Best AI presentation creator》,产品页中关于 Adaptive 与 Visual 两种模式的说明。
  3. Kimi,《Kimi Docs | Expert AI Document Agent》,关于文档代理、文件输出与修订能力的产品描述。
  4. Kimi,《Kimi Agent Swarm: 100 Sub-Agents at Scale》,关于并行研究与文档综合的官方介绍。
  5. Moonshot AI 开放平台博客,《Kimi 大模型 API 更新了,也期待在「亚马逊云科技中国峰会」见到大家 | 开发者速递》,本文所用展台照片的来源页。