把时间锚定在 2026-04-18 UTC,理解 iFlytek 的办公向 AI 动作,较稳的入口并不在“又一个通用助手”这一层。更值得看的是一条更窄、也更结实的工作流:先把语音收进来,在混合语种里保持可用,再把结果变成可交付的文本,并让这份文本继续停留在同一套办公栈里,长成纪要、待办或初稿。[1][2][3]

顺着 iFlytek 的官方产品页与 2025 年几轮公开发布往下读,较清楚的判断是,这家公司在 ai-china 里更可输出的楔子,落在这条语言优先的办公闭环上。起点是多语种会议采集,中间经过识别与翻译,再进入纪要生成与写作层,最后又被硬件与私有化部署选项托住,而并非散落成一个抽象聊天框。[1][2][3][4][5][6] 这比“iFlytek 拥有最强办公 AI”要窄,也更站得住,因为公开材料反复在写同一条链:从录音进入,从整理出去,再继续向后生成文本。

图片说明:题图采用 iFlytek 在香港发布 AI 办公产品时的真实现场照片。它适合本文,因为文章讨论的并非看不见的模型分数,而是一块可以直接看见的工作流表面:多语种会议系统与智慧办公 SaaS 平台被并排摆在一起。[3]

这条工作流的起点,是混合语种采集,而并非聊天提示词

最强的证据来自 2025 年 6 月 24 日 的香港发布材料。iFlytek 在那里并没有把办公故事讲成一个悬浮助手,而是直接发布了面向港澳环境的 讯飞听见多语种会议系统,并把目标场景写得很实:粤语、普通话、英语混杂出现,会议记录需要快速成稿,机构又对安全、部署边界和本地治理有明确要求。[3] 官方文章写明,这套系统支持多语种识别与翻译,不用手动切换语言,可自动生成会议纪要,并提供云端与离线两类方案,适合数据治理要求较高的机构场景。[3]

这一点很关键,因为许多办公 AI 方案最容易断裂的地方,正是混合语种采集。单语助手演示并不难,难的是会议里语言来回切换时,专有名词还能不能保住,后续文本还能不能继续被审阅、归档、公开。iFlytek 公开材料持续盯住的,正是这个边界。[2][3]

香港这次落地也让论点从假设环境转成了实际运行环境。公司写到,自 2022 年 起投入使用的香港立法会智慧誊录系统,在三语环境里实现了 96% 的转写准确率,誊录效率提升 2 倍以上,摘要整理效率提升 10 倍,信息公开效率提升约 4 倍。[3] 这些数字来自公司披露,更适合作为产品侧证据,而并非独立审计结论。即便如此,它们已经足够说明 iFlytek 想让市场看到什么:并非一个会聊天的外壳,而是一条在多语压力下仍然能工作的办公室文本加工链。[3]

系统真正要做的,是把语音变成可治理的文本

产品页把下一步写得更清楚。讯飞听见 首页列出的并非一组分散模型能力,而是一整套围绕办公室展开的链条:录音转文字AI 写作多语种同传翻译以及企业服务,用户故事也反复落在会议记录、访谈整理、摘要生成与初稿输出这类动作上。[1] 这个组织方式很重要。它不像一个前沿模型排行榜,更像一个办公流水线入口。

专门的智能会议系统页面把这层操作性写得更细。iFlytek 说,这套系统可以同时处理中英文转写中英文互译会议记录成稿,适用于离线或私有云场景;页面给出的指标包括普通话转写准确率 97%、native 英文转写准确率 93%、中英互译 BLEU >= 43,以及实时转写平均速度 <= 500ms。[2] 页面列出的能力也更像机构办公,而并非消费聊天:声纹角色分离中英文混合识别智能语义分段会议记录智能摘要、用户管理分析等。[2]

由此就能看见重心所在。iFlytek 不只是在争取把语音听准,它更在争取把会议语言变成一种可治理的办公室文本:谁说了什么,哪些内容重要,哪些段落可以归纳,哪些内容可以继续流向下一份文档状态。[1][2]

硬件之所以重要,是因为它把闭环贴回真实工作表面

如果故事只停在 SaaS,这条闭环会薄很多。iFlytek 的公开材料显示,公司希望这条办公链继续挂在硬件表面上。MWC 2025 的官方回顾里,iFlytek 重点提到其智能办公本,说它支持 14 种语言实时转录,可以通过音频录制与电子笔书写准确记录会议内容,并支持包括中、英、日、韩在内 7 种语言即时互译。[4]

更新一些的 AINOTE 2 产品页并没有改变这个方向,反而把这条链再拉长了一截。iFlytek 写到,这款设备提供 AI 生成会议摘要16 种语言语音采集、11 种语言实时翻译、133 种语言手写转文字、日历同步,以及基于 AWS 的云端隐私保护能力。[6] 这些信息一部分来自全球产品页,带有消费硬件的展示色彩,但它们仍然暴露出同一种产品直觉:办公 AI 不该只存在于浏览器标签页里,它还应该落在能采集语音、保存笔记、转换手写、继续跟进会后工作的设备上。[6]

这一层,正是“可输出”的关键。硬件加 SaaS 的工作流,可以进入那些不愿把全部流程重写成单一聊天界面的组织。它给 iFlytek 留下了不止一个入口:会议室系统、个人记事设备、转写软件、翻译服务与私有部署方案。[2][3][4][6]

这里的规模,更像工作流密度,而并非用户数字本身

2025 年 4 月 29 日 的翻译协会年会报道,把生态层写得更直接。那篇文章里,iFlytek 说其智慧办公 SaaS 平台已为 8500 万用户提供服务,并把智能记录多语翻译AI 写作接成一个产品生态;同传系统则已服务 50 多个国家的国际会议。[5] 这些同样属于公司披露,更适合用来理解产品自我定位,而并非当成中立市场份额。即便如此,它仍然能说明 iFlytek 如何理解自己的办公业务:并非一个单点软件 SKU,而是一整片语言服务环境。[5]

这在 ai-china 里很重要,因为许多公司仍然习惯用一个助手前端来讲自己的办公故事。iFlytek 的公开材料则更像另一种叙述。会议室、转写引擎、写作层、翻译层与记事硬件彼此相扣。[1][2][4][5][6] 组织只要采用其中一层,iFlytek 就有入口;一旦采用多层,切换成本就会上升,因为真正的产品不再只是软件本身,而是这条工作流。

为什么这条用例比“通用助手”更有力

这条办公用例最强的地方,出现在三个条件同时成立的时候:

  1. 语音流入速度快过人工打字;
  2. 房间里不止一种语言或表达体系;
  3. 真正有价值的并非转录本身,而是转录之后继续长出来的纪要、待办、摘要或草稿。[1][2][3][4][5][6]

这也解释了,为什么香港发布如此关键。它把整篇文章的论点压缩进一个难度很高的环境里:三语并行、公共机构记录、摘要整理、部署与安全边界同时存在。[3] 能在这里建立能力的公司,提出的是一个比“我们的助手可以与你的文档对话”更具体的命题。它真正提出的是:语言负担很重的办公室工作,可以被端到端地操作化。

判断边界也很清楚。以上这些页面并不能证明 iFlytek 已经覆盖全部办公室工作流,也不能证明它的助手层会统治更广泛的企业 AI。公开证据更强的部分,落在采集到文本,再到成稿的连续性上,而不在开放式自主行动上。这个限制反而有用,因为它让论点更紧。iFlytek 更可输出的楔子,并非办公室里的 AGI,而是一块把混乱会议变成可用机构文本的语言优先工作流表面。

来源

  1. 讯飞听见官网首页(AI 语音记录助手、AI 写作、多语种同传、翻译,以及围绕办公工作流组织的产品与用户场景)。
  2. 讯飞听见,《智能会议系统|离线会议系统|私有云转写翻译》(中英文转写与互译、会议记录成稿、声纹角色分离、智能摘要、私有云部署,以及页面列出的准确率与时延指标)。
  3. 讯飞听见,《科大讯飞智慧办公系列产品落地香港 开启AI办公新纪元》(2025 年 6 月 25 日;香港发布、多语办公环境、96% 转写准确率、效率提升数据、多语种会议系统与智慧办公 SaaS 落地)。
  4. 科大讯飞,《科大讯飞携多款AI应用产品亮相世界移动通信大会》(2025 年 3 月 6 日;智能办公本、14 种语言实时转录,以及 7 种语言即时互译)。
  5. 科大讯飞,《2025中国翻译协会年会召开,科大讯飞获"译研工程"首批基地授牌》(2025 年 4 月 29 日;8500 万智慧办公 SaaS 用户、智能记录、多语翻译与 AI 写作生态)。
  6. iFlytek, "AINOTE 2" product page(AI 生成会议摘要、16 种语言转录、11 种语言实时翻译、133 种语言手写转文字,以及云端隐私能力)。