多数分析系统迁移,起点都是一场带着烦躁的仪表盘讨论:产品团队不喜欢某个界面,市场团队想要未抽样的漏斗,合规负责人想少一点 cookie 横幅争执,工程团队想让生产页面上的神秘标签少一些。Matomo 最容易在这个时刻被误解。把它看成托管分析控制台的开源近似品,会错过重点。它更锋利的价值在于,把网站计量变成一项数据保管权决策:事件落在哪里,谁拥有原始数据,隐私规则怎样执行,以及哪些报表任务获准在你的基础设施上运行。[1][2]

这也是 Matomo 到 2026 年仍然重要的原因。项目在 2007 年以 Piwik 起步,2018 年改名为 Matomo,但长期主张没有改变:分析系统应当给站点所有者有用的行为证据,同时让他们继续掌握数据路径。[9] 代码仓库把 Matomo 描述为一个 PHP/MySQL 应用,运营方下载后安装在自己的 Web 服务器上,用 JavaScript 跟踪代码接入站点,再经由报表和 API 查询数据。[1] 本地部署页面用产品语言表达同一层意思:自托管把数据留在运营方服务器上,避开抽样限制,允许访问原始数据,并让团队决定分析数据库放在哪里。[2]

真正的实践问题并不是“Matomo 比 Google Analytics 更好用吗?”这个框架太薄。更有用的问题是:你的组织想把分析系统交给供应商拥有的事件流,还是把它作为自有子系统运行,同时承担清晰的运营成本?

封面照片来自 2012 年 New Zealand Open Source Awards,当时 Piwik 获得 Open Source Software Project 类别奖项。[10] 它放在这里很合适,因为 Matomo 今天的论点并非突然转向隐私营销。这个项目一直绑定着一种开源社会契约:你可以检查代码,托管系统,扩展系统,并把计量关系留在站点和访问者之间,而不让每一次页面浏览都变成第三方依赖。[1][9]

采用 Matomo 的基本单位是数据保管权

Matomo 的第一道采用界线很简单,也并不小:分析服务器会成为你自有应用资产的一部分。DNS、TLS、PHP 运行时、数据库容量、备份、升级、监控和访问控制,都归部署它的团队负责。对小站点来说,这可以是一笔便宜的交换。对高流量产品或公共部门门户来说,它就是一项带有事故响应预期的真实服务。

这种所有权正是重点。Matomo On-Premise 表示,自托管让组织把数据留在自己手中,选择数据存储位置,访问原始数据,并避开数据抽样。[2] 代码仓库给出了这句话背后的工程形态:Matomo 是一个服务器应用,包含跟踪端点、数据库、报表界面、插件、API、测试、安全流程和扩展钩子。[1] 也就是说,“仪表盘”是整套架构里最不值得过度关注的部分。真正有后果的部分,是事件流终止于一个你能治理的系统。

在分析系统已经变成合规和集成问题、而不只是市场问题的组织里,Matomo 的优势最明显。媒体站点会关心留存控制和原始事件。城市机构会需要流量计量,同时避免把市民行为导出到境外云平台。SaaS 公司会希望保留产品分析能力,同时守住合同中的数据位置承诺。Projets Libres 对 Matthieu Aubry 和 Laurent Destailleur 的独立访谈也给出了有用的脉络:流量计量从服务器日志分析转向 JavaScript 标签,使用者也从系统管理员扩展到市场人员、数据专家和产品负责人。[8]

限制也同样清楚。团队如果没有意愿拥有运行时,Matomo 的本地部署优势就会变成运营负担。维护不良的分析服务器会比托管工具更糟:补丁陈旧、备份薄弱、归档缓慢、隐私设置半懂不懂,都会制造一种掌握控制权的表象,却没有相应纪律。只有在数据保管权值得投入运营时,Matomo 才是一个好的开源选择。

跟踪层是可编程接口

Matomo 的 JavaScript tracker 不只是贴到页面上的信标。API 参考文档展现了它的操作质地:页面浏览、电子商务浏览、购物车更新、订单、同意管理和归因控制,全都位于显式调用之后。[3] 这一点很重要,因为真实分析系统出错,常常源于把“已安装跟踪”当成二元状态。真正费力的工作在于决定哪些动作值得计量,哪些标识符获准使用,何时由同意状态拦住跟踪,以及营销归因怎样跨越 referrer、campaign 参数和产品表面。

tracker API 的同意方法就是一个有用例子。Matomo 文档描述了一种模式:在记录用户同意之前不发生跟踪;另有一个单独方法用来标记同意已经给出。[3] 它本身不能解决隐私法律问题。它给工程团队一个具体接口,让隐私状态进入应用流程,而不是把 cookie 横幅作为漂浮在计量层之上的装饰。

近期 tracker 变化也指向同一方向。Matomo 5.12 开发者文档包含新的 campaign 归因控制,可忽略选定来源,同时保留被跟踪 URL 或请求中匹配的 campaign 参数。[3] 团队是否使用这个具体功能,影响并不在这里;重要信号在于,分析准确性越来越依赖采集边缘的规则。来源归因、referrer 过滤、电子商务标识符和同意状态,属于应用语义,不只是界面偏好。

采用时的常见错误,是让每个团队各自发明这些语义。更强的 Matomo 推出方式,应当从一份跟踪契约开始:批准的事件名称、标识符政策、同意行为、电子商务订单规则、campaign 命名,以及修改跟踪片段的责任归属。Matomo 给你接口。治理仍要由组织自己建立。

报表在成为洞察之前,先是批处理任务

Matomo 还迫使一个有用事实浮出水面,而托管分析产品常常把它藏起来:报表是计算出来的。开发者指南解释说,归档数据默认按需计算并缓存,但对高流量站点来说,按需归档成本太高,应转移到以 core:archive 执行的定时 CLI 工作里,通常借助 cron 完成。[4] 同一份指南还说,如果一个站点每天超过 500 次页面浏览,运行在较慢服务器上,或使用时感觉迟缓,就应关闭浏览器归档,并设置 CLI 归档。[4]

这个细节会改变采用讨论。Matomo 部署不只是一个 Web 应用加一个数据库。它是一条报表流水线。原始访问和操作进入系统;归档任务按站点、周期和 segment 聚合它们;插件定义归档逻辑;指标和序列化报表表格被持久化,供后续 API 和界面访问。[4] 如果这些任务落后,症状看上去像仪表盘问题,原因却在运营侧:cron 频率、数据库争用、流量形态、segment 复杂度、插件行为和硬件预算。

Matomo 的插件架构在这里既是优势,也是风险。API 指南指出,公共插件 API 允许扩展定义新的报表、widget、跟踪数据、设置和存储行为。[5] 当分析系统必须贴合产品领域时,这正是团队想要的扩展能力。但任何增加报表或归档工作的扩展,也会进入运营范围。对小站点来说,这一点不显眼。对大型安装来说,插件不只是功能。它们也是定时计算。

实际推出时,一个可靠做法是先保留最小且有用的报表表面,等归档任务拥有足够余量后再扩展。观察 core:archive 持续时间、数据库增长、慢查询,以及原始跟踪延迟和报表可用性之间的差距。Matomo 可以给团队比托管黑箱更多的所有权,同时也会拿走“分析计算没有成本”这种令人安心的幻觉。

隐私控制需要产品所有权

Matomo 的隐私叙述,在被当作配置系统处理时最有力量,而不是停留在口号上。隐私设置指南表示,Matomo 把分析数据存入运营方自己的 MySQL 数据库,默认不把日志或报表数据发送到其他服务器,并包含 IP 掩码、原始数据删除、退出机制、Do Not Track 以及相关设置的控制项。[7] 这些都是具体机制。它们仍然需要由承担责任的人选择、记录并复核。

CNIL 合规功能显示了项目怎样把隐私从文档推入产品流程。Matomo 的 CNIL 指南描述了位于 Administration > Privacy > Compliance 下的合规检查、一个可在条件允许时强制执行设置的站点级模式,以及一张把条目分为 compliant、non-compliant 和 unknown 的自评表。[6] 它也提醒说,部分要求仍然需要人工复核,尤其在 Matomo 无法知道外部同意工具或自定义参数如何工作的地方。[6]

这个提醒并不是弱点。它正好划出了正确界线。没有任何分析工具能自行知道你的自定义维度是否泄露设备字符串,你的事件是否超出允许目的,或你的同意管理平台是否正确接入站点。Matomo 可以降低配置负担;它不能替代产品团队对计量内容承担所有权。

最新稳定发布流进一步说明,运营方必须持续维护系统。Matomo 5.11.2 于 2026 年 6 月 17 日发布,是一个聚焦安全修复的补丁版本,并建议尽快升级。[11] 对托管分析供应商来说,补丁紧迫性大多被客户看不见。对自有 Matomo 安装来说,安全修复同时属于价值主张和责任范围。你得到数据保管权,也得到补丁窗口。

Matomo 适合哪里

当三个条件同时成立时,Matomo 很适合。第一,组织确实有理由拥有分析数据,而不只是从审美上讨厌某个托管仪表盘。第二,工程团队能运行 PHP/MySQL 服务,安排归档任务,备份数据库,并测试升级。第三,产品、市场和隐私相关方能在实现扩散到多个站点之前,就跟踪契约达成一致。

当团队想要零运营仪表盘、没有清晰的数据留存政策,或打算把自托管当作绕过隐私复核的捷径时,Matomo 的匹配度较低。在这些环境里,Matomo 会变成影子分析平台:技术上开放,组织上无人管理。

这个项目最有价值的用法更严肃。把 Matomo 当成自有计量子系统。让 tracker 保持可编程,让隐私设置保持明确,让归档任务保持可见,并把报表表面收窄到可以运营的范围内。随后,开源优势才会变得具体:分析系统不再是租来的数据流。它成为一个可以推理、扩展和治理的系统。

来源

  1. Matomo GitHub repository README - 项目描述、自托管 PHP/MySQL 安装模型、要求、API、插件、测试和安全流程。
  2. Matomo, "Matomo On-Premise" - 自托管、数据所有权、原始数据访问、存储位置控制、API 灵活性和本地部署定位。
  3. Matomo Developer Docs, "JavaScript Tracking Client: API Reference" - 跟踪方法、电子商务调用、同意管理和 campaign 归因控制。
  4. Matomo Developer Docs, "The archiving process" - 按需归档、CLI 预归档、core:archive、插件归档器和报表聚合机制。
  5. Matomo Developer Docs, "Matomo APIs" - 公共插件 API 在报表、widget、跟踪数据、设置、存储和扩展行为上的范围。
  6. Matomo FAQ, "Configure Matomo Analytics to comply with CNIL consent exemption" - 合规检查流程、强制合规模式、自评表和人工复核限制。
  7. Matomo FAQ, "Configure Privacy Settings in Matomo" - 数据控制主张、数据库存储、IP 掩码/匿名化、退出机制和隐私配置指南。
  8. Projets Libres, "Measuring Web Traffic - Matomo - M.Aubry, L.Destailleur," January 1, 2025 - 关于 Matomo 起源、流量计量方法、用户、社区和商业模式的独立访谈/文字稿。
  9. Matomo, "The history of a privacy-friendly web analytics platform" - Piwik 起源、2018 年 Matomo 改名、使命、使用里程碑和项目时间线。
  10. Wikimedia Commons, "Matthieu Aubry - Piwik (8184622809).jpg" - 本文图片所用的真实 2012 年 New Zealand Open Source Awards 照片。
  11. Matomo, "Matomo 5.11.2" changelog, June 17, 2026 - 写作时最新稳定补丁版本说明及安全修复背景。