数据治理在数字分析中的重要性

已发表: 2023-04-17

在数字分析中,组织花费大量时间收集、解释和报告数据。 总体目标是利用数据作为竞争优势。 您可以使用数据来提高数字广告效果或改进数字产品。 但在您可以利用您的数据之前,您需要确保您拥有正确的数据。 根据不准确的数据做出决策并不比根据没有数据做出决策好多少。 人们很容易忽视良好数据治理的重要性。 数据治理通常被视为一项可以取消优先级的艰巨任务,但这是一个错误。 在这篇文章中,我将概述一些对数字分析的长期成功至关重要的数据治理功能。

数据治理超越了最初的实施

拥有好的数字分析数据的最好方法是有一个好的实施。 组织花在计划和实施数字分析事件和属性上的时间对于获得可靠的数据至关重要。 在最初的实施过程中,通常会出现几个质量保证和测试级别,以验证数据质量。 但在最初实施之后,许多组织发现他们的数字分析数据质量下降了。 数据质量下降通常是由于需要更多的数据治理。 虽然初始部署在组织内可能很引人注目,但数据治理就不那么迷人了。 尽管实施和数据治理具有良好数据质量的相同目标,但许多组织更多地关注前者而不是后者。

组织在数据治理方面做得不好的原因之一是他们使用的数字分析产品没有在数据治理功能方面投入足够的资金。 市场上许多领先的数字分析产品都缺乏基本的数据治理功能。 缺乏治理功能是一种耻辱,因为数据治理支撑着与数字分析程序相关的一切。

实施方案设计

了解您在数字分析实施中收集的数据至关重要。 简单地识别和传达您的组织选择收集的事件和属性是筹码。 不幸的是,许多数字分析供应商使用电子表格来共享分析解决方案中的内容。 在电子表格中跟踪实施解决方案具有以下缺点:

  • 信息与数字分析产品和报告分离
  • 解决方案设计的多个版本可能遍布整个组织,因此很难知道哪个是当前版本
  • 电子表格无法告诉您每个解决方案设计元素的状态(例如,它当前是否在收集数据?)

最好将所有解决方案信息直接放在数字分析产品界面中,以便您始终可以查看最新信息:

事件

如果多个人可以迭代解决方案设计,甚至可能同时迭代,这也是有益的。 理想情况下,您可以像使用 GitHub 一样通过“分支”管理解决方案设计迭代:

分支

数据模式验证

数据治理的另一个关键方面是数据模式验证。 模式验证的一个组成部分是自动验证,它确保收集的数据符合预期。 这很重要,因为数字分析团队成员通常很忙,没有时间主动监控何时将新事件或属性发送到实施。 跟踪意外事件最好由了解解决方案设计的数字分析产品处理。 自动化允许数字分析产品在发现意外事件或属性时提醒团队。 这些意外的项目在被审查之前被隔离,这样它们就不会污染生产数据:

意外

数据模式验证的另一个功能是能够验证收集的数据值是否符合预期格式。 例如,如果您有一个数据属性,它本来是一个数字,但传递的是一个文本字符串,那么它应该被自动标记。 如果您有必须遵循的特定邮政编码格式,则应验证每个值以确保数据一致。 关于数据模式验证,“一分预防胜于一分治疗!”

属性模式

客体主持

当您组织中的人员使用您的数字分析产品时,要知道哪些分析组件是正确的而哪些是错误的可能具有挑战性。 用户通常会创建新的同类群组、指标等来进行尝试,但实施所有者尚未验证它们。

对象授权是在实施中将数字分析对象标记为“官方”的过程。 如下所示,可以为对象分配一些指示符(例如,蓝色勾号)以表示具有适当证书的人已经批准了该对象。 官方对象可以被信任并被认为是正确的。

正式仪式

对象管理消除了选择数字分析组件时的猜测,并有助于避免不同用户在报告和仪表盘中散布非官方对象。

对象去重

对象重复数据删除与对象授权无关。 数字分析最烦人的方面之一是同一分析对象的多个版本激增。 这些对象可能是计算出的指标、群组等。虽然对象授权可以帮助最小化这种情况,但分析用户通常仍然可以创建多个版本的分析对象。 这些不同的版本可以与多个报告或仪表板相关联。 当在分析对象的定义或公式中发现缺陷时,这个问题会加剧。 组织必须找到所有不同的版本并分别修复每个版本,而不是在一个地方修复它,这可能是一场治理噩梦!

高级分析产品(如 Amplitude!)直接解决了这个重复数据删除问题。 避免重复数据删除的最佳方法是防止用户创建重复对象。 如下所示,如果用户试图创建一个完全相同的副本,数字分析产品将禁止他们保存它。

重复数据删除

对象用法

实施数字分析的组织通常实施许多不同的事件和属性。 每个团队都有他们想要收集的额外数据。 当您有很多数据点时,了解哪些数据元素使用最多或最少可能会让人不知所措。 许多数字分析产品通过混淆对象的使用使情况变得更糟。 在一些数字分析产品中,了解哪些对象被使用、在何处以及由谁使用,需要管理员通过 CSV 下载使用数据并创建报告。

现代数字分析产品可以轻松了解每个数字分析事件或属性的使用位置,如下所示:

事件使用

此信息还应该在更详细的级别上可见,以查看使用事件或属性的特定人员和对象:

全事件使用

掌握此信息后,实施管理员和经理可以:

  • 查看用户参与的事件和属性分析
  • 确定某些事件和属性是否由于缺乏使用而需要额外培训
  • 考虑删除不再需要的事件和属性

了解分析事件

数字分析实施中的一个常见问题是临时最终用户并不完全确定每个分析事件的含义。 开发人员因创建难以理解的事件名称(例如,form_reaction)而臭名昭著。 许多分析用户没有参与实施过程,也不知道分析事件的命名方式和原因。 因此,非常感谢管理员或经理可以做的任何事情来帮助最终用户确保他们使用正确的事件进行分析。

解决这个问题的一种方法是创建数据字典。 用户可以在这里了解每个分析事件并查看它在网站或移动应用程序中的位置。 数据字典可以存储在文档或共享空间(如 Confluence 或 Miro)中。

在 Amplitude,我们提供两种有趣的方式来传达有关您的实施及其事件和属性的信息。 一种是通过我们的笔记本功能。 Amplitude Notebooks 是自由形式的画布,您可以在其中添加文本、图像、视频、分析报告等。Notebooks 是记录您的实施和共享分析事件和属性的上下文的好地方。

笔记本

Amplitude 帮助管理员共享实施事件信息的另一种方式是通过事件截图。 管理员可以将屏幕截图附加到 Amplitude 的数据模块中的事件。 将分析事件设置位置的屏幕截图附加到每个事件将使最终用户能够在报告创建期间滚动浏览各种事件时看到该屏幕截图。 这些屏幕截图帮助最终用户建立信心,使用正确的事件进行分析。

活动截图

数据转换

无论您多么努力,有时都会将不正确的数据发送到您的数字分析产品。 开发人员可能会更改触发错误数据发送的网站或应用程序。 客户可能会在表单字段中输入不正确的信息。 用户可以刷新页面并创建重复数据。 不管它是如何发生的,都会收集到不准确的数据。 前面的一些模式验证项可以帮助减少不良数据。 不过,如果需要,您的数字分析产品应该能够修改/更新/转换数据。

一些数字分析产品不提供转换数据的方法,需要您在数据仓库中进行更改。 这没有帮助,因为最终用户可能会在数据不正确的地方使用数字分析产品界面。 如果需要,管理员应该可以选择转换数据。 您应该在数字分析提供商中寻找以下数据转换功能。

数值修改

如果需要,管理员应该能够更改特定的属性值。 例如,想象一下发送到分析产品的营销活动代码没有所需的命名约定。 管理员应该能够修改这些值,以便最终用户在使用报告和仪表板时看到正确的值。

转换值

除了一次性更改值外,管理员还应该能够创建一次修改多个值的规则。 这些规则可以使用公式或函数将更改应用于所有受影响的属性值。

变换规则

数据混淆

另一个所需的数据转换功能是隐藏或混淆不正确数据的能力。 有时需要修复部分数据,而您想对用户隐藏它们。 一个例子可能是意外发送到生产环境的测试数据。 此数据不会被删除,但对所有用户都是隐藏的。

DropFilter

数据删除

在极端情况下,您将拥有想要完全删除的分析数据。 因此,您的数字分析产品应该使您能够选择数据的特定部分并将其删除。

块过滤器

自动化数据测试

另一个关键的数据治理工具是自动化测试。 市场上有一些产品可以检查您的网站或应用程序,以确保分析代码正常运行。 这些产品还可以配置为像客户一样行事,并验证您的分析跟踪是否按设计工作。 该领域的热门产品包括 Observepoint 和 QA2L。 解释这些产品的高级功能需要一整篇博文,因此我鼓励您检查它们并考虑将它们添加到您的数字分析堆栈中。

用户数据隐私合规

数据治理的另一个方面是尊重用户隐私删除请求。 GDPR 和 CCPA 等隐私法规为消费者提供了请求删除收集到的关于他们的数据的能力。 因此,数字分析团队必须按照当地管理法规的规定对这些请求做出响应并采取行动,这一点至关重要。

概括

如您所见,关于数据治理的内容远不止这些。 确保您的数字分析数据准确需要大量的主动工作。 不同的数字分析提供商在数据治理方面提供不同程度的帮助。 由于所有分析都依赖于质量数据,因此需要考虑供应商提供的数据治理功能。