Home » 正确采样:避免常见的事件数据错误

正确采样:避免常见的事件数据错误

对于任何想要有效探索其海量数据的品牌来说,抽样都很重要。无论是了解产品使用情况还是衡量目标受众的参与度,样本数据都是关键。当涉及到行为分析和客户旅程分析时,找到正确的问题通常比找到正确的答案更难。

 

使用客户智能平台对数据进

行采样,可将查询响应时间缩短至几秒钟,即使 手机号码数据 涉及数十亿个事件,也能大大增强流程。品牌可以更快地探索问题,避免死胡同式的答案,并更深入地挖掘数据。典型的探索性会话始于对可能隐藏在数据中的宝贵内容的模糊想法,然后变成一系列针对正确问题的查询,然后通过将最终查询固定到仪表板来保存它。

 

其他解决方案需要采样才能大规模工

作。借助客户智能和实时分析,采样是一种有用的工具,但对于大规模快速获得结果并非必不可少。您可以实时获得 统计上准确的采样结果,优化查询,并在准备就绪时获得数千亿个事件的快速非采样结果。客户智能平台(如 Scuba)可以提取和存储所有原始事件,并可选择在查询期间进行采样。

 

让我们回顾一些关键概念:

 

抽样是从某个总体中选取一个子集的 大学如何从电子签名中受益 过程,该子集可用于准确估计整个总体的重要属性。该子集称为样本。
行为分析 侧重于各种参与者在与产品或服务交互时的行为。这些参与者可能是人、设备、传感器等。行为被跟踪为在特定时间发生的一系列事件。事件的顺序、持续时间和时间间隔都与理解行为有关。
事件数据是来自任何对产品或服务具有重要意义的事件的数据。事件描述与特定时间 的参与者相关的动作。
避免常见的事件数据错误
1. 牢记背景。

许多新应用程序与拥有数

百万用户和每个用户会话数千个事件的连接应用程序有关。许多品牌每小时都会看到数亿甚至数十亿个事件。能够从行为方面提取、存储和分析所有 避免常见的事件 这些数据需要一种专门的方法。大数据分析的通用解决方案可能在较小的规模下能够满足需求,但在大量数据下,它们被迫做出妥协,例如使用更昂贵的集群、花更长时间才能获得答案,并依靠忙碌的数据科学家将基本问题转化为代码。

2. 行为分析的吸引力在于发现有关用户和交互的新事物。

发现过程本质上是探索性的,最好以交互方式进行探索。深入研究数据并以新的方式和从不同角度看待数据,这很有吸引力。发现时间是分析解决方案的关键指标。好消息是,答案需要达到的准确度、获得更准确答案的成本以及额外的准确性为组织带来的价值之间通常存在平衡。

3. 知道何时采样以及何时不应该采样

信不信由你,采样并不总是合适的。某 赌博电子邮件列表 些数据不会均匀分布在各个分片中。有些事件非常罕见,不太可能出现在采样结果中。有时,您要查找一组很小的事件,但不确定它们何时发生。有时,选择过滤器留下的事件太少,无法准确采样。

 

对于事件数据的行为分析,采样方法有对有错。在数据收集点采样很诱人。这样做有潜在的好处:数据缩小,更容易提取,需要存储的数据更少,并且可以按原样处理而无需进一步缩减。但对于行为分析来说,这种方法很棘手,而且有局限性。

 

首先,采样的事件必须代表一

组参与者的一系列行动。它们的内容、顺序和时间都很重要。你不能只取每 100个事件。
其次,我们无法提前知道哪些参与者会引起关注。这是发现过程的一部分。此外,关注标准可能会因查询而异,并且无法提前知道。
最后,抽样可能会使收集的数据减少到无法用于 A/B 测试等重要工作流程的程度。展示修改后产品的抽样用户比例可能太小,无法得出具有统计意义的结论。

对于事件数据的行为分析,正确的方法是记录所有事件并将其作为数据集的一部分。采样需要基于来自人群的一组代表性参与者的所有事件。它需要在查询时进行,而不是在摄取期间进行。这种方法将正确采样的负担从最终用户转移到分析平台上。如果答案如此明确,为什么不是每个人都以同样的方式去做呢?

 

答案是实施:专注于事件数据的解决方案可以以通用分析解决方案无法理解的方式组织和管理数据。该组织能够高效地存储和查询大量事件数据。

使用 Scuba 无缝采样并实时分析数据

Scuba Analytics是一个实时客户智能平台,专门用 避免常见的事件 于大规模事件数据的行为分析。借助 Scuba 的无代码查询和实时分析,任何公司的团队不仅可以进行有影响力的抽样,还可以收集重要的见解。

Scroll to Top