本文探讨了身份识别在数据驱动的市场营销中的重要性,分析了实现有效身份识别所需的能力和市场上不同解决方案的优缺点。
对于使用数据驱动的市场营销团队来说,构建一个统一的客户视图是实现个性化营销的关键——这对其提升转化率、提供卓越用户体验和提高客户生命周期价值具有重要意义。
随着数据平台的成熟(数据 ingestion变得更容易),利用现有数据资产从数据仓库中提取并整合数据将变得更加有价值,并为更强大的基础、更丰富的见解和更有效的激活奠定基础。然而,要对客户有一个清晰的“全维度”视图(即使是初级水平),需要远不止于将数据导入云平台——即使一些可组合的CDP工具声称这是“foregone conclusion”。此时,身份识别(IDR)就显得尤为重要。
身份识别是什么?
身份识别(IDR)通过解决唯一识别客户的问题,并将客户的各项行为和相关数据联系起来,为个性化推荐、创建真正全渠道体验、减少潜在流失并增加客户生命周期价值提供了解决方案。以下是几个示例:
- 你如何识别一个经常访问你的网站但从未购买过任何东西(且不登录)的客户?向他们发送个性化优惠券。
- 如果你可以将网站、销售工具和移动应用中的所有工具联系在一起,是否会向用户发送与网站浏览活动相关的应用程序内通知?
- 发送激励高 engagement 用户订阅优惠 offer 的额外价值是什么?
尽管身份识别对提升客户体验至关重要,但使用数据仓库进行客户数据整合以有效实现身份识别仍然是公司面临的主要挑战。这会削弱公司提高客户细分、增强个性化、减少流失并衡量客户生命周期价值的能力。
实现身份识别所需的能力
在深入探讨各种解决方案之前,请先理解以下能力对于实现有效身份识别至关重要:
数据基础设施和数据导入
数据必须能够无缝导入来自多个来源的数据仓库(DWH)。我们假设你已经具备将这些工具集成到现有云平台中的能力,或者至少有工具可以与 iPaaS 或/或现代 ETL 工具集成。如果你更高级,可能需要考虑使用像 Metarouter 或 Snowplow 这样的工具进行实时数据导入。
确定性匹配
基于精确标识符(如电子邮件地址)的匹配方法是最基本的“规则”基身份识别方法。这是“规则”基身份识别方法的最低要求。
概率性匹配
基于规则的方法在客户数据不干净或不完整、或从大量标识符中进行匹配时效果不佳。此时,通常需要使用统计方法来将记录与高概率相关联为同一客户。根据具体应用和准确性需求,你可以调整概率性匹配的确定性水平。
身份图
随着数据变得更为复杂,身份图(Identity Graph)的引入将有助于构建一个结构化的表示,以捕捉所有潜在的客户标识符(例如:电子邮件地址、电话号码、用户 ID、设备 ID 和 cookie ID 等),从而确保你能够全面捕捉到客户的全维度视图。
持续标识器
随着你与互联网、CRM、营销工具、社交媒体、移动应用等之间的集成系统数量增加,客户标识符的数量也会增加。创建或利用一个已有的持续标识器将有助于确保你在各个渠道和领域中保持一致性。
参考数据和增强
假设你的数据存储在云平台中,你很可能已经拥有一个数据 marketplace,提供来自众多供应商的丰富数据集,这些数据可以用于对客户资料进行增强,从而提供更多完整的见解。
手动干预
即使具备上述能力,最终结果仍需进行审查,并根据需要进行调整以防止错误匹配或不必要的排除。这仍然是身份识别过程中不可或缺的一部分。
各类身份识别提供者概览
市场上的选项令人困惑,且各解决方案之间差异很大。各个玩家采用不同的方法来应对将客户数据统一和识别化的问题。以下是对主要解决方案的概述:
云服务中的“实体分辨率框架”
像 Google Cloud 和 AWS 这样的云服务提供商提供了内置的身份识别框架(entity resolution frameworks),但它们被称为“身份识别”是不准确的。将它们视为为DIY或通过第三方管理身份识别工具(例如 LiveRamp 或 Experian,这些公司仍然手动进行匹配和发送结果,有时需要数天时间)是有道理的。
可组合的CDP
像 Hightouch、Census、Rudderstack 和 Growthloop 这样的“可组合”CDP 和数据激活工具是仓库本体的 CDP 解决方案。它们目前主要集中在匹配和合并过程或去重上,难以处理 cookie ID、IP 地址或设备 ID 等未知到已知的转换,这使得对未登录网站访客进行个性化推荐变得更具挑战性。
企业 MDM 解决方案
Tamr、Reltio 和 Informatica 提供了全面的身份管理(Master Data Management, MDM)解决方案,这些解决方案在身份识别方面表现出了极高的精度和友好的用户界面。然而,它们通常成本高昂,并且专为regulated industries设计,处理水平较高的计算任务。
开源工具
为了填补空白,开源平台 Zingg、Senzing 和 Splink 提供了支持身份识别的库。虽然这些库功能强大,但在部署和管理上需要一定的技术专业知识。目前它们尚未具备高度友好的用户界面(尽管 Zingg 有已有的服务)。
身份脊
身份脊是专门针对美国消费者的数据库,包含他们的身份信息、标识符和其他相关属性。它们通常与 CDP 或 MDM 解决方案集成,并通过数据 marketplace 提供服务。虽然这些解决方案对于特定需求的客户来说非常有用且昂贵,但其他选项(如 MDM 和 CDP)提供更经济有效的整合。
包装和混合 CDP
如果你考虑使用基于数据仓库的解决方案,不要忽视一些包装式或混合式的 CDP。如果你的数据仓库团队还不具备高级数据工程技能,或者你对数据仓库平台的集成需求不高,那么可以考虑使用这些解决方案来丰富你的客户数据,并通过它们(例如 ActionIQ、BlueConic 和 Amplitude)实现身份识别。
代表 | 优势 | 劣势 | |
---|---|---|---|
大型云“实体框架” | Google Cloud、AWS、Snowflake、Databricks 提供工具,支持DIY或第三方管理。 | 提供工具,支持DIY或第三方管理。 | |
“可组合”的 CDP | Hightouch、Census、Rudderstack、Growthloop 提供基本的去重和模糊匹配能力。 | 数据预处理、构建身份图和创建持续标识器仍需自行完成。 | |
企业 MDM 解决方案 | Tamr、Reltio 和 Informatica 提供高精度、友好的用户界面,专为监管行业设计。 | 成本高昂,且脊和标识符可能需要附加服务。 | |
开源工具 | Zingg、Dedupe、Splink、RecordLinkage 提供强大的去重、模糊匹配和机器学习功能。 | 计算需求高,且部分实现复杂(Zingg 有已有的服务)。 | |
身份脊 | TransUnion、Merkury、Experian、LiveRamp 提供数据库并提供数据共享能力。 | 匹配回私有身份图可能仍需额外服务,假设你的身份图已经准备好。 | |
混合和封装 CDP | ActionIQ、BlueConic、Amplitude、Segment、Amperity、Lytics 等 | 简化复杂性,提供全栈管理平台。 | 可能不单独提供身份识别能力,实施起来可能更复杂。 |
各类解决方案的比较表格
通过以上分析可以看出,尽管各种解决方案各具特色,但它们往往无法单独满足所有需求。因此,在选择时需要综合考虑多种解决方案的优势和劣势。
开始实现身份识别
要开始实现身份识别,首先需要明确你核心的身份识别需求:
- 定义使用场景:确定具体业务问题并评估是否需要身份识别来解决这些问题。
- 评估数据环境:了解你需要整合的数据类型和规模。可以利用 Tableau 或 Power BI 等数据可视化工具深入了解你的客户数据特点。
- 探索现有工具:评估你现有的 martech 集合,了解它们在身份识别方面的能力以及团队的管理能力。
- 寻求帮助:如果需要,可以请经验丰富的 martech 咨询师提供指导和实施建议。
通过以上步骤,并选择适合你需求的身份识别解决方案,你可以开始实现客户视图的统一化,从而推动业务增长。记住,就像客户基数一样,你的身份策略也需要不断进化和发展。