About

RAG:智能营销人从未听说过的最essentialAI工具

Author Tanmer Tanmer
Tanmer · 2025-07-07发布 · 2 次浏览

本文讨论了RAG(检索增强生成)作为一种AI营销工具的重要性,强调准确的数据准备和上下文检索对于生成高质量输出的必要性,并探讨了智能代理如何简化这一过程。

RAG:最有可能被忽略的AI营销工具

到目前为止,将AI引入大规模营销的大部分讨论都集中在需要如何培养“好问题”——能够利用这一强大的技术提出正确的问题的能力。我们一直被告知,要成功使用这项技术,就需要这种技能,这意味着我们可以雇佣我们的解决方案。尽管像大科技公司和AI实验室这样的组织正在忙着招聘RAG工程师,但对“提示工程”的重点仍然是一个 holdover 从GenAI的早期日子。

虽然像Big Tech公司和AI实验室这样的组织正在忙着招聘prompt工程师,但“提示工程”通常只是给AI模型更好的、更明确的指示。

什么是RAG—— 以及它为什么重要

RAG(检索增强生成,Retrieval-Augmented Generation)涉及向GenAI模型提供外部上下文——精心选择的数据或内容——以产生更准确、相关且有针对性的输出。

GenAI模型最大的挑战之一是它们总是会回应,无论他们是否收到了正确的上下文或高质量的输入。没有足够的数据,它们经常生成看似正确但不准确的结果(幻觉)或不适合目的的通用结果。

一切始于数据

几年前,我们假设要从GenAI中获得准确、相关的结果,唯一的办法是开发定制模型。然而,这种方法在时间和复杂性上远低于预期成本。RAG提供了一种可行且经济的替代方案。

但首先,你需要准备一个优化的数据集。对于基于文本的传统营销使用场景,你应该收集现有的营销内容,这些内容最好能代表你的品牌、语气和不同类型的宣传材料结构。这种上下文将使GenAI模型能够生成需要很少人类干预的结果。然而,有两个核心挑战:

  1. RAG输入数据需要是机器可读的。 GenAI模型擅长处理单页内容,但对更复杂的文档(如白皮书)不太擅长,这些文档通常包含图片、图表和甚至表格等图形元素。你需要准备好将这些长文档导入LLM。

  2. RAG数据必须能够被精确查询。 RAG的强大之处在于检索能力,但要有效地使用RAG,你必须能够精确地检索所需的数据——既不多余也不能遗漏。

简而言之,要充分利用RAG,你的数据需要结构化和标签化。解决这个问题的一种方法是“语义分层”——一种详细且结构化的文档表示,包括表格、数据提取用于图表和图形、表格数据以及甚至嵌入图像的描述。XML格式是一个理想的选择,因为它既容易让GenAI模型理解,又提供了丰富的标记以供查询。

正如我在我之前的一篇MarTech文章中讨论的,还有许多与图形、图片和数字资产相关的GenAI用例。RAG在这里的要求是一样的——你需要准备高质量且结构化的输入数据,以便模型能够准确识别图像内容并生成相应的元数据。

正如我之前提到的,虽然商业GenAI模型可以识别简单的图像属性(例如,有人、帽子或汽车),但它们通常无法捕捉品牌美学、文化和情感共鸣等细微的情感。市场营销人员和创意专业人士需要更详细且更具特定性的资产 metadata,以确保输出与品牌视觉风格和营销策略保持一致。

简单地说,用于视觉资产的RAG实施需要精心 curated 和详细的图像和视频 metadata 标记。要确保输出与 evolving 的创意策略和品牌标准保持一致,你需要不断优化和管理视觉训练数据。

让GenAI注意这件事 

RAG的一个强大特性是检索(“R”)是动态的,而不是静态的。为了填充你的RAG输入数据,你需要运行一个基于一组参数的动态搜索以检索最相关的和最新的信息。

然而,大多数GenAI模型对上下文窗口有限制(通常以令牌数衡量)。想象一下,这就像模型的短期记忆或工作记忆。一旦超过了上下文窗口,模型就会开始失去早期输入的信息,从而影响输出的质量。因为这个限制,将大量文档或图片扔进一个GenAI模型中进行RAG是不现实的。

数据准备使你能够选择最相关的上下文信息。有些人可能会争论哪种检索技术更好,例如图灵优于向量(语义)搜索,反之亦然。但我认为没有一种技术比另一种更强大,无论怎样,如果没有高质量的数据准备,任何搜索都无法产生准确的结果。

要有效地使用RAG,你需要能够从大量信息中进行选择并仅提取必要的数据以提供正确的上下文给模型。如果你无法在检索中进行选择,你可能会超过上下文窗口(通常为 100,000–300,000 令牌)或甚至提供错误的输入,从而导致输出质量下降。

最好的方法是准备好一个优化的数据集,并且要非常精确和有目标地进行检索。

让负载更轻松,通过智能代理 

如果以上听起来很麻烦,确实如此。最近的一项调查显示,大约有 50% 的时间花在构建新 GenAI 应用/代理上。然而,好消息是,现在开始有人利用 LLM 和 GenAI 代理来自动化数据准备和创建语义层,这大大减轻了负担。

通过简单的提示,智能代理可以自主执行数据准备和各种工具和技术的应用,以访问并检索所需的精确 RAG 输入。这种方法提供了两个关键好处:

• 它允许非技术人员(如营销人员和创意专业人士)轻松利用生成AI进行复杂项目,极大地降低了复杂性和学习曲线。

• 它自动化了劳动力密集的过程,如数据准备,从而显著提高了 GenAI 输出的质量,并加快了新 GenAI 应用的开发速度。

这就是为什么在之前的文章中我提到过,尽管GenAI模型很强大,但仍然有一些更深层次的复杂性,RAG是其中之一。然而,随着工具和平台的发展,现在有越来越多的人能够轻松构建自定义 GenAI 应用和代理,而无需付出高昂的成本和复杂性。

这就是为什么我会在之前的文章中指出,GenAI 不是“插件式”工具——存在更深层次的复杂性和 RAG 是其中之一。但目前有一些工具和平台可以帮助你更快、更轻松地构建 GenAI 应用和代理,而无需付出高昂的成本和复杂性。

提交反馈

资讯 资讯

开发原创报告

开发原创报告

探讨原创报告对SEO的重要性及其对谷歌排名的影响。

Author original-report-seo
By 数字体验专家
发布:2025-05-23