谷歌团队发布论文介绍了一种用于扩大大语言模型(LLMs)在谷歌广告内容审核中的应用的方法。由于LLMs在内容审核方面非常强大,但其推理成本和延迟使得它们在日常大量数据集(如谷歌广告库)上的应用变得不切实际。研究团队提出了一种方法,通过筛选和去重来选择候选广告,然后为这些广告创建集群,并为每个集群选择一个代表性广告进行LLMs审核。最后,将LLMs对代表性广告的决策结果传播回其所属的集群。
论文地址:https://arxiv.org/abs/2402.14590
主要功能:
- 高效的内容审核:通过减少需要LLMs处理的广告数量,提高审核效率。
- 扩大LLMs的应用范围:使得LLMs能够在有限的计算资源下处理更大规模的广告内容。
主要特点:
- 利用启发式方法进行筛选和去重,减少LLMs的审核负担。
- 使用LLMs对代表性广告进行标注,然后通过标签传播技术将决策结果扩展到整个集群。
- 通过反馈循环不断优化审核流程,提高LLMs的覆盖范围。
工作原理:
- 使用内容和行为相似性作为启发式方法来选择可能违反政策的广告候选。
- 通过去重、过滤和多样化抽样进一步减少需要LLMs处理的广告数量。
- 使用经过提示工程和参数高效调整的LLMs对代表性广告进行标注。
- 将LLMs标注的标签传播到与已知违规内容相似的广告上。
- 通过反馈循环,将LLMs直接标注和通过标签传播间接标注的图像用于下一轮审核候选选择。
具体应用场景:
- 谷歌广告平台:用于自动审核广告内容,确保广告符合谷歌的广告政策,保护用户、广告商和发布商的利益。
- 其他内容平台:可以扩展到视频、文本和着陆页等其他广告格式和内容类型。
总的来说,这项研究提出了一种有效的方法来扩展LLMs在大规模内容审核中的应用,通过减少计算资源的需求,同时保持高召回率和精确度,这对于需要处理大量广告内容的平台尤为重要。
0条评论