百度凤巢新一代广告召回系统——“莫比乌斯”

发布网友

我来回答

1个回答

热心网友

百度凤巢新一代广告召回系统——“莫比乌斯”创新点在于引入了CPM等业务指标作为召回依据,并融合了CTR预估模型,形成多目标商业召回系统架构。

在大多数公司的商业广告系统架构中,采用经典的“漏斗”结构,包括召回、粗排、精排和重排序等模块。在现有的召回模块中,首先确保召回内容的相关性,以匹配用户搜索query和候选广告。然而,相关性高的广告不一定具有高商业价值,因此尝试引入业务指标,如CPM。然而,仅依赖CPM召回可能影响准确性,出现“所答非所问”的情况,损害用户体验。因此,召回层在保证相关性的前提下,力求筛选出变现能力强的候选广告。

为了提高筛选能力,系统采用将CTR模型迁移到召回阶段的核心思想。在召回阶段利用CTR模型预测候选广告的PCTR值,作为召回依据。面临的问题是直接套用CTR模型不可行,系统还需解决数据增强、模型训练等关键问题。

莫比乌斯召回系统架构由数据增强模块和模型训练模块组成。数据增强模块通过主动学习的“teacher-student”模型框架生成针对“低相关性高点击率”badcase的训练样本。模型训练模块利用生成的样本数据迭代更新模型,形成双塔结构,通过用户和广告侧的特征构建embedding向量,计算内积并应用softmax层得到预测结果。

线上广告检索召回利用query embedding在保证相关性的前提下筛选变现能力强的候选广告。采用近似最近邻(ANN)检索或最大内积检索(MIPS)进行快速检索,并根据商业指标进行排序。系统还对高维浮点数embedding向量进行压缩处理以优化内存和磁盘开销。

实验结果显示,离线效果显著,线上部署后CPM涨幅大,效果明显。莫比乌斯系统在保证相关性的基础上提升候选广告集的变现能力,为广告召回提供了新思路。

链接至论文

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com