GAUC介绍

Reading time ~1 minute

Taobao在2017年《Optimized Cost per Click in Taobao Display Advertising》提出了GAUC的概念:

1.介绍

广告促进了新品牌的提升,并保持已存在的高质量品牌长青。在线广告自1990s年后获得了指数式增长,它的市场策略涉及到使用互联网做为中介来获取网站流量和受众(target),并分发市场信息给合适的顾客。在在线广告中的实时竞价(RTB: real-time bidding)技术,允许广告主(advertiser)为每个独立的曝光(impression)进行竞价(bid)。大量研究【23-26】发现,有效的竞价策略可以最大化一个party(比如:广告主、消费者、媒介平台)的单边经济顺差(unilateral economic surplus)。

除了RTB系统外,淘宝建立了世界上最高级的在线广告系统之一。在移动app和pc网站上,被选中的ads会在指定spots(插播广告)中被呈现给用户。本文中关注在taobao移动app端上CPC展示广告(display advertising)中的竞价优化问题。主要涉及到两块:

  • Banner CPC Ads:图1中taobao主页的top banner上出现的ads。广告主会为单个item、一个store或一个brand设置广告系列。
  • Item CPC Ads:在猜你喜欢栏目中,单个items会被展示给用户,它包含了200多个spots,只有三个是广告,其它为推荐项,如图1所示。

图片名称

图1

考虑到用户和广告主,taobao广告平台形成了自己独特的经济体,特性如下:

  • 1.不同于大多数RTB系统(很难获取完整用户数据),taobao自身同时扮演着需求端和供给端。这种经济闭环系统使得taobao可以收集完整的用户数据和广告活动(ad campaign)信息。
  • 2.系统中的大多数广告主是小型、中型广告主,它们只关注收益(revenue)的增加,而非品牌提升。因此,在GMV(交易总额:Gross Merchandise Volume)上的增加可以使这些广告主受益。
  • 3.不同的广告主会购买不同的KPI(比如:impressions,clicks,ROI),它们对于taobao平台上的点击进行竞价,例如:采用CPC。我们会讨论其它方法,比如:CPM(每千人成本:cost per mille)和CPS(每次销售成本:cost per sale)。
  • 4.最后但最重要的是:广告位(advertising spots)必须满足媒介需求,它可以通过一些指标进行衡量,比如:CTR、转化率(CVR)、GMV等。这里有一个GMV的分析。首先,我们希望商业流量的介绍不会过度影响用户体验。因而,设置GMV需要达到一个在商业回报和用户体验上的双赢(win-win)。第二,一个taobao广告主通常是taobao的卖方(sellers),它们会使用一个固定比例的回顾用于市场推广,提升GMV会导致广告主增加它们的广告预算,这会带来平台的长期收益。

考虑上述优缺点,我们在两种广告形式上采用CPC。尽管广告主认为CPS对比于CPC的风险更低,但CPS会忽略点击的价值,提供更差的流量清算效率。由于广告形式主要针对中小广告主,CPM造成更高的风险,而CPC允许广告主控制点击成本(cost of clicks),平台则承担着调整page views给clicks的风险。有了taobao完整的数据生态(data ecology)、以及标准电商广告和交互过程,CPC足够有效。

许多SOTA的系统,比如facebook[7]使用不同的设计。对于一些大型社交网络服务(SNSs),通过oCPM(optimized cost per mille),广告主可以为click竞价,实际每次impression都有花费。SNS广告交互通常是有差异的,比如:like、click、share等。而taobao交易通常通过简单的系列点击(serial clicks)来完成。从数据生态的视角,在ad click之后,taobao用户的所有行为仍在taobao平台上,这可以为可跟踪的基于交互的演绎提供条件。然而,SNS通常会让广告主为clicks或其它actions竞价,从而转化成等价的CPM方式,这在机制上鼓励广告主上传实际的follow-up intereaction数据,以便进一步优化bid。

前面提到的两种ad形式,根据生态、效率等,我们选择CPC。

taobao的广告系统包括:数百万ads的过滤,并对这些候选ads进行ranking。首先,根据历史行为以及ad item细节挖掘用户偏好。taobao targeting系统[17,18]会训练模型为每次page view请求来过滤大量ads,这被称为matching stage。不同于推荐(不涉及广告主),matching service会召回相关的users,它们必须反映广告主竞价意愿,并确保市场深度。第二,实时预测(RTP:real-time prediction)引擎会为每个符合条件的广告(eligible ad)预测pCTR。第三,传统上,这些候选广告通过bid * pctr进行排序,并基于该order来最大化eCPM(effective cost per mille:每千次展示可以获得的有效广告收入)。

广告主总是希望bid匹配流量质量(traffic quanlity)。由于技术限制,对于粗粒度流量差异,传统方法只能为指定user groups和ad slots设置固定竞价(fixed bid),然而,广告主正进一步寻找细粒度bids和traffic quanlity的匹配(matching)。一方面,一个fiexed bid set很。。。

2.系统架构

这部分描述了taobao中的展示广告系统(display ads system)中数据和信息是如何流动的,如图2所示。每个系统组件和events序列会从foremost page view request中:

图片名称

图2

3.OCPC

OCPC(Optimized Cost Per Click)

在这部分,我们首先数学描述advertisers和conditions以便optimization。第二,我们提出一个算法来优化平台生态指标(index)和平台回报(revenue)。最后,介绍相关细节。实际上,我们的算法框架使用大量广告主需求和平台生态指标,比如:(PV数、点击数、转化率(conversion)等)。作为一个常见case,该paper会将ROI和gaining qulity traffic按广告主的要求进行设置,GMV作为平台生态指标,它与平台收益(playform revenue)通过调节广告主的竞价来进行优化。假设A是对于一个PV请求来说合格的广告活动(ad campaigns)的集合。有了该特定PV请求,对于每个campaign ,存在一个由advertiser预先设定的相应的bid 。对于每个,OCPC算法的角色是,调整并发现一个最优的来达到预先设计的多种最优化需求。

3.1 Optimization Scope

ROI constraint。考虑

3.2 ranking

3.3 算法细节

4.模式估计

4.1 模型和features

4.2 模型performance

serving precise结果对于预测模型来说非常重要。在像CTR预估的任务中,AUC是一个被广泛用来评估模型有效性的指标。然而,一些研究表明[4],在testing上更好的AUC结果可能会在生产环境中带来差的performance。当在实际中对预测模型进行调参时,这会带来困扰。我们分析了该问题,并发现,AUC指标并不会对用户(users)和广告位(spots)进行区别对待。例如,从未点击任何ad的用户或模糊的广告位,可能会对AUC结果偏向一个更低值。根据这些事实和分析,我们提出了一个AUC-like metric,称为Group AUC(GAUC),如等式(9)所示。

  • 首先,我们将所有测试数据根据the user (u)和广告位的特定位置(p)进行聚合
  • 接着,在每个单一group上会计算AUC结果(注意:如果在一个group中存在的样本全为正、或全为负时,我们需要从数据中对该group进行移除)
  • 最后,我们对这些在不同的groups上的AUC进行加权平均(weight 与group中的impression times或click times成比例),并将结果作为GAUC value

…(9)

CTR和CVR模型performance。在图6中,我们给出了在一个7天周期中,CTR和CVR预测模型在AUC和GAUC的performance。结果表明,由MLR算法的天模型(daily model)的performance很稳定。CVR模型比CTR模型具有更高的GAUC,因为在CVR模型的样本中具有更小的noises。在图7和4中,我们展示了CTR、CVR在不同预测值levels下的预测和实际ratio。结果表明,CTR的预测值(predicted)通常要比实际值(real)更大。然而,在提出的OCPC策略中,不同的predicted CTR值间的顺序关系影响会更多。

图片名称

图6 在一个7天的周期中,CTR和CVR模型在AUC和GAUC上的performance (从2017.1.10-2017.1.16)

图片名称

图7 predicted和real CTR间的gap w.r.t. 不同pCTR level(从2017.1.10-2017.1.16)

参考

facebook DLRM介绍

# 介绍facebook在2019在《Deep Learning Recommendation Model forPersonalization and Recommendation Systems》。# 摘要facebook开发了一种SOTA的深度学习推荐模型(DLRM)...… Continue reading

polularity bias与miscalibration介绍

Published on October 23, 2019

ali reranking模型介绍

Published on October 15, 2019