程源:廣告算法在阿里文娛用戶增長中的實踐

導(dǎo)讀:從2019年開始,優(yōu)酷使用DSP在今日頭條、阿里媽媽等平臺投放視頻廣告,實現(xiàn)用戶的穩(wěn)定增長。我們將用戶增長領(lǐng)域與廣告競價領(lǐng)域結(jié)合,借鑒推薦領(lǐng)域的實踐,基于特有的業(yè)務(wù)背景,開發(fā)落地了一系列算法。在成本及預(yù)算可控的條件下,最終實現(xiàn)了數(shù)百萬DAU引流能力。

本文主要介紹外投廣告算法在用戶增長領(lǐng)域的設(shè)計及優(yōu)化,解決存在約束的條件下,實現(xiàn)最大化DAU量的問題。

下面將圍繞四點展開:

  • 優(yōu)酷用戶增長業(yè)務(wù)介紹
  • 廣告排序算法及優(yōu)化
  • 自動化報價算法
  • 總結(jié)及后續(xù)規(guī)劃
程源:廣告算法在阿里文娛用戶增長中的實踐

1. 用戶增長業(yè)務(wù)背景

程源:廣告算法在阿里文娛用戶增長中的實踐

在用戶增長的過程中,首先需要把用戶增長劃為不同的用戶態(tài),不同的用戶態(tài)存在不同價值。新用戶會變?yōu)榈突钣脩?、中活用戶直至高活用戶,在整體過程中,也會隨時變成沉默用戶。對用戶增長而言,新用戶、低活用戶和沉默用戶是非常有價值的,他們的到訪能有效提高APP的活躍度。

RTB是實現(xiàn)用戶增長的主要方式之一。它的主要流程是:首先DSP參與廣告競價,在競價成功之后,廣告會展現(xiàn)在外部平臺上,用戶在點擊之后會切換至優(yōu)酷APP上,如果感興趣的話會有視頻消費和次日回訪。整個流程分為兩部分,前半部分歸屬于RTB競價,后半部分屬于用戶增長。

用戶增長的主要業(yè)務(wù)目標(biāo)是在成本可控的條件下,最大化高價值的DAU量,即讓更多的新用戶、低活用戶以及沉默用戶來到平臺進(jìn)行消費,增加平臺活躍度。

2.?廣告競價RTB概述

程源:廣告算法在阿里文娛用戶增長中的實踐

RTB有兩個比較重要的組件:廣告主競價代理DSP和提供競價接入、判定競價成功與否的平臺ADX ( 例如頭條ADX,阿里的TanX )。

RTB過程如下:當(dāng)用戶訪問的Web頁面或APP應(yīng)用時,請求發(fā)送至ADX,由ADX轉(zhuǎn)發(fā)至多個DSP,DSP根據(jù)從用戶需求平臺 ( DMP ) 上取得的用戶特征進(jìn)行預(yù)估,在100ms之內(nèi)將廣告和出價返回至ADX,之后ADX根據(jù)多個DSP返回的結(jié)果,根據(jù)一定的排序規(guī)則和計費規(guī)則,選擇一個合適的廣告投放給用戶,之后又將用戶是否點擊這條廣告的信息返回給成功獲得了該次競價的DSP代理。

RTB中的主要關(guān)注點是成交機(jī)制和計費模式,其中成交機(jī)制包括:GFP ( 最高價格成交 ), GSP ( 第二價成交,通用的方式 ), VCG ( 通過效用計算成交價格,存在算法上,理解上的難度,用的較少 )。計費模式主要有CPM,CPC,CPA和OCPX,其中CPM是由廣告主承擔(dān)預(yù)估風(fēng)險,由DSP預(yù)估用戶對廣告主的價值,CPC和CPA是由平臺來預(yù)估用戶對于各個DSP的價值,OCPX是由平臺自動調(diào)整出價,由平臺預(yù)估價值,用戶承擔(dān)風(fēng)險。

在我們的業(yè)務(wù)場景中,使用的是GSP成交機(jī)制,CPM的計費模式。并且優(yōu)酷業(yè)務(wù)場景有鮮明的特點:

  • 使用CPM計費,需要我們自身建模預(yù)估,但可利用站內(nèi)數(shù)據(jù);
  • 對于不同用戶態(tài)的拉活,引流成本是不一樣的,需要針對不同人群提供成本控制;
  • 作為只有一個用戶的DSP代理,可以接入不同的ADX平臺,需要針對多渠道多平臺做模型融合。

雖然現(xiàn)有的ADX平臺能夠支持直接在上面投放廣告,但是存在很多問題:不支持定向用戶分層,不支持個性化,數(shù)據(jù)屬于平臺方,無法進(jìn)行后續(xù)優(yōu)化,接入平臺過多也會增加消耗等等,因此我們自建DSP,滿足業(yè)務(wù)場景需求。

程源:廣告算法在阿里文娛用戶增長中的實踐

1.?算法流程

程源:廣告算法在阿里文娛用戶增長中的實踐

離線產(chǎn)生數(shù)百萬的廣告,第一步通過人工精選或者算法選擇來保證廣告池的動態(tài)進(jìn)出,例如刪除投放時間過長,點擊率過低的廣告,通過算法選擇高質(zhì)量的廣告;第二步通過個性化多路召回適合用戶的千百個廣告;第三步將經(jīng)過召回的廣告通過規(guī)則過濾,例如會過濾重復(fù)廣告,或者會根據(jù)曝光頻率來控制;第四步將這些廣告通過預(yù)估模型,選擇價值最高的廣告通過報價算法產(chǎn)生報價,最后將廣告和報價結(jié)果返回至ADX。

與推薦系統(tǒng)相比,流程借鑒了推薦系統(tǒng)的多路個性化召回,區(qū)別在于推薦系統(tǒng)關(guān)注Rank順序,而廣告還關(guān)注CTR偏差,推薦系統(tǒng)一般最后的組件是重排 ( ReRank ),而廣告系統(tǒng)在預(yù)估之后需要進(jìn)行報價計算。

2.?算法實現(xiàn)方案

程源:廣告算法在阿里文娛用戶增長中的實踐

我們面對的業(yè)務(wù)場景的主要特點是:

  • RT限制比較嚴(yán)格,要在100ms內(nèi)返回;
  • 存在多渠道多平臺;
  • 接入量大,機(jī)器資源比較緊張。

常用的排序模型有LR,GBDT,DNN ( DCN/WDL/MMOE ) 等,LR需要大量的特征工程工作來提高模型精度,GBDT的訓(xùn)練和預(yù)估都很快,能有效緩解RT問題,但是類別特征的處理上容易使模型過擬合,DNN的embedding技術(shù)能夠處理各種特征,但是由于需要存儲包含每個特征對應(yīng)的embedding的大矩陣,線上內(nèi)存消耗很大,而且DNN類的模型雖然能達(dá)到很高的精度,但訓(xùn)練和預(yù)估都很耗資源并且打分時的RT很高。

在多渠道多平臺統(tǒng)一模型方面,主要存在兩個問題:

  • 不同渠道之間有差異。例如汽車相關(guān)廣告,在母嬰社區(qū)和汽車之家論壇點擊率之間會有不同;
  • 渠道平臺相關(guān)沒有現(xiàn)成的特征。在實際中,我們以平臺本身作為特征,通過根據(jù)歷史數(shù)據(jù)構(gòu)建不同平臺的統(tǒng)計特征,使模型感知到渠道平臺的差異,最后基于不同平臺不同分層的Match特征,實現(xiàn)了由LR單渠道模型到GBDT統(tǒng)一模型的升級,帶來了業(yè)務(wù)上的明顯收益。

3.?遇到的問題和思考

程源:廣告算法在阿里文娛用戶增長中的實踐

推薦中常用召回都是Item-based,通過用戶觀看的視頻來尋找相似的視頻,認(rèn)為這些相似視頻是用戶喜歡的視頻,這導(dǎo)致推薦系統(tǒng)有以下缺陷:

  • 用戶觀看的視頻未必是用戶喜歡;
  • 相似視頻的相似之處未必是用戶觀看視頻的真正原因;
  • 低頻用戶觀看的視頻非常少,推薦結(jié)果缺乏多樣性。

從因果推斷的角度思考上述問題的話,我們認(rèn)為用戶變沉默的原因是對之前推薦的內(nèi)容不滿意,而用戶留存的原因是因為推薦的視頻他比較喜歡,因此,我們利用無偏信息構(gòu)建相似度量,構(gòu)造低活用戶到高活用戶的匹配,找到他的反事實鏡像人,然后進(jìn)行相關(guān)推薦,在業(yè)務(wù)上也取得了很大收益。

程源:廣告算法在阿里文娛用戶增長中的實踐

1.?業(yè)務(wù)背景及問題的形式化定義

程源:廣告算法在阿里文娛用戶增長中的實踐

不同的場景下,廣告投放的報價算法存在不同的約束,主要場景包括日常投放和沖量投放,本質(zhì)上都是多渠道多分層的投放。對于日常投放而言,會存在預(yù)算約束,首活成本約束,用戶價值約束 ( 需要去高活,要更多的高質(zhì)量沉默用戶 );當(dāng)運營有沖量需求時為沖量投放,這時預(yù)算充足,有首活成本約束,用戶價值約束。

2. 單PID解決沖量投放

程源:廣告算法在阿里文娛用戶增長中的實踐

根據(jù)沖量投放的條件:預(yù)算充足、有首活成本約束、用戶價值約束,可以解出報價公式,即報價為預(yù)估的CTR/CVR與報價系數(shù)alpha之積。我們通過單控制器的方法來控制報價系數(shù)alpha,使其再能夠滿足成本約束的同時提升轉(zhuǎn)化率。

控制器根據(jù)Feedback數(shù)據(jù)和控制函數(shù)計算公式,可以計算出一個信號,再將其傳入執(zhí)行器中通過執(zhí)行器函數(shù)計算,從而給出報價。常見的控制器有PID和水波控制器,PID通過振幅,累積誤差和波動來調(diào)節(jié),而水波控制器僅僅通過累計誤差來進(jìn)行調(diào)節(jié),能力相對弱一些。執(zhí)行器是將控制信號進(jìn)行指數(shù)變換,對初始值進(jìn)行放大或者縮小,實現(xiàn)最后的出價。

3.?日常投放解決方案

程源:廣告算法在阿里文娛用戶增長中的實踐

對于日常投放而言,會存在預(yù)算約束,首活成本約束,用戶價值約束 ( 需要去高活,要更多的高質(zhì)量沉默用戶 ),我們采用多目標(biāo)約束下的最大化問題來建模,用拉格朗日對偶法解決,能解出一個出價公式 ( 可參考KDD2018對應(yīng)論文 )。計算所得的出價公式中有兩個參數(shù)p、q,我們通過兩個PID對這兩個參數(shù)進(jìn)行控制來實現(xiàn)報價。不同于單PID的解決方案,一是在q控制器中增加了修正信號,使其以最終CPC為控制目標(biāo),二是利用線性插值的方法建模兩個PID之間的耦合影響 ( 具體方法可以參考KDD2018 )。

4.?報價工程化

程源:廣告算法在阿里文娛用戶增長中的實踐

用戶的請求通過DSP接入管理后臺,請求在進(jìn)入系統(tǒng)之后,有以下流程:

  • 接入后臺產(chǎn)生競價、曝光、點擊等日志,通過Blink解析統(tǒng)計得到誤差數(shù)據(jù),將誤差數(shù)據(jù)實施寫入內(nèi)存數(shù)據(jù)庫,并保存歷史誤差數(shù)據(jù);
  • 報價算法核心 ( 為了保證最大化利用流量,M分鐘定時調(diào)度一次,一次即為一個時間步 ) 通過離線平臺得到投放計劃,成本、預(yù)算、算法參數(shù)等,然后從內(nèi)存數(shù)據(jù)庫中讀取誤差數(shù)據(jù),計算當(dāng)前報價參數(shù)并寫入內(nèi)存數(shù)據(jù)庫;
  • 數(shù)據(jù)在TPP平臺進(jìn)行廣告召回,點擊率預(yù)估等,最后讀取內(nèi)存數(shù)據(jù)庫中的報價參數(shù)并返回廣告和出價。
程源:廣告算法在阿里文娛用戶增長中的實踐
程源:廣告算法在阿里文娛用戶增長中的實踐

整個實踐過程中,在技術(shù)選型方面,除了理論上的支持,我們必須考慮機(jī)器資源,人力等方面的約束,并考慮到各種可用資源 ( 公司內(nèi)部,開源等 ),將整個目標(biāo)進(jìn)行體系化,分層拆分優(yōu)化,通過算法AB系統(tǒng)驅(qū)動效率提升;針對業(yè)務(wù)特點建模,具體問題具體分析,技術(shù)為業(yè)務(wù)服務(wù)。

后續(xù),我們可以在實現(xiàn)CTR預(yù)估的基礎(chǔ)上,實現(xiàn)用戶價值的預(yù)估,實現(xiàn)多目標(biāo)預(yù)估;在報價算法上,可以嘗試基于強化學(xué)習(xí)進(jìn)行報價;業(yè)務(wù)上,可以由促活擴(kuò)展至拉新,熱劇宣發(fā),會員等方面,這些都可以依托已建立的預(yù)估系統(tǒng)和報價技術(shù)框架進(jìn)行發(fā)展。

今天的分享就到這里,謝謝大家。

文源:datafuntalk

特別提示:關(guān)注本專欄,別錯過行業(yè)干貨!

PS:本司承接 抖音關(guān)鍵詞排名,抖音創(chuàng)意視頻,抖音種草,達(dá)人探店,明星推薦,等業(yè)務(wù);

咨詢微信:139 1053 2512 (同電話) 

首席增長官CGO薦讀:

更多精彩,關(guān)注:增長黑客(GrowthHK.cn)

增長黑客(Growth Hacker)是依靠技術(shù)和數(shù)據(jù)來達(dá)成各種營銷目標(biāo)的新型團(tuán)隊角色。從單線思維者時常忽略的角度和高度,梳理整合產(chǎn)品發(fā)展的因素,實現(xiàn)低成本甚至零成本帶來的有效增長…

本文經(jīng)授權(quán)發(fā)布,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://m.allfloridahomeinspectors.com/cgo/user/28791.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
上一篇 2020-03-11 22:53
下一篇 2020-03-11 23:12

增長黑客Growthhk.cn薦讀更多>>

發(fā)表回復(fù)

登錄后才能評論