近日,來自阿裡媽媽精準技術團隊的論文《淘寶展示廣告中的ocpc智能調價算法》被國際資料挖掘領域頂級會議kdd(knowledge discovery and data mining)收錄。
該論文圍繞ocpc智能調價,創新地提出了一種雙層優化形式,将優化廣告主價值轉化為首要限制條件,将系統根據預估收益對廣告進行排序作為内層優化問題,将使用者體驗和平台收益的最大化作為外層的尋優問題,并提出了相應的求解方法。最終達到不僅廣告主效果優化,平台商業收入和使用者名額也獲得優化的三位一體目标。
研究問題:傳統廣告系統本質是粗粒度的流量區分和比對
基于固定出價的傳統廣告系統中,廣告主對特定使用者人群和廣告位設定固定的競價,其本質是粗粒度的流量區分和比對。事實上,廣告主有着進一步細粒度的競價和流量品質比對的訴求。
該系統還有着兩方面的缺陷。其一,廣告主單一固定的出價應對連續多變的流量模式導緻經濟效率低下;其二,傳統的最大化廣告收益(ecpm)的排序機制過于追求短期商業利益,無法調控流量對使用者體驗、商家利益、成交額等名額的影響,不利于淘寶生态的長期可持續繁榮。
研究場景:最大線上市場淘寶網線上廣告系統
曾被《經濟學人》稱為“中國最大線上市場”的淘寶擁有世界先進水準的線上廣告系統。該論文的研究聚焦于重要的淘寶移動端cpc展示廣告中的競價優化問題。由于淘寶cpc展示廣告處于相對重要的場景,其廣告投放的優化通常需考慮諸多因素,如反應商家利益的投資回報率(roi)、總成交額(gmv)、轉化率(cvr),反應平台使用者體驗的點選率(ctr),以及淘寶平台收益名額(千次展現收益rpm)等。
值得一提的是,谷歌公司adwords的ecpc也嘗試根據使用者潛在轉化率調整廣告主競價。然而,除了轉化率,ecpc無法直接優化其它諸多對淘寶生态重要的名額(如平台整體gmv等)。
研究設想: ocpc智能調價算法 實作自動調整競價
論文設想通過算法對于每條使用者請求,在保障優化廣告主利益的前提下,自動地調整廣告主競價進而使競價能夠反應該流量的真實價值。流量價值的定義上,算法融合了使用者體驗、廣告主收益以及平台收益的整體生态名額,旨在實作三方共赢的商業局面。基于此,論文提出了一種新的optimized cost per click (ocpc)智能調價算法。
ocpc智能調價算法從數學上描述并分析了優化廣告主訴求的條件,進而提出了一種優化平台生态綜合名額以及平台收益的算法。事實上,該算法架構适用于多種廣告主訴求以及平台生态名額的優化問題,例如使用者的浏覽量、點選量、轉化率等。
論文選擇了roi以及流量品質作為廣告主的優化訴求,選擇gmv作為平台生态名額,并通過調整廣告主出價優化平台的商業收益。
論文核心算法
roi(投資回報率)優化算法
智能調價算法分析了優化廣告主投資回報率的條件,即roi限制。其中,定義交易轉化為c,使用者為u,廣告位a,那麼在使用者和廣告的條件下産生轉化的條件機率為p(c|u, a)。對于一個特定的廣告計劃a,定義 為預估的筆單價。是以,單次點選的期望gmv為 。進一步定義廣告主為每一次點選付費為 ,那麼單次點選的期望roi則為公式(1):

(1)
即單次點選的期望投資彙報率為期望gmv除以單次點選價格。進而,廣告a對于不同使用者和點選的roi如公式(2),即平均轉化率乘以比單價除以單次點選價格,其中 是某個使用者在一段時間内的點選量。
(2)
公式(2)說明了roi和一段時間内平均轉化率$e_u[p(c|u,a)]$之間的線性關系,是以,隻需要調價幅度小于目前流量轉化率和曆史平均流量轉化率的比值,就能從理論上保證roi不會下降,如公式(3)所示:
(3)
進而,該算法競價優化的原則是:對于轉化率升高的流量,提升其競價來幫助廣告主競得優質流量;對于轉化率下降的流量,降低競價進而節約在劣質流量上的成本。出于調價的安全考慮,該算法設定了固定的調價範圍參數 ,保證廣告主的調價不過高或者過低,并以此得出調價的上界 和下界 如公式(4)。
(4)
綜合名額優化算法
在給定上下界的範圍内優化出價可以幫助廣告主獲得更高品質的流量以及更高的roi。但是,限制空間内解的不同出價會導緻不同的ecpm排序,并最終影響平台收益和其它名額的效果。是以,該算法提出了一種在ecpm排序機制下,對綜合名額保優的出價調整算法。其核心解決的優化問題如公式(5)。
(5)
其中n是候選廣告的數量,pctr是預估點選率(由阿裡媽媽精準技術團隊自主研發的混合邏輯回歸算法mlr支援)。f()函數定義了系統期望最大化的綜合名額,典型的兩個例子如公式(6),其中,第一個目标函數可以優化總成交額gmv;第二個目标函數權衡優化總成交額gmv和廣告收益。
(6)
如公式(5)所示,我們希望在滿足廣告主訴求的調價範圍内進行調價,使得ecpm排序機制(如公式(5))下最優的廣告,其綜合名額函數f()的值也最大。該優化問題的主要求解方法請參見kdd 2017收錄的論文原文: han zhu, junqi jin, chang tan, fei pan, yifan zeng, han li, kun gai. optimized cost per click in taobao display advertising. acm sigkdd 2017.
該優化問題的設計實作了最終排序名額和廣告主流量目标的解耦。一方面,候選廣告仍然按照最大化ecpm的pctr*b标準排序,廣告主通過調價比對流量價值,同時整體ecpm排序機制保證了廣告主出價撬動流量的能力不受影響;另一方面,廣告平台可以通過設計不同的f()函數優化相應的平台綜合名額。
雙重驗證:離線模拟實驗和線上實際環境
ocpc智能調價算法在離線模拟實驗和線上實際生産環境中都取得了明顯的效果提升。單品廣告離線模拟效果如表1所示。其中,評價名額為rpm(廣告千次展現收益),gpm(千次展現gmv),ctr(廣告點選率),cvr(成交轉化率),ppc(單次點選扣費)。
基準政策是傳統的廣告排序方法,表中資料為該論文提出的ocpc算法相對基準政策的效果提升百分比。實驗結果表明,ocpc算法明顯提升了商家千次展現成交額(gpm)和成交轉化率(cvr)。
表1 單品廣告離線模拟實驗效果提升比例
ocpc算法在線上生産環境中也展現了明顯的效果提升,相比基準政策,其效果提升百分比如表2。
表2 單品廣告線上生産環境效果提升比例
持續一周的線上生産環境效果分析表明,ocpc使得67%的廣告主制定的廣告計劃(campaign)的千次展現成交額(gpm)和廣告投資回報率(roi)同時獲得了提升,如表3。另有24%的廣告計劃顯示出流量數量和品質的置換現象(quantity and quality exchange),其含義是:這類廣告主由于獲得了更多的流量,拉低整體平均roi下跌。但是,由于其整體流量增幅高于平均roi跌幅,這些廣告主的成交轉化數都獲得了提升。
表3 單品廣告線上生産環境廣告主優化比例
除了單品廣告場景,該算法在淘寶移動端首頁頂部的banner廣告中也明顯提升了商家的成交額和轉化率,如表4。從商品的類目視角分析,表5的資料表明17%的類目(占62%的浏覽量)流量的商家gpm和roi獲得了同時提升,27%的類目(占21%的浏覽量)流量的gpm獲得了提升,另有30%的類目(占12%的浏覽量)顯示出流量數量和品質的置換(與單品廣告分析相似,其轉化效果也獲得了提升)。
表4 banner廣告線上生産環境效果提升比例
表5 banner廣告線上生産環境廣告主優化比例
論文指出,持續了一周以上的線上實驗結果表明,ocpc算法在長期的考察中展現了穩定的明顯正向效果提升,為大多數廣告主以及平台帶了經濟效益的增長。更多詳盡的算法分析以及更多場景中ocpc效果的實驗請參閱論文原文。
該項技術在淘寶展示廣告主要場景上得到了全面應用并取得了明顯的效果提升,單品主流場景中67%的廣告主roi(廣告投資回報率)和gmv(商品交易總額)同時獲得了提升,另有24%的廣告主其流量增幅大于roi降幅,即成交總量獲得了提升。
該場景商家整體成交額gmv提升8.9%,cvr(成交轉化率)提升5.2%,rpm(廣告千次展現收益)提升6.6%。banner cpc場景中,62%流量的商家成交額gmv和roi同時獲得提升,21%的流量gmv獲得提升,另12%的流量成交總量獲得了提升。該場景商家總成交額gmv提升15.7%,cvr提升19%,rpm提升3.6%。
下一步融入人工智能算法
未來,阿裡媽媽精準技術團隊将繼續圍繞客戶核心價值,在業務上提升營銷效率,設計更精準的流量實時價值評估系統。通過持續優化商家和消費者的比對與連接配接效率,提升商家的營收和消費者的使用者體驗。技術上,該團隊将進一步探索基于深度學習、強化學習等最前沿的人工智能算法,在持續支援業務效果提升的同時,為學術界、工業界貢獻創新的算法和技術解決方案。
最後送上福利!
6月29日,阿裡巴巴、中國中文資訊學會和kdd china将共同舉辦“資料挖掘前沿發展與未來論壇論壇”。
清華大學副教授唐傑、同濟大學教授曹楠等學界專家及多位kdd 2017收錄論文作者将分享他們在資料挖掘領域的最新研究成果和思考,論壇更有阿裡巴巴神秘嘉賓亮相發言!
這場的知識分享盛會,我們專門為小夥伴們開通了優酷直播,趕快收好。
直播時間:6月29日上午9:00
<a href="https://mp.weixin.qq.com/s/g5a0yk39rzzgce_szbwota">原文連結</a>