天天看點

内容流量管理的關鍵技術:多任務保量優化算法實踐

内容流量管理的關鍵技術:多任務保量優化算法實踐

一 業務背景

保量政策對于視訊内容來說,是一種很重要的投放政策。新熱視訊内容都需要增加自身的曝光資源來達到播放量最大化,而各場景(首頁、頻道頁等)的總體資源有限且每個抽屜坑位的日曝光資源有限,是以各内容的曝光資源配置設定存在競争問題。另外,不同場景之間互相獨立,每個場景根據自身的目标進行效率和體驗上的優化,但是場景與場景之間流量協同無法通過優化單一場景來完成。

内容流量管理的關鍵技術:多任務保量優化算法實踐

為内容配置設定曝光量涉及到關于曝光和點選模組化問題,以及内容的未來點選量預測問題。内容曝光、點選和播放等構成了一個複雜的非線性混沌系統,不僅取決于内容品質本身,也取決于内容更新時間、更新政策和使用者點選習慣等。傳統的統計預測模型無法闡述外部環境的各種幹擾因素以及系統的混沌特性,即無法從機理上描述系統本質。針對此問題,我們首先通過分析新熱内容的曆史曝光點選日志,使用常微分方程建立了新熱内容曝光敏感模型,即pv-click-ctr模型(簡稱P2C模型)。在P2C模型基礎上,結合各場景和抽屜的曝光資源限制,給出一種曝光資源限制下的多目标優化保量架構與算法。

内容流量管理的關鍵技術:多任務保量優化算法實踐

二 内容曝光敏感度模型

通常情況下,點選PV(click)随曝光PV增大而增大,即高曝光帶來高點選。但是,内容消費者數量有限,給同一個消費者針對單一内容重複曝光并不會帶來更多的點選量。這種點選“飽和”現象可從内容的曆史曝光點選日志觀察得到。受此現象啟發,我們根據内容曝光PV和點選PV曆史資料特點,建立一種能夠描述内容點選量随曝光量變化趨勢的常微分方程(Ordinary Differential Equation, ODE)模型,即 pv-click-ctr (P2C) 模型,整體結構如圖3所示。

内容流量管理的關鍵技術:多任務保量優化算法實踐

一個内容由于自身因素和外部環境的限制,對應的點選量存在最大值或飽和值

内容流量管理的關鍵技術:多任務保量優化算法實踐

。當給定一個曝光量

内容流量管理的關鍵技術:多任務保量優化算法實踐

時,存在唯一的點選量

内容流量管理的關鍵技術:多任務保量優化算法實踐

和飽和度

内容流量管理的關鍵技術:多任務保量優化算法實踐

。對于一個點選量

内容流量管理的關鍵技術:多任務保量優化算法實踐

,飽和度

内容流量管理的關鍵技術:多任務保量優化算法實踐

定義為目前點選量和飽和值的差距與飽和值的比值,即

内容流量管理的關鍵技術:多任務保量優化算法實踐

對于任意一個内容,随着pv的增大,click飽和度減小,且機關pv帶來的click增量(簡稱click增量)與目前click比值呈下降趨勢。也就是說,click增量與飽和度存在正相關關系,可用下式表示:

内容流量管理的關鍵技術:多任務保量優化算法實踐

其中,

内容流量管理的關鍵技術:多任務保量優化算法實踐

為正相關系數。根據式(2),可以得到click随pv增長的常微分方程模型。

内容流量管理的關鍵技術:多任務保量優化算法實踐

對式(3)分離變量後兩端進行積分,可以得到

内容流量管理的關鍵技術:多任務保量優化算法實踐
内容流量管理的關鍵技術:多任務保量優化算法實踐

内容流量管理的關鍵技術:多任務保量優化算法實踐

分别為初始pv和click。

對于式子 (4) 中的參數

内容流量管理的關鍵技術:多任務保量優化算法實踐
内容流量管理的關鍵技術:多任務保量優化算法實踐

,可采用最小二乘法拟合。這裡首先需要對曆史pv和click資料以及參數進行過濾和預處理。

(a)樣本點過濾原則。分别在月曆史pv和click資料序列選取最大遞增子序列。

(b)參數預處理。由于點選量飽和值

内容流量管理的關鍵技術:多任務保量優化算法實踐

的數量級通常很大,而相關系數

内容流量管理的關鍵技術:多任務保量優化算法實踐

數量級通常很小,為了避免“大數吃小數”的現象,分别對這兩個參數進行資料變換,即:

内容流量管理的關鍵技術:多任務保量優化算法實踐

(c)樣本點預處理。為了避免最小二乘法在拟合參數時陷入局部最優,分别對曆史樣本(click值y,pv值x)進行資料變換,即:

内容流量管理的關鍵技術:多任務保量優化算法實踐

内容流量管理的關鍵技術:多任務保量優化算法實踐

。經過參數拟合過程,可得到單一内容pv-click函數關系。進而可進行pv-click-ctr預測,這裡可采用有限差分的數值解法預測,也可将資料點代入式子 (4) 預測。

三 保量模型&算法

基于上一節建立的P2C模型,本節任務是在各場景和抽屜曝光資源有限的情況下,給出每個内容近似最優的曝光量。整體方案流程如下圖:

内容流量管理的關鍵技術:多任務保量優化算法實踐

首先,基于pv-click-ctr預測的常微分方程 (ODE) 模型,針對内容池中每個内容,采用最小二乘拟合ODE中的兩個參數:click飽和值

内容流量管理的關鍵技術:多任務保量優化算法實踐

和click随pv的固有增長率

内容流量管理的關鍵技術:多任務保量優化算法實踐

。進而給出每個内容pv-click函數關系。

第二,基于給定的優化目标和限制條件,可建立pv配置設定的多目标非線性優化模型。在将業務問題抽象為數學模型之前,有必要對模型中的符号進行說明,如下所示。

内容流量管理的關鍵技術:多任務保量優化算法實踐
内容流量管理的關鍵技術:多任務保量優化算法實踐

上述模型的優化目标包含兩個:多場景vv最大化,内容池内容ctr方差最小。需要注意的是,這裡的ctr方差最小是曝光公平的一種形式化描述,用以平衡“過曝光”和“欠曝光”。限制條件分别表示了場景、抽屜、坑位和内容的曝光PV限制。由于目标函數我們采用數值方法求解,使得上述優化模型無法運用傳統的基于梯度的算法求解。而進化算法提供了一種解決方案,這裡選取遺傳算法(GA)求解。需要說明的是,GA中的适應值函數計算采用了P2C模型。

四 實驗結果

我們選取多個新熱内容,分别給出P2C模型的預測效果以及保量模型的離線效果。這裡的評估名額是均方根誤差 (RMSE) 和絕對誤差百分比 (APE)。分别采用P2C模型和平滑ctr方法[1]預測新熱内容的點選量。從表中可以看出P2C模型可以有效預測點選量,在RMSE方面優于平滑ctr方法。

内容流量管理的關鍵技術:多任務保量優化算法實踐
内容流量管理的關鍵技術:多任務保量優化算法實踐

線上實驗部分,我們建立了分桶實驗。基準桶采用人工政策保量;實驗桶采用本文提出的政策,實驗過程中關注和對比基準桶和實驗桶每日投放效果(CTR方差、政策在場景上的整體CTR等)。以下給出30天和7周的保量效果資料,與人工政策結果對比發現,保量政策在CTR方差和場景整體CTR方面均有不同程度的提升。特别地,在CTR方差方面,保量政策效果非常明顯,平均相對提升+50%。

内容流量管理的關鍵技術:多任務保量優化算法實踐
内容流量管理的關鍵技術:多任務保量優化算法實踐

五 總結 & 展望

内容保量政策旨在解決流量資源有限與需求過多之間的沖突,為各個内容提供一種優化的曝光量建議,進而使得各場景的曝光資源能夠産生更大的價值。本文針對新熱内容的多場景VV保量需求,提出了一種資源限制下的保量模型和算法架構,此架構整體由預測和優化兩階段構成。我們在部分場景進行了離線測試以及分桶實驗,實驗結果反映了本文政策的可行性和有效性。未來需要持續探索和完善的有很多方面,如PUV保量、保量冷啟動問題等。

本文章已被KDD2020錄用

Hang Lei, Yin Zhao, and Longjun Cai. 2020. Multi-objective Optimization for Guaranteed Delivery in Video Service Platform. In Proceedings of the 26th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD ’20), August 23–27, 2020, Virtual Event, CA, USA. ACM, New York, NY, USA, 9 pages.

https://doi.org/10.1145/3394486.3403352

參考文獻

[1]Xuerui Wang, Wei Li, Ying Cui, Ruofei Zhang, and Jianchang Mao. 2011. Click through rate estimation for rare events in online advertising. In Online multimedia advertising: Techniques and technologies. IGI Global, 1–12.

繼續閱讀