流量為王：收益最大化的混排機制

資訊流場景展示内容在實際業務場景中并不是單一的同類内容，可能有圖文、視訊等主場景資訊流内容，也會有廣告、商品等商業内容，同時，針對特殊場景還存在着引流入口的穿插。不同類型内容往往來自不同業務部門，有不同的業務目标上的訴求。如何針對多源内容，在現有推薦機制的基礎上，利用混排的方法，對流量實作二次分發，進而實作整體收益最大化是一個比較有挑戰的問題。

在實際的廣告推薦業務中，無論是LinkedIn原論文提到的廣告場景，還是知乎、抖音、快手等内容流廣告場景，都面臨着同樣的一個問題，在原始的營運流量或者推薦流量中，增加廣告流量、帶貨流量後，不同内容類型将如何呈現給使用者？

我們知道，不同的業務有着不同的目标導向，負責内容流的業務在意的可能是CTR和停留時長等名額，負責廣告的業務可能在意的是CTR名額，負責帶貨的業務更偏向于CVR、GMV等轉化名額。是以，兼顧各方需求的混排機制，在流量為王的時代，對于實作流量的價值轉化，是極其重要的。

如上圖所示，推薦流對内容的排序是一個單獨的流程，同時，廣告推薦也是單獨的排序流程，向不同的種子使用者得到的lookalike使用者展示不同的廣告。如果擴充到帶貨上，也是大同小異的。在實際業務中，往往不同的内容類型由不同的團隊負責，每個團隊都有自己一套召回、粗排、排序邏輯，乃至系統。

工業界推薦系統中，常用的召回政策有：

傳統召回方法：熱度召回，LBS，使用者标簽（興趣标簽、地理标簽、偏好标簽）召回，ItemCF，頻繁模式挖掘，二部圖挖掘等；
向量召回，各種Embedding（Word2vec、BERT、雙塔模型）通過Faiss快速計算相似度召回

同時，工業界推薦系統中，在Ranking階段，常用的模型如下：

Ranking相關綜述型總結可讀一下一些兩篇文章：<CTR預估系列煉丹入門手冊>和<CTR預估總結>

混排，在Matching和Ranking之後，比較常見的方法是通過計分公式，将需要考慮的不同類型的内容名額，進行統一的度量，用最後得分Score來進行流量配置設定。

解決混排問題，首先我們要通過可量化的方式将具體問題定義出來。混排問題可以定義為在保證A名額的前提下，最大化B名額。

混排除了不同類型的内容通過一定的方法進行最大利益化的展示之外。可能還存在着其他業務邏輯上的限制。比如，在内容流的推薦中，相同作者不能被連續幾屏進行推薦、相同類型的内容不能連續被推薦展示（廣告投放時，連續出現廣告會影響使用者的使用體驗）等。

論文中，出現的業務邏輯限制是任意兩個廣告之間在展示上間隔k個位置，具體的在下文的Gap Effect中具體讨論。

這種限制的存在，一方面是從使用者的體驗角度出發，保證推薦生态的良性運作；另一方面是從各項名額出發，過分的放大某一點，會導緻其他名額的下降，進而影響整個流量場中的整體收益。

放廣告的位置間隔，在混排機制中是不得不去考慮的問題。從上圖我們可以看到，随着Gap位置的增加CTR的變化情況。

在設計混排機制時，比如流量帶貨推薦場景下，需要考慮到CVR轉化率不能低于某個值，否則會影響業務收入；當然，如果是滿屏的帶貨，不考慮兩個帶貨位置間的gap，使用者在内容流上的CTR和停留時長會變得異常難看，甚至會增加流失。

轉換形式可得原問題：

原問題的拉格朗日函數：

流量為王：收益最大化的混排機制

繼續閱讀

Cloud Studio初體驗

spark/scala關于【資源檔案】加載方法概述外部檔案加載方案測試資源檔案打包入jar包中小結

使用 ctypes 進行 Python 和 C 的混合程式設計

【python】【資料處理】畫多元資料分布圖

NOSQL安全攻擊

mybatis_入門程式Mybatis入門

AOP程式設計_Android優雅權限架構(1)概念基礎，2021金三銀四前言正文大綱正文

Effective Java 8:通用程式設計

OOM三種類型

工廠模式-三種類型

【python】netconf協定對接管理裝置

「Python 網絡自動化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 網絡裝置

【遞歸】高效率求2的n次幂

win10本地scala和spark安裝安裝scala安裝spark

scala (3) Function 和 Method

在python中建立excel并寫入