孫曉燕, 聶 鑫, 暴 琳, 陳 楊
(中國礦業大學 信息與控制工程學院,江蘇 徐州 221008)
在計算廣告領域衡量廣告投放效果時,通常通過曝光、點擊和轉化等環節來衡量。大多數廣告系統受廣告效果數據回流的限制,往往將曝光或點擊率(click through rate, CTR)作為廣告投放效果的衡量標準[1-2]。而實質上,廣告的轉化數據(conversion rate, CVR)在衡量廣告投放效果、廣告費用結算和廣告投放排序中有重要作用。因此,轉化率預估(conversion rate prediction, CRP)已成為計算廣告領域的重要研究內容之一[3]。移動APP轉化率預估問題具有維度高、量大、稀疏、特征間高度交互等特點[4-5],如何使基于大量高維度異構的結構型數據自動獲取特征間的交互關系,并對其進行有效融合和抽取,成為實現移動APP精準轉化率預估的關鍵問題。
特征抽取主要分為兩類,一是基于人工經驗的手工特征提取策略,二是基于學習機制的特征自動獲取方法[6-7]。手工特征提取是一項繁雜的工作,需要專家熟悉相關的領域知識,而基于用戶經驗的手工特征提取,極難充分發掘特征之間的交互關系,存在大量有效特征組合無法被專家識別的問題。此外,手工特征提取可能導致特征維度爆炸,如常用的Poly-2模型[8-9],該模型采用直接對二階特征組合建模來學習特征之間的內在交互關系,這種方式提取的特征數量與原數據所有特征數量乘積相關,易引起特征爆炸,且此類特征組合方式尚未考慮高階特征交互關系。
基于學習機制的特征自動獲取又可分為顯式特征交互關系提取,如基于貪心算法和搜索算法的研究[10-11];……