999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于興趣推薦算法的短視頻傳播模式研究

2022-05-18 06:39:50任立國
江西電力 2022年4期
關鍵詞:受眾利用特征

任立國,張 熇,朱 桂

(1.國家電網公司客戶服務中心黨委黨建部(黨委宣傳部),天津 300309;2.國網智聯電商有限責任公司南方交付部,天津 300000)

0 引言

推薦算法可分為:1)內容分析推薦算法。利用受眾對觀看內容的停留時間和認同(包括但不限于點贊、轉發、評論等)操作,將受眾貼上標簽,系統將會對標簽標記用戶推送類似關聯性很大的ITEM;2)協同過濾算法。將單獨個人標簽關聯的ITEM 推薦給自己的密切聯系人;3)混合推薦算法。融合了“內容分析算法”和“協同過濾算法”以加權或者串、并聯等方式,利機械學習進行建模[1-2]。

其算法各具特色,“內容分析推薦算法”與其他兩種算法不同點在于,可減少ITEM 的起步時間,避免因某些ITEM 沒有被瀏覽過而消殺。而弊端在于此方法重復性強,會反復推薦同一屬性內容。無論以何種算法建模,我們都需要用到特征工程和、模型學習。

1 特征工程

現有短視頻APP 中,一個完整的作品會有賬號、視頻、音頻、文案組成,利用NLP,CV,AUDIO 等學習模型,來標記其中的差異,讓每一個單獨的個體具備其自己的特征標簽,這樣就形成了一對一映射的ITEM特征。在受眾使用的過程中,其注冊的個人信息會形成用戶基本特征信息,受眾在使用過程中,觀看視頻的時長,何時點贊、轉發、評論等操作,會形成用戶基本交互信息,一般我們抽取并標簽的交互信息有三個部分,分別是用戶基本特征信息(user_ID,user_CITY),視頻特征標簽(item_ID,item_CITY,author,duration_time,song)和用戶基本交互信息(did,channel)。

利用我們標記的標簽信息,利用FM 算法和自主學習模型,可以更多的發現潛在關系(用戶興趣方向、目標年齡與興趣關系、目標性別興趣差異等)。

2 算法介紹

上述算法主要是挖掘潛在的交互特征,數據信息為:x特征值;y是輸出結果;n是相互交互層級。每提升一層級合數越復雜。一般來說特征值分為離散和稠密兩種特征,category 的特征需要one-hot 編碼,其相互交互后,會產生高維度的特征,一般的服務器處理能力較低,會產生較多硬件問題。但在實驗環節中,一般維度會控制n<2的范圍內。

3 特征類別

一般我們會將受眾的瀏覽記錄、轉發、點贊交互信息記錄下來,按照時間順序排布生成的有利于映射歷史數據的信息我們稱為時間信息,這類數據信息可以計算受眾之后的行為,我們把這類可以利用全部歷史數據來推測未來的行為特征信息統稱為全局特征,利用一小部分歷史數據來推測未來行為的特征信息統稱為局部特征。

3.1 整體特征

整體特征從SVD 解析、Statistics 特征、TIME 特征等進行特征的匯總。

SVD解析一般是特征的降維和主要元素的解析,運用SVD可以把維度較高的特征進行降維,再將降維后的數據在模型中進行反復計算、測試和優化,例如用戶的ITEM,我們可以創建一個ITEM矩陣,其中的元素則表示此受眾是否和ITEM之間有無關系,有關系則記錄為1,無關則記錄為0,我們將這個不稠密的高緯度矩陣,利用SVD分析,收集前n個主要數據生成一個較稠密的特征,在模型中受訓,可以減少大量的算力。

Statistics 特征中一般我們會分解為U-item,Uauthor,U-title 后進行特征的統計,基本統計方式有方差、條件概率等。(P(did|uid),P(channel|uid),P(did|item_id),P(channel|item_id),P(item_author|uid),P(item_city|uid),P(uid_city|item_id))

TIME 特征是這些特征是基于用戶的觀看時間節點、用戶的觀看頻次等數據進行深度分析,而產生的用戶時間維度的興趣關聯。

3.2 局部特征

局部特征(見圖1)是把歷史數據按照時間排序進行劃分,未劃分的數據視作訓練數據,利用以前的數據排列成特征組合,再將訓練數據的元素按照時間排序進行歸納分析,前25%的數據當作訓練數據,剩下的作為以前的數據,過程中可再次進行劃分來優化模型,按照10%的數據依次劃分。根據馬爾可夫理論,當前的狀態一般只和前面一個狀態相關,這也是為何如此劃分數據集的依據。

圖1 特征圖

在上述過程里mean 和regression 只針對目標finish 和like 進行計算,這些特征只記錄了用戶的歷史行為,count_from_past,count,count_from_future,這些特征從時間角度上統計了用戶從歷史-現在-未來的行為。matrix_factorization 特征是通過FM 算法計算的只利用user和item信息的一個特征,這樣即利用了fm的信息,計算量又小。詳見圖2、圖3。

圖2 信息流程

圖3 邏輯流程

4 結語

完成特征的構建我們就可以讓機器學習的算法來進行模型的重復訓練。一般算法有基于boost算法的決策樹和dnn 算法。針對不同特征使用不同的訓練器訓練流程,feature0 代表局部特征,feature1 代表全局特征,最后將兩個框架的結果進行融合。由于整體特征在like 任務的表現一直不理想,所以基于該特征的xdeepfm 并未進行實驗。詳細的參數選擇和特征選擇后,Final最終提交public結果。

猜你喜歡
受眾利用特征
利用min{a,b}的積分表示解決一類絕對值不等式
中等數學(2022年2期)2022-06-05 07:10:50
利用一半進行移多補少
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
利用數的分解來思考
Roommate is necessary when far away from home
用創新表達“連接”受眾
傳媒評論(2018年6期)2018-08-29 01:14:40
抓住特征巧觀察
用心感動受眾
新聞傳播(2016年11期)2016-07-10 12:04:01
媒體敘事需要受眾認同
新聞傳播(2016年14期)2016-07-10 10:22:51
主站蜘蛛池模板: 在线五月婷婷| 亚洲欧美日韩成人在线| 波多野结衣一区二区三区四区视频 | 久久熟女AV| 重口调教一区二区视频| 亚洲成AV人手机在线观看网站| 欧美久久网| 免费亚洲成人| 第九色区aⅴ天堂久久香| 久久伊人操| 九九免费观看全部免费视频| 日韩欧美中文在线| 精品成人一区二区三区电影| 国产精品成人一区二区不卡| 亚洲欧美日韩成人高清在线一区| 亚洲无码A视频在线| 国产精品自拍露脸视频 | 亚洲国产精品日韩av专区| 成年A级毛片| 亚洲有码在线播放| 中国特黄美女一级视频| 高清不卡毛片| 国产欧美视频综合二区| 在线视频精品一区| 亚洲欧美不卡| 另类欧美日韩| 亚洲男人天堂久久| 亚洲人成网站在线播放2019| 久久精品人人做人人爽电影蜜月| 波多野结衣第一页| 久久久久人妻一区精品色奶水| 国产高清在线精品一区二区三区 | 亚洲狼网站狼狼鲁亚洲下载| 久久性妇女精品免费| 亚洲欧美一级一级a| 日韩欧美成人高清在线观看| 第九色区aⅴ天堂久久香| 久久久久久午夜精品| 欧亚日韩Av| 国产欧美精品专区一区二区| 97视频免费看| 免费黄色国产视频| a级毛片一区二区免费视频| 91免费国产高清观看| 久久婷婷五月综合色一区二区| 中国一级特黄视频| 国产成人a毛片在线| 伊人网址在线| 成人免费一区二区三区| 亚洲国产欧美自拍| 亚洲第一黄色网| 亚洲成人网在线观看| 免费高清自慰一区二区三区| 亚洲床戏一区| 久久人午夜亚洲精品无码区| 国产成人亚洲精品色欲AV| 中文字幕久久波多野结衣| 亚洲伊人久久精品影院| 亚洲天堂视频网站| 国产成在线观看免费视频| 福利小视频在线播放| 国产经典免费播放视频| 青青草综合网| 精品无码一区二区在线观看| 精品国产免费人成在线观看| 国产日韩av在线播放| 国产精品男人的天堂| 亚洲精品第一页不卡| 高清码无在线看| 国产香蕉97碰碰视频VA碰碰看| 狠狠色综合网| 亚洲人成网站日本片| 久久久噜噜噜| 日韩午夜片| 一区二区无码在线视频| 日韩不卡高清视频| 呦视频在线一区二区三区| 激情无码字幕综合| aⅴ免费在线观看| 久久久波多野结衣av一区二区| 欧美日韩中文国产| 美女国产在线|