楊永瑞
摘? 要:現階段,我國電子商務平臺的快速發展為人們的商品選購提供了極大的便利,但在商品種類、總量持續增加的影響下,消費者如何在最短時間內選擇自己心儀的商品,就成為了電商平臺關注的重點問題。廣告推薦系統的出現恰好滿足了消費者和電商平臺的需求,廣告推薦系統需要在精準定位的用戶群體的基礎上推薦其感興趣的廣告,數據挖掘技術的引入可以有效解決這一問題。本文基于廣告推薦系統的概述,結合傳統的廣告分類模型弊端分析,探討了數據挖掘下的廣告推薦系統設計,并深刻研究了今后數據挖掘廣告推薦系統面對的問題及研究方向。
關鍵詞:數據挖掘;廣告推薦;系統設計;問題研究
前言:隨著我國電子商務網站的持續發展,諸如文本、圖片這種非結構化的數據占據了網站數據的絕大部分。為了更好的實現針對性的廣告推薦,電商網站必須要針對這種非結構化數據進行全方位的挖掘。作為數據挖掘技術重要組成部分的文本挖掘,能夠從原始的文本中提取相應的知識,并且能夠對于一些形式不確定的半結構以及非結構化的數據進行有效的處理。本文通過研究、探討以數據挖掘作為基礎的廣告推薦系統的設計,以便為今后網絡電商網站的精準化廣告推薦提供借鑒和參考。
1、廣告推薦系統概述
廣告推薦系統作為現階段推薦系統的典型應用成果代表之一,也是現階段互聯網廣告的重要表現形式[1]。各大電子商務網站都開始借助廣告推薦系統對自己的產品進行推廣,諸如阿里巴巴、亞馬遜等國內外知名的公司通過合理的應用數據挖掘以及相關的程序算法,將用戶的歷史數據和用戶的消費偏好進行深刻的挖掘以及比較,真正將用戶可能感興趣以及觸發購買潛行為的商品進行了精準預測。這里所提到的廣告推薦系統實際上是憑借各種技術手段實施廣告交易和管理的一種廣告形態,又或者可以將之視為一種利用算法和技術精準的確定產品目標客戶,并為其提供廣告推薦,有效提供商品信息的一種方法。以數據挖掘技術作為基礎的廣告推進系統,能夠對用戶的記錄、點擊、評分等信息進行科學有效的記錄,從而對各種產品的需求進行預測,最終為用戶推薦瀏覽可能性最大的廣告,幫助電商網站實現廣告投放效益最大化的目標。
2、傳統的廣告分類模型弊端分析
廣告推薦系統應用的最終目標就是確保能夠在特定情景下預測用戶對于不同廣告的點擊率,并推送用戶最大可能點擊的商品廣告。但實際上,之前傳統的廣告分類模型無法直接通過模型的建立對于廣告的點擊率進行計算。在之前數據挖掘的廣告推薦系統中需要優先判斷在特定情況,用戶是否會對廣告進行點擊,可以憑借二值分類的方法建立一個模型,并從原始的廣告日志數據轉化為各種屬性的分類數據集[2]。
在之前原始的廣告日志數據中,點擊數據是展示數據內部的一個子集,點擊數據中的實例可以稱為整理,而只在數據展示中出現的則可以成為負例[3]。在具體運用的過程中,可以將所有的正例和負例分別添加1和0的標記。在這種情況下,就能夠得到一個包含0或者1帶有標記屬性的轉化數據結合,隨后可以將這一標記屬性以此為基礎學習二值分類器。最終建立廣告推薦系統的目標是為了得到廣告的點擊率以及用戶在情景下的具體廣告排序,并以這個排序作為基礎得到最終的推薦結果。從某種程度上看,分類模型能夠完成這一任務,但因為部分分類算法得到的輸出結果并非是簡單的0或者1,同時可以得到實例結果為1的概率,換言之,就是用戶在特定情況下有可能會點擊廣告的具體概率,也就是廣告推薦系統所需要的廣告點擊率數值。
3、以數據挖掘為基礎的廣告推薦系統設計研究
3.1推薦系統的總體體系結構設計分析
作為電商平臺重要內容的廣告系統推薦,人們在瀏覽電商平臺時,通常都會收到有關產品介紹的文字和圖片,如何能夠在多種產品的圖片和文字中尋找到用戶想要購買的產品難度相對較大,廣告推薦系統能夠在吸引顧客的同時為其提供感興趣的商品。目前我國的電商平臺系統都是以B/S結構作為基礎,通過使用數據挖掘中的聚類技術能夠有效組建廣告推薦系統,具體又可以分為離線挖掘和在線推薦兩個組成部分。電商平臺中的廣告推薦系統建立的初衷是為客戶提供各種個性化的廣告服務,由于電商平臺中的客戶訪問數據處于認知數據增加的狀態,如何針對客戶的瀏覽信息使用在線挖掘的模式,這種復雜的運算過程很有可能會帶來大量的時間成本投入,并且這種大規模的預算也有可能會帶來系統癱瘓的問題。在具體數據處理的過程中,需要采用離線挖掘的方式。
離線挖掘這一部分具體包括了數據的采集、預處理、挖掘以及存放挖掘數據結果幾部分。以數據挖掘作為基礎的廣告推薦系統中,只要用戶登錄電商平臺開始商品信息瀏覽之后,系統便會自覺將商品瀏覽記錄保存在數據集中,因為這些數據集中的記錄尚未進行處理,在系統獲得用戶的商品瀏覽記錄信息之后,需要進行全方位的挖掘,并在這一步操作之前對其進行預先處理,具體包括了分詞、去停用詞以及使用特定方式進行計算數據表示。在經過處理之后,數據可以進行聚類操作并將之儲存到對應的用戶記錄數據庫中。
在廣告推薦系統的在線推薦環節運轉中,電商平臺任何一個商品的廣告都會存入到商品的后臺數據庫中,并且經過離線挖掘處理之后的數據結果集合會分類存儲到用戶信息瀏覽數據庫中,只需要系統抓取其中的關鍵詞在與商品數據庫中商品的關鍵字匹配之后,如果相似度大于設置的閾值,則意味著用戶對于電商發布的廣告位置有著較高的興趣,可以將該商品廣告進行推送。
3.2推薦系統的設計分析
結合我國電商平臺對于廣告推薦系統的個性化需求看來,其總體的模塊可以分為廣告、用戶、管理員三個部分。廣告模塊作為整個數據挖掘廣告推進系統的核心,電商平臺可以發布多條廣告讓用戶進行瀏覽,或者可以對廣告內容進行增加刪除和修改[4]。在這一模塊上系統需要有效獲取用戶的商品瀏覽記錄,需要提供用于用戶瀏覽的足夠的廣告。在獲取到用戶記錄并進行處理之后,需要發布與之匹配的廣告內容。用戶模塊則是針對系統所訪問到的各種用戶信息瀏覽記錄進行分析和處理的模塊,并以此作為基礎,發掘用戶對于電商平臺中感興趣的產品。這一功能模塊需要在運轉的過程中,將各個用戶登錄之后的商品瀏覽記錄進行保存,并經過預處理之后,使用聚類算法進行相似用戶處理。為了保障廣告推薦系統始終處于一種穩定的運行狀態,管理員模塊的設計可以針對網站用戶的管理廣告信息進行管理,并同步進行廣告內容的驗證和刪除等操作。
4、以數據挖掘為基礎的廣告推薦系統存在的問題及今后的研究方向分析
4.1廣告推薦面臨的時效性問題
以數據挖掘作為技術所形成的廣告推薦系統必須要考慮到廣告推薦的時效性問題,需要結合用戶需求的變化以及實踐上下文之間聯系的全方位考慮,換言之,廣告宣傳的時效性完全是由用戶需求的時效性決定的[5]。在一定時間階段內的用戶對于產品需求和偏好會出現一定程度的變化。目前數據挖掘算法生成的廣告推薦系統存在著明顯的廣告推薦時效性問題,比如在用戶搜索計算機商品信息并購買之后,在其產品購買之后的一段時間的電商平臺或網站依舊會為客戶推送有關計算機產品的相關廣告,這會使得用戶對于商品以及電商平臺產生一種抵觸的情緒。
與其他專業領域的時效性相比,廣告推薦系統的時效性存在著明顯地不同。新聞行業的新聞信息推薦時效性是以時間作為節點。最大的特點是與時間上下文之間保持著較為緊密的關聯,超過一段時間之后的新聞發布對于用戶來說毫無意義。廣告推薦系統應用的最終目標是為了激發用戶對于商品的購買行為,需要立足于用戶和廣告產品的角度來掌握廣告推薦的時效性。從用戶層面看來,廣告推薦系統需要以用戶行為變化作為出發點,在獲續商品需求變化的同時即時進行,反應。從廣告商品角度看來,廣告推薦系統需要結合產品推出的時間以及廣告發布的時間等判斷產品是滿足用戶現階段的需求。
在這種情形下,系統是否能夠為用戶提供即時商品廣告推薦結果,并同時考慮用戶的產品變化是今后數據挖掘算法基礎下廣告推進系統重要的研究方向。今后的廣告推薦系統不但需要獲取用戶偏好的動態變化特征,并且也需要在系統設計層面進行轉型,可以借助Hadoop建立完善的分布式推進系統,進一步強化用戶相關偏好以及信息瀏覽數據的處理能力和效率,以便提高廣告推薦系統的靈活性和多樣性。
4.2用戶個人隱私的安全問題
在數據挖掘算法基礎上形成的廣告推薦系統,在應用過程中同樣也引發了有關消費者個人隱私和數據安全方面的問題。結合近幾年國內外電商平臺的發展看來,用戶在門戶網站和金融公司注冊時的個人信息出現了大量暴露以及濫用的問題。以目前廣告推薦系統中所用的推薦技術看來,通常都需要對用戶的歷史信息進行調用和分析。即便社會化網絡這種對于歷史信息依賴度不強的推薦技術方式,也需要針對用戶的社會關系、地理位置等信息進行訪問,這些信息同樣也屬于用戶的個人隱私。數據的隱私處理使得廣告推薦能夠利用的數據量有所削減,對于廣告推薦系統的最終效果會產生影響。在今后數據挖掘算法下的廣告推薦系統應用中,想要更好的提高用戶個人隱私的保護程度,不但要保證推薦系統能夠有效的保護用戶的隱私信息不被他人過度訪問,同時也需要緩解因為數據隱私處理對最終推薦結果產生的影響。在今后廣告推薦系統發展的過程中,相關專家和學者需要高度關注廣告推薦系統隱私保護機制的建立。
總結
廣告推薦系統的建立和應用是電商平臺能夠結合用戶產品信息的瀏覽以及需求偏好等進行精準化購物推薦的有效途徑?,F階段,我國電商網站儲存的文本圖片等資料可以憑借數據挖掘中的文本挖掘方法進行收集、整理、記錄以及分析實現廣告的精準化投放,但卻面臨著用戶的隱私安全以及廣告推薦的時效性問題,需要相關專家和學者在今后廣告推薦系統持續發展的過程中,重視系統的全新設計以及隱私保護機制的研究,做到在實現廣告推薦系統精準化廣告投放的同時,最大程度保障個人隱私安全。
參考文獻
[1]張玉潔,董政,孟祥武.個性化廣告推薦系統及其應用研究[J].計算機學報,2021,44(03):531-563.
[2]張鑫,李競一,郭宇萱,陳志豪,朱建方.基于數據挖掘的模擬經營策略分析——以“手環制造企業”為例[J].智庫時代,2019(38):67+70.
[3]李雙稀,王強,嚴梓歡,李超.基于人臉識別的商業大數據分析[J].電子世界,2016(22):38.DOI:10.19353/j.cnki.dzsj.2016.22.025.
[4]陳航.大數據對商業營銷變革的影響分析[J].中國統計,2016(06):21-22.
[5]于海平,林曉麗,劉會超.基于數據挖掘的移動廣告個性化推薦研究[J].計算機技術與發展,2016,24(08):234-237.