999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于查詢日志的消費意圖挖掘分析

2016-04-18 06:51:08孫麗霞山東外事翻譯職業學院
電子制作 2016年20期
關鍵詞:分類特征用戶

孫麗霞 山東外事翻譯職業學院

基于查詢日志的消費意圖挖掘分析

孫麗霞 山東外事翻譯職業學院

隨著互聯網的普及,在線廣告成為人們生活中不可缺少的一部分。而用戶在搜索行為中包含了大量的內容豐富的信息,這些信息中有相當數量都表現了用戶的消費意圖。本文在進行了充分的預處理后,在數據上進行特征的分析和抽取, 利用SVM分類器結合抽取出的特征進行測試,提出對用戶搜索的消費意圖具有較高的區分能力的方法。

消費意圖識別;二元分類模型;SVM

引言

在網絡上投放廣告已經成為了一種十分普遍,十分重要,收益簡單高效的廣告投放方式。在我們點擊網頁的時候,不經意間就能看到各種各樣的廣告。隨著在線廣告的不斷普及,越來越多的銷售商希望通過在線廣告來提升自己產品的知名度,提高自己產品的銷量。這樣一來,搜索引擎便成為了銷售商進行產品推銷的一個重要媒介。一些搜索引擎,如百度,搜狗等,都會記錄用戶的訪問信息,例如,百度的查詢日志就由用戶搜索語句、用戶點擊標題、用戶點擊URL三部分組成。其中,有些信息顯示了用戶意圖是期望購買某類產品的內容。消費對象能更好地反映出用戶的消費興趣,真實的消費需求和消費類別。

1.構建消費意圖二元分類系統

第一步需要準確確定有意圖或者無意圖一個標準,這樣才能判斷最終得到的系統給出的結果是不是正確的。首先,需要得到用戶的真實查詢語句,在大量的,真實的語料上進行分析。準確的判斷出用戶的一條查詢究竟是有意圖的還是無意圖的。

在確定了標準之后,需要根據這些數據抽取特征。所謂特征,也就是一個規則,這個規則可以較為有效的分辨出用戶的查詢是有意圖或者無意圖。在多個特征的基礎上,下一步就是確定如何利用這多個特征進行分類,因而就需要找到一個合適的分類模型,然后利用抽取出的多維特征,在數據上將每一條語句表示成一個由多個特征組成的向量,然后把這個向量交給分類器去處理。分類器則會計算每一個特征對這條語句是否是有意圖查詢的影響程度。進而計算出每一個特征影響的權重,當一個新的查詢到來的時候,可以利用分類器訓練出來的模型進行測試,進而得出結果,判斷出該條查詢是否具有消費意圖。

LibSvm是臺灣大學林智仁(Lin Chih-Jen)教授等開發設計的一個簡單、易于使用和快速有效的SVM模式識別與回歸的軟件包,他不但提供了編譯好的可在Windows系列系統的執行文件,還提供了源代碼,方便改進、修改以及在其它操作系統上應用;該軟件對SVM所涉及的參數調節相對比較少,提供了很多的默認參數,利用這些默認參數可以解決很多問題;并提供了交互檢驗(Cross Validation)的功能。該軟件可以解決C-SVM、ν-SVM、ε-SVR和ν-SVR等問題,包括基于一對一算法的多類模式識別問題。

SVM是最常用的二元分類器之一。支持向量機SVM作為一種可訓練的機器學習方法,依靠小樣本學習后的模型參數進行導航星提取,可以得到分布均勻且恒星數量大為減少的導航星表。

SVM分類器即可以解決線性分類問題,也可以解決非線性分類問題。在解決非線性分類問題上,SVM采用了核函數的方法,可以將低維空間的非線性問題映射為高維空間的線性問題,并且幾乎不增加計算復雜度,在一定程度上避免了其他機器學習算法的“維度災難”的問題。SVM分類器中常用的幾種核函數包括:(1)線性核函數,如公式(1-1)所示;(2)多項式核函數,如公式(1-2)所示;(3)徑向基函數,如公式(1-3)所示;(4)二層神經網絡核函數,如公式(1-4)所示。

如果想對消費意圖進行準確的分類,首先就要有一個高質量的初始語料庫。本數據來源于百度2012年3月份的部分用戶查詢數據。數據由用戶查詢語句、用戶點擊標題、用戶點擊URL三部分組成。

用戶查詢語句:用戶在搜索框中輸入的內容

用戶點擊標題:用戶點擊的網頁對應的title

用戶點擊URL:用戶點擊的網頁對應的URL

由于人們對消費意圖這一概念比較模糊,而且對于不同的人,會有不同的理解,所以在這里嚴格定義消費意圖的概念如下:

(1)用戶搜索語句或點擊標題中有明確的購買意向,如 “求推薦一部性價比高的手機”這條語料都很明確的具有消費意圖,指出了消費對象,并出現了購買觸發詞,如“推薦”“求”等。

(2)明確的指出了購買意向,但沒有觸發詞“水貨智能機,1000元以內”這類數據雖然沒有出現購買意愿詞,但是仍然可以認為這些語料具有顯式消費意圖。

(3)用戶點擊網站的標題具有消費意圖傾向“三星Galaxy S6 報價_中關村在線”

這類數據可能用戶只搜索了“三星Galaxy s6”,單單從這個搜索中,我們并不能確定該查詢具有消費意圖,但是從用戶的點擊上可知其應當具有消費傾向。

(4)用戶點擊的URL中包含電商網站

如用戶搜索“手機”后,點擊淘寶網,僅僅通過搜索詞并不能看出用戶具有消費意圖,但是通過用戶點擊的URL:http://www. taobao.com/,可以判定用戶的點擊行為具有消費意圖。

2.結語

一個消費意圖二元分類系統,主要針對用戶的搜索數據,對數據進行預處理,進而在數據上進行特征的分析和抽取,最終利用特征選擇模塊,獲得了最優特征。

[1]張鴻, 莊越挺, 吳飛. 一種基于內容相關性的跨媒體檢索方法. 計算機學報. 2010, 31(5): 820-826.

[2]H. K. Dai, L. Zhao, Z. Nie, J.-R. Wen, L. Wang, and Y. Li. Detecting online commercial intention (oci). In Proc. of WWW '06, pages 829-837, 2006.

[3]趙妍妍, 秦兵, 劉挺. 文本情感分析. 軟件學報. 2010, 21(8):1834-1848.

[4]劉非凡, 趙軍, 呂碧波, 徐波, 于浩, 夏迎炬. 面向商務信息抽取的產品命名實體識別研究. 中文信息學報. 2006, 20(1): 7-13.

孫麗霞,女,1982年出生,民族∶漢,籍貫∶山東省乳山市人,學歷∶本科,職稱∶講師,主要研究方向∶計算機軟件工程。

猜你喜歡
分類特征用戶
分類算一算
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
抓住特征巧觀察
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
主站蜘蛛池模板: 潮喷在线无码白浆| 免费在线成人网| 好吊妞欧美视频免费| 五月天久久婷婷| 国内精品视频在线| 亚洲欧洲日产国码无码av喷潮| 欧美精品另类| 色窝窝免费一区二区三区 | 国产成人精品亚洲77美色| 亚洲无线观看| 激情综合网激情综合| 激情成人综合网| 爱色欧美亚洲综合图区| 伊人激情久久综合中文字幕| 亚洲精品免费网站| 国产成人精品日本亚洲77美色| 婷婷五月在线| 夜夜操国产| 国产伦精品一区二区三区视频优播 | 又爽又黄又无遮挡网站| 91精品啪在线观看国产| 伊人久热这里只有精品视频99| 国产香蕉97碰碰视频VA碰碰看| 亚洲国产AV无码综合原创| 午夜福利亚洲精品| 女人18毛片一级毛片在线 | 91九色视频网| 欧美一级高清片欧美国产欧美| 一级香蕉视频在线观看| 熟妇丰满人妻| 国产亚洲精品精品精品| 国产精品毛片一区视频播| 亚洲性一区| 91蜜芽尤物福利在线观看| 国产欧美日韩另类| 人禽伦免费交视频网页播放| 在线观看av永久| 婷婷中文在线| 99er这里只有精品| 经典三级久久| 国产精品yjizz视频网一二区| 爆操波多野结衣| 成人免费午夜视频| 在线网站18禁| 波多野结衣一级毛片| 欧美a在线| 国产网站黄| 国产在线八区| 久久久久久久久18禁秘| 国产一区二区三区在线观看视频| 国产69精品久久久久妇女| 亚洲精品无码成人片在线观看 | 亚洲精品无码日韩国产不卡| 性欧美精品xxxx| 亚洲精品视频免费观看| 欧美一区二区福利视频| 国产成人调教在线视频| 十八禁美女裸体网站| 亚洲香蕉在线| 国产麻豆va精品视频| 综合色88| 色综合久久综合网| 亚洲欧美人成人让影院| 亚洲伊人天堂| 国模私拍一区二区三区| 欧美日韩高清在线| 五月天久久婷婷| 国产极品美女在线观看| 欧美日韩精品一区二区视频| 人妻丰满熟妇啪啪| 国内精品久久久久鸭| 国产九九精品视频| 91精品小视频| 久久精品国产国语对白| 精品视频福利| 高潮爽到爆的喷水女主播视频| 国产激情在线视频| 中国国语毛片免费观看视频| 欧美精品二区| 夜色爽爽影院18禁妓女影院| 亚洲中文字幕手机在线第一页| 免费一级毛片在线播放傲雪网 |