999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于評論數(shù)據(jù)的電子商務網(wǎng)站口碑分析方法

2015-05-30 01:19:12胡瑩
環(huán)球市場信息導報 2015年9期
關鍵詞:特征用戶評價

胡瑩

隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)名的信息發(fā)表自由度提高,相關信息的傳播速度達到幾何級數(shù)傳播,其形成的力量對于公司的品牌形象及產(chǎn)品的口碑發(fā)揮著非常大的影響。網(wǎng)絡上用戶的口碑及意見反饋,是企業(yè)窺探競爭對手產(chǎn)品弱點以及發(fā)現(xiàn)新的用戶需求與喜好的豐富來源。如何合理的收集消費者或潛在消費者的口碑信息,對企業(yè)品牌維護、消費者調(diào)研、市場選擇都有很重要的幫助。因此,本文提出一種電商網(wǎng)站的網(wǎng)絡口碑分析方法,為企業(yè)分析網(wǎng)站的口碑評論得出依據(jù)。

隨著Web2.0以及新興媒體的興起,互聯(lián)網(wǎng)自媒體的數(shù)量龐大,發(fā)表信息極度自由,相關信息傳播速度達到幾何級數(shù)傳播,其形成的力量對于公司的品牌形象及產(chǎn)品的口碑正發(fā)揮著越來越大的影響。網(wǎng)絡上用戶的評論中的贊揚、喜好、抱怨等信息蘊含著巨大的商機,它是企業(yè)窺探競爭對手產(chǎn)品弱點以及發(fā)現(xiàn)新的用戶需求與喜好的豐富來源。這些信息對于公關部門、品牌部門、研發(fā)部門深入了解用戶狀態(tài)與心理非常有幫助。網(wǎng)絡口碑傳播具有匿名性、速度快、范圍大、持續(xù)力強、傳播渠道多元化、傳播效果容易測量等特點。網(wǎng)絡口碑在很大程度上也是現(xiàn)實口碑的一種反映,無論是正面評價還是負面評價都可以被迅速傳播,而其中的負面評價更會被迅速放大。好的口碑傳播可以推動企業(yè)的產(chǎn)品銷售,而負面口碑的傳播可以迅速導致企業(yè)的危機。

如何合理的收集消費者或潛在消費者的口碑信息,對企業(yè)品牌維護、消費者調(diào)研、市場選擇都有很重要的幫助。因此,本文提出一種電商網(wǎng)站的網(wǎng)絡口碑分析方法,為企業(yè)分析網(wǎng)站的口碑評論得出依據(jù)。

實現(xiàn)方式

技術(shù)特點。本方法采用了自然語音處理NLP(分詞,詞法分析,句法分析)、特征數(shù)據(jù)挖掘、情感分析、觀點詞提取等數(shù)據(jù)分析處理技術(shù)。

本方法提出的通過產(chǎn)品特征數(shù)據(jù)挖掘方法(分詞與詞性標注、Apriori算法提取高頻詞匯、然后利用KNN算法進行分類聚合和裁剪)可以準確的提取產(chǎn)品數(shù)據(jù)特征數(shù)據(jù)。創(chuàng)新性的提出把特征數(shù)據(jù)挖掘與中文情感分析技術(shù)相結(jié)合,準確獲取產(chǎn)品特征數(shù)據(jù),并分析產(chǎn)品特征評價的傾向性,進一步提升產(chǎn)品網(wǎng)絡口碑分析的實用性和針對性。

實現(xiàn)說明

本方法的數(shù)據(jù)處理流程如下圖所示,包括分詞與詞性標注、基于Apriori算法獲取頻繁特征項集、基于KNN進行聚類和裁剪 、挖掘用戶觀點及情感傾向性、提取代表性觀點詞與評價短語、評價短語詞頻權(quán)重計算等主要步驟。

采集大量網(wǎng)絡評論數(shù)據(jù),用IKAnalyzer分詞工具對數(shù)據(jù)進行分詞和詞性標注,提取出其中的名詞及名詞短語。

輸入一批小米3手機評論:“用了2天才來評價,感覺不錯,性價比高,不足手機發(fā)熱嚴重,系統(tǒng)內(nèi)存控制不行”;“已經(jīng)收到貨,物流很給力啊,目前正在使用,感覺還不錯,日后追加評價”;“很好,超出我的想象,另外蓮米的服務超贊,只是物流有點慢,轉(zhuǎn)到ems就超慢,八天時間才收到貨”;“打電話時通話不順暢,信號差,設置2G后正常了,不知是運營商的問題,還是手機的問題,想退換貨又很糾結(jié),電池也是一天一充”;“性價比比較高,像素貌似沒有1300萬,手機用用還可以,不卡,通話清晰”……

提取出其中的名詞及名詞短語如下:通話, 手機, 性價比, 系統(tǒng)內(nèi)存, 物流, 服務, ……

針對名詞及名詞短語,基于關聯(lián)規(guī)則的Apriori算法獲取頻繁特征項集作為候選產(chǎn)品特征集合。

Apriori算法對數(shù)據(jù)集進行循環(huán)處理挖掘頻繁項集,其算法過程如下:

a) 統(tǒng)計每個元素出現(xiàn)的頻率,并找出那些不小于最小支持度的項目集, 即1項頻繁項集;

b) 循環(huán)處理,將第(k-1)步生成的(k-1)項頻繁項集中的元素兩兩組合,統(tǒng)計每個組合中兩個元素同時出現(xiàn)的頻率,找出不小于最小支持度的組合,生成k項頻繁項集;

c) 循環(huán)處理直至生成的n項頻繁項集為空,所有的1,2,…,n項頻繁項集構(gòu)成最終的頻繁項集。

在評論挖掘算法中,我們計算每個名詞及名詞組合在評論中出現(xiàn)的頻率,采取最小支持度為0.01,生成產(chǎn)品特征項;由于3項以上的頻繁項明顯不是產(chǎn)品特征,我們只考慮3項以下的頻繁項。針對上述小米3手機評論,對提取出來的名詞,計算其出現(xiàn)的頻率,兩兩組合后計算同時出現(xiàn)的頻率,提取出大于給定的最小支持度的項目作為特征項,得到下列特征項:

[系統(tǒng)], [速度], [手機] , [用戶], [評論], [小米], [手機], [功能], [性價比], [價格], [外觀], [物流], [用戶, 評論], [小米, 手機] ……

將候選產(chǎn)品特征集合按照K最近鄰(k-Nearest Neighbor,KNN)分類算法進行聚類和裁剪,得到最終產(chǎn)品特征項集合。KNN算法思路是:如果一個樣本在特征空間中的k個最相似(即特征空間中最鄰近)的樣本中的大多數(shù)屬于某一個類別,則該樣本也屬于這個類別。KNN算法中,所選擇的鄰居都是已經(jīng)正確分類的對象。該方法在定類決策上只依據(jù)最鄰近的一個或者幾個樣本的類別來決定待分樣本所屬的類別。

a)初始化距離為最大值

b)計算未知樣本和每個訓練樣本的距離dist

c)得到目前K個最臨近樣本中的最大距離maxdist

d)如果dist小于maxdist,則將該訓練樣本作為K-最近鄰樣本

e)重復步驟2、3、4,直到未知樣本和所有訓練樣本的距離都算完

f)統(tǒng)計K-最近鄰樣本中每個類標號出現(xiàn)的次數(shù)

g)選擇出現(xiàn)頻率最大的類標號作為未知樣本的類標號

經(jīng)過此步驟,可以獲得了最終的產(chǎn)品評價數(shù)據(jù)

以句子為單位分析評論,若句子包含特征項,挖掘出用戶對于該特征項的觀點詞及情感傾向性。觀點詞的提取,我們使用了stanford nlp工具進行句法分析,根據(jù)句法分析樹提取出修飾特征項的形容詞,并利用情感詞典判斷其情感傾向性。

例如:句子“用了一階段,質(zhì)量很好”,對特征項[質(zhì)量]提取出其修飾詞“好”,為正面評價;句子“質(zhì)量不錯,外觀喜歡,速度快,信號好”,對特征項[質(zhì)量]提取出其修飾詞“不錯”,為正面評價;對特征項[速度]提取出其修飾詞“快”,為正面評價;

匯總包含每個特征項的正面句子數(shù)量和負面句子數(shù)量,得到用戶對特征項的整體情感傾向性;例如,對特征項[質(zhì)量]統(tǒng)計出正面句子數(shù)量為8,負面句子數(shù)量為1,整體評價為正面;對特征項[系統(tǒng)]統(tǒng)計出正面句子數(shù)量為7,負面句子數(shù)量為0,整體評價為正面;

根據(jù)每個特征項的整體情感傾向性,從相應的正面或負面句子中提取出代表性觀點詞,組成評價短語。

代表性觀點詞的提取:給定某個特征項,統(tǒng)計其每個觀點詞出現(xiàn)的次數(shù)n(opinion)及觀點詞和特征項之間的距離d(opinion, feature),,根據(jù)以下公式計算觀點詞的權(quán)重,選取權(quán)重最大的詞語作為代表性觀點詞。

weight = n(opinion)/( d(opinion,feature) * n(senctences) ),其中n(senctences)為句子總數(shù)。

例如,經(jīng)計算得到特征項[質(zhì)量]的代表性觀點詞“不錯”;得到特征項[質(zhì)量]的代表性觀點詞“流暢”;

依據(jù)評價短語出現(xiàn)的頻率計算評價短語的權(quán)重,按照評價短語的權(quán)重降序排列,分別獲取前N項正負面評價短語。最終計算得到評價短語及其權(quán)重如下:速度快:0.5367, 手機不錯:0.2731, 性價比高:0.16139, 屏幕清晰:0.0222, 反應快:0.0177,物流快:0.013

通過以上的方法,能為電子商務網(wǎng)站在眾多用戶的評論數(shù)據(jù)中獲得評價結(jié)論。企業(yè)能夠通過此方式迅速了解市場的口碑,從而了解用戶需求,為企業(yè)改進產(chǎn)品和下一步開拓市場決策提供了依據(jù)。

(作者單位:武漢軟件工程職業(yè)學院商學院連鎖經(jīng)營管理研究所)

猜你喜歡
特征用戶評價
SBR改性瀝青的穩(wěn)定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
基于Moodle的學習評價
如何獲取一億海外用戶
線性代數(shù)的應用特征
河南科技(2014年23期)2014-02-27 14:19:15
主站蜘蛛池模板: 日韩高清中文字幕| 国产爽妇精品| 喷潮白浆直流在线播放| 内射人妻无套中出无码| 亚洲人成成无码网WWW| 青青草原国产| 美女被躁出白浆视频播放| 亚洲一区二区约美女探花| 一区二区三区在线不卡免费| 欧美日韩国产综合视频在线观看 | 亚洲人妖在线| 免费又爽又刺激高潮网址| 国产9191精品免费观看| 国内精品自在自线视频香蕉 | 夜夜拍夜夜爽| 九九九国产| 国产免费看久久久| 日韩黄色在线| 久久精品一卡日本电影| 狠狠综合久久| 免费人成网站在线观看欧美| 高清码无在线看| 91最新精品视频发布页| 又黄又湿又爽的视频| 91精品国产福利| 五月激激激综合网色播免费| 久久网欧美| 天天干天天色综合网| 无码乱人伦一区二区亚洲一| 青青青视频蜜桃一区二区| 国产精品真实对白精彩久久| 国产小视频在线高清播放| 国产午夜福利亚洲第一| 国产农村妇女精品一二区| 亚洲视频在线网| 国产乱人乱偷精品视频a人人澡| 日韩在线视频网| 成人a免费α片在线视频网站| 欧美激情视频在线观看一区| 精品久久人人爽人人玩人人妻| 99在线观看视频免费| 国产一级做美女做受视频| 欧美A级V片在线观看| 四虎亚洲精品| 亚洲天堂久久新| 国产区免费精品视频| 伊人久久久久久久| 日韩av无码精品专区| 国产v精品成人免费视频71pao | 国内丰满少妇猛烈精品播| 亚洲欧美色中文字幕| 综合人妻久久一区二区精品| 漂亮人妻被中出中文字幕久久| 91成人在线观看| 青青草一区| 国产SUV精品一区二区| 国产成人综合欧美精品久久| 精品国产www| 国产导航在线| 国禁国产you女视频网站| 狠狠综合久久| 久久精品波多野结衣| 在线视频精品一区| 性网站在线观看| 免费一级毛片不卡在线播放| 国产成人精品优优av| 国产成人精品一区二区| 久久久精品无码一二三区| 在线播放国产一区| 91视频国产高清| 国产精品久久久久久久伊一| 在线欧美日韩| 天堂av综合网| 亚洲第一成年网| 就去色综合| 久久久久久午夜精品| 99热亚洲精品6码| 国产精品三级专区| 久久久久中文字幕精品视频| 久久国产V一级毛多内射| 少妇高潮惨叫久久久久久| 久久久久无码精品|