999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于情感距離和領域自適應的評論者聲譽度

2017-07-07 13:44:37魏曉聰林鴻飛楊亮
哈爾濱工程大學學報 2017年6期
關鍵詞:消費者情感

魏曉聰, 林鴻飛, 楊亮

(1.大連理工大學 計算機科學與技術學院,遼寧 大連 116024; 2.大連外國語大學 軟件學院,遼寧 大連 116044)

?

基于情感距離和領域自適應的評論者聲譽度

魏曉聰1,2, 林鴻飛1, 楊亮1

(1.大連理工大學 計算機科學與技術學院,遼寧 大連 116024; 2.大連外國語大學 軟件學院,遼寧 大連 116044)

為有效地從評論文本中評估消費評論者的聲譽度,本文提出一種基于情感距離和領域自適應的評論者聲譽度評估方法。通過度量待評估評論者發(fā)表的商品評論與該商品其他評論者的情感距離、情感傾向一致性,從而衡量該消費評論者在評價商品時的客觀性以及與大眾情感極性的一致性。最后,以亞馬遜產(chǎn)品評論為實驗語料,與亞馬遜Reviewer ranking排序結(jié)果進行對比表明該方法的合理性。該方法對評論文本有效性研究以及規(guī)范電商平臺消費者行為具有重要意義。

產(chǎn)品評論;聲譽度;評論者;情感距離;情感傾向一致性;領域自適應

聲譽是在商品交易過程中所形成的買賣雙方的一種依賴關系,體現(xiàn)為贏得交易對方信任的能力。一個人的聲譽越高,人們對他的信任程度就越高[1]。Sussman和Siegal指出消費者對信息的采納來源于信息質(zhì)量和信息源可信性兩個因素[2]。郭國慶指出,評論者的資信度是影響評論信息感知可信度的重要因素之一[3]。隨著電子商務和Web 2.0的迅速發(fā)展,越來越多的消費者需要從海量的、質(zhì)量參差不齊的評論信息中獲得真實可靠、值得信賴的消費者評論,從而降低信息搜索成本、快速做出購買決策。國外的電商平臺—Amazon.com消費評論者聲譽度評價機制Reviewer ranking主要考慮兩個因素:1)其他消費者對該消費者所發(fā)表的全部評論的“有用”性投票數(shù)量;2)該消費評論者近期發(fā)布的產(chǎn)品評論數(shù)量。這種評價機制無法避免零投票導致的“有用”性投票機制失效問題,并且比較注重消費者近期發(fā)表的評論數(shù)量。國內(nèi)的電商平臺—淘寶網(wǎng)對于發(fā)布產(chǎn)品評論的消費者聲譽度評估主要通過賣家對交易進行標記(好評、中評或差評)以及文字評價兩種方式。然而,對交易進行標記是粗粒度的情感度量,無法有效的衡量賣家對消費者的情感。而且,為討好消費評論者,通常情況下賣家都會給出好評。在文字評價上,由于賣家的日交易量很大,其沒有精力針對每位消費評論者的交易一一給出客觀的文字評價,通常都是統(tǒng)一的評價文本。在這種評價機制下,淘寶網(wǎng)的消費評論者誠信監(jiān)管嚴重缺失。如果能夠引入一種有效的、自動的消費評論者聲譽度評估方法,那么賣家可以此為依據(jù)決定是否將自己的商品出售給聲譽度低的消費評論者,其他用戶可以此為參考決定是否根據(jù)該消費者的評論做出購買決策。這樣,消費評論者在對商品做出評論時出于對失信的后果有所顧忌,會更傾向于給出真實、客觀的評價。國內(nèi)外現(xiàn)有的相關研究主要集中在消費者對賣家的信用評價機制上,對消費評論者信用評價方面,即消費評論者聲譽度,邵婷等通過定性分析進行了討論[4]。據(jù)了解,目前還沒有相關工作從評論文本情感分析角度進行定量研究。本文借鑒文本情感分析相關研究成果,從定量客觀的視角出發(fā),將情感進行量化,以Amazon.com在線評論為例,同時考慮消費評論者與其他評論者對同一商品的情感距離、情感傾向一致性兩個因素,提出一種基于情感距離和領域自適應的方法對消費評論者進行聲譽度分析。

1 評論者聲譽度分析

基于評論文本情感距離和領域自適應的評論者聲譽度研究總體框架如圖1所示。首先,根據(jù)給定消費評論者,在商品庫中搜索該消費評論者評論過的商品。從商品評論庫中將上述商品的該消費者評論和其他評論檢索出來分別進行情感距離和情感極性一致性計算,最后根據(jù)上述兩個分值進行消費者聲譽度分析。

圖1 消費者聲譽度研究總體框架Fig.1 The architecture of consumer reputation research

1.1 情感距離計算

1.1.1 情感量化

SentiWordNet 3.0[6]是一個面向情感分類和觀點挖掘應用的開源詞典資源,它是在WordNet同義詞集的基礎上建立起來的。它為每個同義詞集分配包含褒、貶、中性3個維度的打分,每個維度得分介于[0, 1.0],3個維度得分總和為1。對于情感詞wi,可以通過SentiWordNet字典獲得情感詞在褒、貶、中性三個維度上的情感分值sen(wi)=(Poswi,Negwi,Objwi),從而量化每條評論的情感。

1.1.2 詞義消歧

字典中存在著大量一詞多義的情況,例如:“terrible”總共有四種詞義。在SentiWordNet情感字典中,多義詞可能具有不同的維度得分。當處理一條評論文本時需要對多義詞進行詞義消歧,確定其詞義后在情感字典中找到對應的情感分值。例如“I was very hesitant to purchase this set due to the terrible reviews regarding the packaging”,其中的“terrible”需要確定是四種詞義中的哪種詞義,然后在SentiWordNet中查找對應詞義的情感分值。

詞義消歧是指根據(jù)多義詞所處的上下文環(huán)境來確定詞義。本文采取基于詞典的Lesk[7]詞義消歧算法。該算法認為:一個詞在詞典中的詞義解釋與該詞所在句子具有相似性。如給定上下文“I was very hesitant to purchase this set due to the terrible reviews regarding the packaging”,指定歧義詞“terrible”,Lesk算法給出的語義解釋為“intensely or extremely bad or unpleasant in degree or quality”。

由于Lesk算法和SentiWordNet情感字典是基于同一英語詞典WordNet,存在一部分詞的解釋(定義)描述是相同的。針對這部分詞,只需根據(jù)Lesk算法給出的多義詞解釋在SentiWordNet中尋找相同解釋的同義詞集,并采用其對應的情感分值即可。因此,上述句子中“terrible”情感分值sen(“terrible”)=(0,0.875,0.125)。而對于描述不相同的解釋,需要計算句子相似度找出最相似的解釋(定義)。

1.1.3 句子相似度計算

在實驗中,存在Lesk算法給出的歧義詞解釋在SentiWordNet情感字典中沒有相匹配的解釋。例如“I honestly believe the stories are the best stuff Tad′s written so far”中的歧義詞“best”, Lesk算法給出的解釋為“in a manner affording benefit or advantage”,但在SentiWordNet情感字典“best”的各種解釋中沒有與之相匹配的解釋。這時,需要計算Lesk算法給出的解釋與SentiWordNet字典“best”的各種解釋的句子相似度,將相似度最大的解釋對應的情感分值作為“best”的情感分值。

傳統(tǒng)的句子相似度計算很多都是基于詞袋模型(bag-of-words, BOW)的。但是,詞袋模型會丟失詞序信息并且忽略詞的語義信息。n-gram詞袋模型雖然可以通過窗口捕捉詞序信息,但是其會產(chǎn)生高維稀疏問題。因此,需要一種句子的表示方法既可以保留上下文詞序信息又可以捕捉到詞語之間的語義信息,并且避免高維稀疏問題。Paragraph2Vec[8]算法是Le等2014年提出的。該算法是一種句子、段落和文檔的連續(xù)分布式向量表示方法。它從可變長度的文本中,通過滑動的、固定大小的上下文窗口為每個句子、段落或文檔學習一個稠密的向量表示。由于該算法可以從無標注數(shù)據(jù)中無監(jiān)督的學習到這種向量表示,因此非常適合沒有足夠標注數(shù)據(jù)的訓練任務。同時,該算法能夠克服詞袋模型的缺點,避免n-gram詞袋模型的高維稀疏和推廣能力差等問題。例如,在本實驗,針對上述上下文中的“best”,SentiWordNet情感字典中與Lesk算法給出的解釋句子相似度最大的同義詞集語義解釋為“in a most excellent way or manner”,因此該上下文中的“best”情感分值為sen(“best”)=(0.5,0,0.5)。

1.1.4 評論情感分值

將一條評論表示為P{wi|i∈n},其中wi為該條評論中的情感詞,n為該評論包含的情感詞數(shù)量,那么,該條評論的情感分值:

例如“I honestly believe the stories are the best stuff Tad′s written so far”,經(jīng)過詞義消歧后各情感詞的情感分值如表1所示。經(jīng)過計算,上述例句的情感分值E=(0.14,0.03,0.83)。

表1 各情感詞情感分值

1.2 情感極性一致性計算

1.2.1 計算方法

1.2.2 領域自適應情感極性自動識別方法

以Amazon.com上的評論為例,消費者在發(fā)表文字評論的同時會給該商品賦予一個打分,該打分范圍為[1,5]。這些屬于評論的弱標簽。然而,有時消費者發(fā)表的評論與其給出的打分并不一致。為了彌補上述問題帶來的不足并檢測本文提出方法的有效性,本工作從挖掘評論文本情感的角度,利用Amazon網(wǎng)站已有的、大量的、帶有弱標簽的評論文本進行機器學習訓練,用訓練得到的模型去自動判斷每條評論的情感極性。

然而,機器學習的一個重要假設:訓練數(shù)據(jù)和測試數(shù)據(jù)必須在同一特征空間下并且分布相同。但是不同產(chǎn)品的評論很難保證這一點。目前,領域自適應學習解決的就是這些問題[9-11]。然而大量文獻提出的領域自適應學習方法過度依賴于領域,而對于本文的任務,領域是隨機的,領域的種類同商品種類一樣,數(shù)量很大且不確定。前人的方法很難實施到本文的任務中。因此,需要訓練一個在很多領域都能很好完成領域自適應學習任務、具有較強泛化能力的模型。

近年來文獻表明,深度神經(jīng)網(wǎng)絡能夠從源輸入變量的所有因素中捕捉到具有一般性的因素,能夠在不同領域之間自動的學習被不同領域共享的、對任務具有辨別力的特征表示,因此適合解決跨領域自適應學習問題。深度神經(jīng)網(wǎng)絡在文本領域已開展了少量的工作,如Xiao Ding等提出了一種基于卷積神經(jīng)網(wǎng)絡的領域自適應學習方法識別電影領域用戶消費意圖[12]。該工作驗證了卷積神經(jīng)網(wǎng)絡在文本領域挖掘消費意圖任務上的領域自適應學習能力。本文提出了一種基于卷積神經(jīng)網(wǎng)絡的多源領域自適應學習框架,該框架如圖2所示。

圖2 基于卷積神經(jīng)網(wǎng)絡的多源領域自適應學習框架Fig.2 The architecture of multi-source domain adaptation based on convolutional neural network

層1:詞向量層。構(gòu)建一個字典,將各評論中的每個詞用其對應的索引值表示并作為該層輸入,對應的Word2Vec[13]訓練的詞向量初始化該層的權(quán)重。這樣該層在進行訓練時權(quán)重值會根據(jù)任務進行微調(diào)。接下來為了防止訓練的模型過擬合,引入dropout機制。本層的輸出作為下一層的輸入。

層2:由一維卷積操作和一維最大池化操作組成。卷積操作將滑動窗口大小為n的文本區(qū)域轉(zhuǎn)化為特征向量。向量m∈Rn是一個卷積核,也叫權(quán)重向量。大小為n的卷積核通過捕捉一個詞的上下文特征從而學習內(nèi)部特征表達。對于一個詞向量vi,首先將詞向量vi周圍的n個詞向量串聯(lián)起來,然后通過卷積操作與權(quán)重向量m∈Rn進行點乘。

fi=mTvj-n+1:j

(1)

最后進行激活函數(shù)計算:

O=σ(fj+b)

(2)

式中:σ為非線性激活函數(shù),b∈Rn為偏置向量。在同一層,m∈Rn和b∈Rn權(quán)值共享,它們通過訓練學習得到。然后應用一個一維最大池化操作來捕捉對本任務有用的局部特征。本層的輸出作為下一層的輸入。

層3:層3的結(jié)構(gòu)與層2相同,也是由一個一維卷積操作和一個最大池化操作組成。層3的輸出經(jīng)過Flatten函數(shù)“壓平”,即把多維的輸入一維化從而作為下一層的輸入。

層4:該層為全連接層,其輸出作為下一層的輸入。

層5:該層為全連接層,最后進行情感極性二元分類。

2 實驗與結(jié)果分析

2.1 實驗數(shù)據(jù)集

本文實驗語料采用McAuley等[14]收集的Amazon產(chǎn)品評論語料。該語料包含了消費評論者的商品信息及打分。打分范圍介于[1,5]。其中1分為最低分,5分為最高分。從上述語料中隨機抽取5位評論者,這些評論者評價產(chǎn)品次數(shù)需滿足大于等于5次,語料統(tǒng)計如表2所示。

表2 語料統(tǒng)計表

2.2 Paragraph2Vec模型訓練

將SentiWordNet情感字典中所有同義詞集的解釋及例句共114 076個句子,以及2.1實驗數(shù)據(jù)集中的每個歧義詞的Lesk算法給出的解釋,共同作為Paragraph2Vec模型訓練語料。經(jīng)過實驗選擇訓練模型最優(yōu)參數(shù)組合為特征向量維數(shù)300維、預測詞與上下文單詞最大距離為8、保留低頻詞匯,其余參數(shù)如表3所示。采用gensim工具包[15]實現(xiàn)的Paragraph2Vec算法。

表3 Paragraph2Vec模型訓練參數(shù)

2.3 領域自適應情感極性自動識別實驗

2.3.1 詞向量訓練

本文從McAuley等[14]收集的Amazon產(chǎn)品評論語料中抽取了2014年Books, Movies & TV, Electronics 和 Home & Kitchen 四個領域的所有評論作為Word2Vec訓練語料。該語料包含696萬條產(chǎn)品評論、38 600萬個單詞。將語料中的單詞全部變換為小寫并去除標點符號之后進行Word2Vec詞向量訓練,詞向量維數(shù)為300維。

2.3.2 多源領域自適應學習的情感極性自動識別

為了驗證本文提出的深度神經(jīng)網(wǎng)絡領域自適應學習框架在跨領域產(chǎn)品評論情感分類上的有效性,本文進行如下實驗。本文從McAuley等[14]收集的Amazon產(chǎn)品評論語料中抽取了2014年Books(B)、Movies & TV(D)、Electronics(E) 和 Home & Kitchen(K) 四個領域的所有評論(不包含2.1中的評論),去除中性評論(打分為0)。與文獻[16]相同,將每條評論的用戶打分作為該條評論的情感極性標簽,打分為1分、2分的認為其情感極性為負向,打分為4分、5分的為正向。對語料進行預處理,去除標點符號、將每個單詞轉(zhuǎn)化為小寫形式。分別從上述四個領域中抽取1萬條正向評論和1萬條負向評論。將其中三個領域作為源領域,余下的一個領域作為目標領域進行實驗,例如:將Books(B)、Movies & TV(D)、Electronics(E)三個領域共6萬條語料作為源領域訓練語料,對本文提出的領域自適應學習框架進行模型訓練,訓練后的模型對Home & Kitchen(K)領域進行預測,此任務表示為BDE→K。由此,構(gòu)建了四組領域自適應學習任務BDE→K、BDK→E、BEK→D、DEK→B。本文的實驗評價標準為準確率。在對多源領域進行訓練時,訓練集為5.4萬,驗證集為0.6萬。由于卷積神經(jīng)網(wǎng)絡要求輸入序列為固定長度,因此本實驗將每條評論組織為長度為100個單詞。若原評論長度超過100個單詞則截斷,不足100個單詞時則將不足部分填充數(shù)字0。訓練神經(jīng)網(wǎng)絡時batch size設置為128,卷積核數(shù)量為250,卷積核窗口大小為5,卷積層邊界模式為same,激活函數(shù)為relu,最大池化長度為2,所有dropout都為0.1。第一個全連接層激活函數(shù)為relu,隱層單元數(shù)為250。第二個全連接層激活函數(shù)為sigmoid,隱層單元數(shù)為1。一共訓練15輪。每輪訓練都對數(shù)據(jù)重新shuffle。損失函數(shù)為binary cross-entropy,測試性能取決于最后一輪驗證準確率,實驗結(jié)果如圖3所示。實驗表明本文提出的多源領域自適應情感極性自動識別學習框架在四個任務都能很好的完成分類,平均準確率達到了89.75%。該框架能夠從多個不同且相關的源領域自動學習對分類任務有用的特征,無需手工構(gòu)造特征,模型可以廣泛的用來預測各種領域的商品評論情感極性,比較適合本文的任務。因此,本文采取該領域自適應學習框架進行2.1實驗語料的情感極性自動識別。情感極性一致性分值計算方法如1.2.1節(jié)所示。

2.4 聲譽度計算及結(jié)果分析

2.4.1 聲譽度計算

每位消費評論者對其發(fā)表的商品評論與大眾的平均情感距離Ave(EDEi)、平均情感極性一致性分值Ave(PolarityScorePi)如表4第2、3列所示。可以看出,情感距離與情感傾向性分值并沒有在同一個數(shù)據(jù)范圍。情感距離分值范圍介于[0.004 9,0.035 0],情感傾向性分值介于[0.314 8,1]。為了便于計算,采取與文獻[17]相同的方法將情感距離分值取值范圍按比例增加到和情感傾向性分值相同范圍,計算方法為

(3)

式中:min和max為x的原始最小值和最大值,minnew和maxnew為新的最小值和最大值。f(x)函數(shù)將x由原始的取值范圍按比例增加到新的取值范圍minnew和maxnew中。例如,按比例增加到新的取值范圍之后,消費者Ron H的情感距離為

所有評論情感距離按比例增加后的結(jié)果如表4第4列所示。聲譽度得分Score計算方法如下:

Score=αAve(EDEi)+

(1-α)Ave(PolarityScorePi)

(4)

分數(shù)越高代表聲譽度越高。其中α∈(0,1)為平衡Ave(EDEi)和Ave(PolarityScorePi的調(diào)解因子。本文邀請一些專家對α的經(jīng)驗值進行討論,最后給出α經(jīng)驗值為0.4。最終聲譽度排名如表4第五列所示。表4中第6列列出了亞馬遜Reviewer ranking給出的排名,如:消費者評論者GCM在Amazon.com網(wǎng)站上排名為第627 765名。第7列為其他用戶認為該消費者所發(fā)表的評論有用的票數(shù)以及總投票數(shù),第8列為該消費者第一次發(fā)表評論的時間。

圖3 多源領域自適應學習的情感極性自動識別實驗結(jié)果Fig.3 Results of sentiment polarity recognition based on multi-source domain adaptation

表4 情感距離、情感傾向一致性分值及聲譽度排名對比

2.4.2 結(jié)果分析

從表4可以看出,排名為第2~5名的消費者排列順序與Reviewer ranking的排名相一致,這說明本文提出的方法具有一定的合理性。但是本文排名第1名的消費者maewest64和排名第2名的消費者GCM排名順序與Reviewer ranking不一致。從第一條評論發(fā)表時間來看,maewest64晚于其他消費者,而且maewest64發(fā)表的其余15條評論全部集中在2013年和2014年。而Reviewer ranking排序機制考慮的因素之一為其他消費者對該消費者所發(fā)表的全部評論的“有用”性投票數(shù)量,考慮到評論的累積性,越是近期發(fā)表的評論得到關注的幾率越小,越容易出現(xiàn)零投票現(xiàn)象。因此,在Reviewer ranking中maewest64排名落后于GCM。而本文提出的聲譽度排序方法是從情感距離和情感極性一致性角度出發(fā),不依賴于其他用戶給出的有用性投票,因此能夠避免零投票現(xiàn)象帶來的機制失效所導致的排序不穩(wěn)定問題。

從消費者maewest64和GCM已有的“有用投票/總票數(shù)”來看,這兩位消費者發(fā)表的評論幾乎所有參與投票用戶都認為是有用的,這也說明這兩位消費者發(fā)表的評論得到了幾乎所有參與投票者的認可,他們的評論質(zhì)量、客觀性也一定比較高,因此在本文提出的聲譽度排序中名次靠前。另外,由于經(jīng)驗豐富的消費者其評價更為客觀,而經(jīng)驗較少的消費者,常常對商品充滿幻想,當商品與想象存在落差,會給出一些極端的評論。這兩位消費者在Amazon.com上購買并評價過的商品數(shù)量皆多于其他消費者,購物經(jīng)驗較之其他消費者更豐富,這也可能致使他們在評價產(chǎn)品時更客觀,因此聲譽度排名更高。以上兩方面分析這也驗證了認同理論,高級別發(fā)帖者在發(fā)布平臺中的行為更積極,主要體現(xiàn)于發(fā)布更多、準確性更高的信息。

3 結(jié)論

1)本文根據(jù)消費者對所購買商品的情感與大眾越一致,其評價方式越客觀,可信度越大,聲譽度越高這一常識,采用自然語言處理技術和文本領域自適應技術量化情感,衡量待評估聲譽度消費者與大眾對同一產(chǎn)品的情感距離以及情感極性一致性,進行了評論者聲譽度方法研究。

2)實驗結(jié)果表明,該方法與亞馬遜Reviewer ranking排名大體相一致,具有一定的合理性。而該方法不依賴其他用戶給出的有用性投票,可以有效避免零投票導致的聲譽度評估失效問題。

3)本文提出的方法為評論信息質(zhì)量研究、評論文本有效性研究以及改善電商平臺信用評價機制提供了定量分析的新思路。

下一步工作會考慮加入更多聲譽度相關特征,如評論者是否實名等,從而進一步提高聲譽度分析的評估能力。

[1]楊曉梅.基于C2C電子商務網(wǎng)站的聲譽評價機制研究[J]. 山西大學學報:哲學社會科學版, 2009(2): 116-120.

YANG Xiaomei.Research on the reputation mechanism of the C2C-based E-commerce sites[J]. Journal of Shanxi University: Philosophy & Social Science, 2009(2): 116-120.

[2]SUSSMAN S W, SIEGAL W S. Informational influence in organizations: an integrated approach to knowledge adoption[J]. Information systems research, 2003, 14(1): 47-65.

[3]郭國慶,陳凱,何飛.消費者在線評論可信度的影響因素研究[J]. 當代經(jīng)濟管理, 2010, 10: 17-23.

GUO Guoqing, CHEN Kai, HE Fei.An empirical study on the influence of perceived credibility of online consumer reviews[J]. Contemporary economy & management, 2010, 10: 17-23.

[4]邵婷,林建宗.B2C平臺買家誠信約束機制探析[J]. 廈門理工學院學報, 2013, 04: 83-86.

SHAO Ting, LIN Jianzong.Buyers′ trust constraint on B2C platform: a case study on Tmall[J]. Journal of Xiamen University of Technology, 2013, 04: 83-86.

[5]孟搖歡.大眾傳播心理距離的嬗變[D].長春:吉林大學, 2011: 7-8.

MENG Yaohuan.Evolution of psychological distance in mass communication[D]. Changchun: Jilin University, 2011: 7-8.

[6]BACCIANELLA S, ESULI A, SEBASTIANI F. SentiWordNet 3.0: an enhanced lexical resource for sentiment analysis and opinion mining[C]//Proceeding of the 7thInternational Conference on Language Resources and Evaluation, Malta, 2010(10): 2200-2204.

[7]LESK M. Automatic sense disambiguation using machine readable dictionaries: how to tell a pine cone from an ice cream cone[C]//Proceeding of the 5thAnnual International Conference on Systems Documentation, Canada, 1986: 24-26.

[8]LE Q V, MIKOLOV T. Distributed representations of sentences and documents[C]//Proceeding of the 31thInternational Conference on Machine Learning, China, 2014(14): 1188-1196.

[9]BLITZER J, Mcdonald R, PEREIRA F. Domain adaptation with structural correspondence learning[C]//Proceeding of the 2006 Conference on Empirical Methods in Natural Language Processing, Australia, 2006: 120-128.

[10]PAN S J, NI X, SUN J T, et al. Cross-domain sentiment classification via spectral feature alignment[C]//Proceeding of the 19thInternational Conference on World Wide Web, USA, 2010: 751-760.

[11]PAN J, HU X, LI P, et al. Domain adaptation via multi-layer transfer learning[J]. Neurocomputing, 2016, 190: 10-24.

[12]DING X, LIU T, DUAN J, et al. Mining user consumption intention from social media using domain adaptive convolutional neural network[C]//Proceeding of the 29thAAAI Conference on Artificial Intelligence, USA, 2015: 2389-2395.

[13]MIKOLOV T, SUTSKEVER I, CHEN K, et al. Distributed representations of words and phrases and their compositionality[C]//Proceeding of Advances in Neural Information Processing Systems, USA, 2013: 3111-3119.

[14]MCAULEY J, PANDEY R, LESKOVEC J. Inferring networks of substitutable and complementary products[C]//Proceeding of the 21thACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Australia, 2015: 785-794.

[15]REHUREK R, SOJKA P. Software framework for topic modeling with large corpora[C]//Proceeding of the LREC 2010 Workshop on New Challenges for NLP Frameworks, Malta, 2010: 45-50.

[16]KOTZIAS D, DENIL M, De FREITAS N, et al. From group to individual labels using deep features[C]//Proceeding of the 21thACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Australia, 2015: 597-606.

[17]HU N, KOH N, REDDY S. Rating lead you to the product, reviews help you clinch it? the mediating role of online review sentiments on product sales[J]. Decision support system, 2014, 57: 42-53.

本文引用格式:

魏曉聰,林鴻飛,楊亮. 基于情感距離和領域自適應的評論者聲譽度[J]. 哈爾濱工程大學學報, 2017, 38(6): 907-913.

WEI Xiaocong, LIN Hongfei, YANG Liang. Reviewer reputation based on emotion distance and self-adaption[J]. Journal of Harbin Engineering University, 2017, 38(6): 903-917.

Reviewer reputation based on emotion distance and self-adaption

WEI Xiaocong1,2, LIN Hongfei1, YANG Liang1

(1.School of Computer Science and Technology, Dalian University of Technology, Dalian 116024, China; 2.School of Software Engineering, Dalian University of Foreign Languages, Dalian 116044, China)

In order to evaluate a reviewer′s reputation effectively from his or her written reviews, we propose a method for evaluating reviewer reputation based on emotional distance and domain self-adaption. By calculating the emotional distance and the consistency of emotional tendency between the reviews written by the target reviewer and those by other reviewers, the review objectivity and the emotional consistency between the target reviewer and the public are measured. Finally, by using product reviews on Amazon.com as the experimental data, we compare the results of the proposed method with the sequencing results of the Amazon Reviewer ranking to show the rationality of the method. The proposed method would be of great significance to research on text effectiveness and regularizing the behavior of consumers on e-commerce platforms.

product review; reputation; reviewer; emotion distance; sentiment orientation consistency; domain self-adaption

2016-04-26. 網(wǎng)絡出版日期:2017-03-30.

國家自然科學基金項目(61572102,61562080); 大連外國語大學科研基金項目(2014XJQN14).

魏曉聰(1982-), 女, 講師,博士研究生; 林鴻飛(1962-), 男, 教授,博士生導師.

魏曉聰,E-mail:weixiaocong@dlufl.edu.cn.

10.11990/jheu.201604078

http://www.cnki.net/kcms/detail/23.1390.u.20170330.1503.022.html

TP391

A

1006-7043(2017)06-0907-07

猜你喜歡
消費者情感
如何在情感中自我成長,保持獨立
被情感操縱的人有多可悲
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
系無理取鬧?NO! 請為消費者擦干眼淚
人民交通(2019年16期)2019-12-20 07:03:52
情感
日化品牌怎樣才能吸引年輕消費者?
消費導刊(2018年22期)2018-12-13 09:19:00
如何在情感中自我成長,保持獨立
只用一招 讓喊產(chǎn)品貴的消費者閉嘴
知識付費消費者
悄悄偷走消費者的創(chuàng)意
主站蜘蛛池模板: 高清视频一区| 国产剧情国内精品原创| 国产欧美专区在线观看| 日本免费一级视频| 国产性猛交XXXX免费看| 青青操视频免费观看| 亚洲清纯自偷自拍另类专区| 日韩在线播放中文字幕| 国产超薄肉色丝袜网站| 青青操国产视频| 日韩色图在线观看| 亚洲色欲色欲www在线观看| 69视频国产| 日韩久草视频| 在线观看无码a∨| 久久精品一品道久久精品| 波多野结衣第一页| 欧美在线国产| 丰满人妻一区二区三区视频| 91精品日韩人妻无码久久| 欧美人人干| 日本成人一区| 国产精品太粉嫩高中在线观看| 人与鲁专区| 久久午夜影院| 亚洲视屏在线观看| 91无码人妻精品一区二区蜜桃| 91精品久久久无码中文字幕vr| 久热re国产手机在线观看| 麻豆a级片| 欧美精品aⅴ在线视频| 日韩欧美综合在线制服| 中文字幕日韩视频欧美一区| 好吊妞欧美视频免费| 久久国产黑丝袜视频| 嫩草影院在线观看精品视频| 国产波多野结衣中文在线播放 | 在线免费无码视频| 国产www网站| 欧美区国产区| 国产在线精品99一区不卡| 中文国产成人久久精品小说| 国产91丝袜| www欧美在线观看| 国产精品19p| 欧美一级片在线| 久久99这里精品8国产| 免费国产一级 片内射老| 无遮挡一级毛片呦女视频| 国产黄色片在线看| 无码专区第一页| 国产午夜一级毛片| 久久激情影院| 婷婷亚洲天堂| 成人综合久久综合| 精品亚洲国产成人AV| 无码福利日韩神码福利片| 国产中文在线亚洲精品官网| 日韩欧美一区在线观看| 精品在线免费播放| 免费午夜无码18禁无码影院| 91探花国产综合在线精品| 国产在线自乱拍播放| 欧美高清国产| 99爱在线| 国产成人调教在线视频| 国产精品刺激对白在线| 亚洲国产日韩在线成人蜜芽| 精品国产Av电影无码久久久| 亚洲AV无码不卡无码| 一区二区影院| 国产精欧美一区二区三区| 国产呦精品一区二区三区网站| 青青操视频免费观看| 亚洲精品va| 久久久久久国产精品mv| 亚洲日韩图片专区第1页| 久久久亚洲国产美女国产盗摄| 欧美性精品| 女同久久精品国产99国| 亚洲精品免费网站| 亚洲欧美成人在线视频|