999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于BERT 模型的方面級(jí)情感分析

2023-08-19 09:59:44李壯李鴻燕
電子設(shè)計(jì)工程 2023年16期
關(guān)鍵詞:單詞分類情感

李壯,李鴻燕

(太原理工大學(xué)信息與計(jì)算機(jī)學(xué)院,山西 晉中 030600)

方面級(jí)情感分析[1]是針對(duì)給定文本的特定方面進(jìn)行細(xì)粒度情感分析的任務(wù),是情感分析領(lǐng)域[2]中的重要分支。傳統(tǒng)機(jī)器學(xué)習(xí)方法依賴于人工特征提取的質(zhì)量,導(dǎo)致分類精度較低。近年來(lái),深度學(xué)習(xí)憑借良好的特征提取能力,在該領(lǐng)域中得到廣泛應(yīng)用[3-5]。經(jīng)研究,注意力機(jī)制可有效提升情感分類效果[6],因此成為該領(lǐng)域的常用方法[7-9]。Li[10]等人發(fā)現(xiàn)對(duì)輸入信息進(jìn)行加權(quán)處理,可有效提升方面級(jí)特征提取能力。此外,相關(guān)學(xué)者提出GPT[11]和ELMO[12]提升分類效果,但兩種模型均需大量人工標(biāo)注數(shù)據(jù)集進(jìn)行訓(xùn)練。He[13]等人則利用遷移學(xué)習(xí)將文檔級(jí)知識(shí)轉(zhuǎn)移到方面級(jí)情感分類任務(wù)中,并有效提升分類精度。然而,以上研究均未考慮到該領(lǐng)域數(shù)據(jù)集較少,且目前工作遷移層次不夠深的問(wèn)題。為了豐富方面級(jí)數(shù)據(jù)的獲取形式并提高分類精度,文中提出了BERTDTL-HAN 模型,該模型結(jié)合層次注意力網(wǎng)絡(luò)[14],可以將同領(lǐng)域句子級(jí)別的情感知識(shí)深層次遷移[15]到方面級(jí)任務(wù)中,通過(guò)與基準(zhǔn)模型進(jìn)行對(duì)比實(shí)驗(yàn),證明該方案的可行性和有效性。

1 BERT-DTL-HAN模型

1.1 模型結(jié)構(gòu)

文中提出的模型是基于BERT[16]作為預(yù)訓(xùn)練模型,結(jié)合深度遷移學(xué)習(xí)(Deep Transfer Learning,DTL)方法和層次注意力網(wǎng)絡(luò)(Hierarchical Attention Networks,HAN)的細(xì)粒度情感分析模型。BERTDTL-HAN 模型結(jié)構(gòu)如圖1 所示。

圖1 BERT-DTL-HAN模型結(jié)構(gòu)圖

模型包含四個(gè)部分,分別為基于BERT 模型的文本嵌入層、進(jìn)行深層次遷移學(xué)習(xí)的單詞編碼層和片段編碼層,以及進(jìn)行情感極性分類的輸出網(wǎng)絡(luò)層。

1.2 文本嵌入層

文本嵌入層將輸入的文本語(yǔ)料轉(zhuǎn)換為深度學(xué)習(xí)模型輸入的詞向量的數(shù)學(xué)形式,并進(jìn)行中文語(yǔ)料預(yù)處理的工作。

傳統(tǒng)語(yǔ)言模型如獨(dú)熱編碼和Word2Vec,僅可實(shí)行單向特征提取,且特征向量維度單一。為了解決傳統(tǒng)的詞嵌入方法不能很好地表征深層次的字詞向量信息,文中引入了圖2 所示的BERT 模型,該模型可以進(jìn)行詞義向量、分段向量和位置向量三個(gè)維度的特征提取,且采用雙向Transfoemer 結(jié)構(gòu)獲取上下文特征信息。

圖2 BERT模型圖

以“My dog is cute”為例句,其詞向量、分段向量和位置向量三個(gè)維度的向量信息如圖3 所示。

圖3 BERT模型輸入圖

三個(gè)維度大小相同,其中位置向量是通過(guò)三角函數(shù)對(duì)輸入文本中各個(gè)位置分別進(jìn)行編碼得到的,計(jì)算公式如下式:

式中,pos 表示第pos 個(gè)詞,i表示在詞向量嵌入模型中的第i維。

文本嵌入層通過(guò)BERT 模型進(jìn)行預(yù)訓(xùn)練時(shí),序列長(zhǎng)度被控制在BERT 能處理的最大序列長(zhǎng)度512以內(nèi),其中長(zhǎng)度不足512 的用0 填充,以方便進(jìn)行模型進(jìn)行矩陣運(yùn)算。

1.3 單詞編碼層

單詞編碼層采用雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)編碼,該網(wǎng)絡(luò)包含前向LSTM 和后向LSTM,可以從單詞層面的兩個(gè)方向讀取方面級(jí)的特征信息。單詞編碼層將句子級(jí)別的特征信息深層遷移到單詞層面。正向LSTM 建模定義為,后向LSTM 建模定義為,總建模為hit,建模的具體公式如下:

其中,xij表示輸入文本中第i個(gè)句子中第j個(gè)單詞的編碼信息,θLSTMw表示用于單詞編碼器的LSTM的參數(shù)。

單詞層次注意力機(jī)制的構(gòu)建公式如下:

式中,Kit為權(quán)重參數(shù),Rit為偏置參數(shù),uw為單詞編碼模型學(xué)習(xí)得到的向量,oi為單詞編碼層的輸出。

1.4 片段編碼層

片段編碼層也采用雙向LSTM 架構(gòu),實(shí)現(xiàn)對(duì)片段層次的特征信息的雙向編碼。片段編碼層將句子級(jí)別的特征信息深層遷移到片段層面。片段編碼器的正向建模定義為,后向建模定義為,總建模定義為hi。建模的具體公式如下。

其中,xij表示輸入文本中第i個(gè)句子中第j個(gè)片段的編碼信息,θLSTMw表示用于片段編碼器的LSTM 的參數(shù)。

片段層次注意力機(jī)制的構(gòu)建公式如下:

式中,Wi為權(quán)重參數(shù),bi為偏置參數(shù),us為片段編碼模型學(xué)習(xí)得到的向量,S為片段編碼器注意力層輸出。

1.5 輸出網(wǎng)絡(luò)層

輸出網(wǎng)絡(luò)層采用全連接和softmax 函數(shù)進(jìn)行情感分類和歸一化處理,模型的最終輸出向量為Z,公式如下:

式中,W為權(quán)重參數(shù),b為偏置參數(shù)。

采用Adam 優(yōu)化方法進(jìn)行參數(shù)更新,并使用最小化交叉熵?fù)p失函數(shù)作為目標(biāo)函數(shù)優(yōu)化模型的情感分類效果,公式如下:

式中,B為訓(xùn)練集的數(shù)據(jù)量,L為情感具體分類的個(gè)數(shù),實(shí)驗(yàn)中數(shù)據(jù)量的大小為3,為預(yù)測(cè)類別數(shù),y為實(shí)際類別數(shù),φ‖θ‖2為交叉正則項(xiàng)。

2 實(shí)驗(yàn)結(jié)果與分析

2.1 實(shí)驗(yàn)數(shù)據(jù)集

文中采用了三個(gè)領(lǐng)域的公開(kāi)數(shù)據(jù)集,分別為餐館(Restaurant)評(píng)論數(shù)據(jù)集和筆記本電腦(Laptop)數(shù)據(jù)集以及推特(Twitter)數(shù)據(jù)集,數(shù)據(jù)集被劃分為訓(xùn)練集和測(cè)試集,具體數(shù)據(jù)如表1 所示。

表1 實(shí)驗(yàn)數(shù)據(jù)集

2.2 評(píng)價(jià)指標(biāo)

實(shí)驗(yàn)的評(píng)估標(biāo)準(zhǔn)采用二分類問(wèn)題中常用標(biāo)準(zhǔn)ACC(Accuracy,準(zhǔn)確率)和F1 值。其中ACC 標(biāo)準(zhǔn)計(jì)算的是正確分類樣本數(shù)占總樣本數(shù)的比例,計(jì)算公式如下:

F1 值為精確率和召回率的調(diào)和均值,兩者公式換算如下:

其中,TP 為模型預(yù)測(cè)為積極情緒,樣本本身為積極情緒的樣本個(gè)數(shù);TN 為模型預(yù)測(cè)為消極情緒,樣本本身為消極情緒的樣本個(gè)數(shù);FP 為模型預(yù)測(cè)為積極情緒,但樣本本身為消極情緒的樣本個(gè)數(shù);FN為模型預(yù)測(cè)為消極情緒,但樣本為積極情緒的樣本個(gè)數(shù)。

2.3 實(shí)驗(yàn)環(huán)境

文中實(shí)驗(yàn)具體的環(huán)境如表2 所示。

表2 實(shí)驗(yàn)環(huán)境

2.4 實(shí)驗(yàn)過(guò)程

將文中提出的BERT-DTL-HAN 模型在三個(gè)領(lǐng)域的數(shù)據(jù)集中與七個(gè)基準(zhǔn)模型進(jìn)行廣泛性實(shí)驗(yàn)。

為驗(yàn)證單詞編碼層和片段編碼層深層遷移學(xué)習(xí)的有效性,采用準(zhǔn)確率和F1 值作為評(píng)價(jià)指標(biāo)。文中分別對(duì)無(wú)遷移學(xué)習(xí)、只遷移單詞層面、只遷移片段層面和單詞級(jí)別以及片段級(jí)別均遷移四種情況進(jìn)行了對(duì)照實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表3 所示。

表3 不同遷移級(jí)別的實(shí)驗(yàn)結(jié)果

為了研究模型情感極性分類的有效性,設(shè)置七組模型進(jìn)行性能對(duì)比,相關(guān)的基準(zhǔn)模型均為方面級(jí)情感分析任務(wù)常用模型,文中提出的模型與各個(gè)基準(zhǔn)模型在三個(gè)領(lǐng)域數(shù)據(jù)集中的準(zhǔn)確率數(shù)據(jù)記錄如表4 所示。

表4 準(zhǔn)確率實(shí)驗(yàn)結(jié)果對(duì)比

2.5 實(shí)驗(yàn)結(jié)果

表3 實(shí)驗(yàn)結(jié)果表明,在三個(gè)領(lǐng)域的數(shù)據(jù)集中,進(jìn)行單詞級(jí)別或片段級(jí)別深層遷移學(xué)習(xí)的模型準(zhǔn)確率和F1 值均優(yōu)于無(wú)遷移的模型。相比較于片段級(jí)別遷移,單詞級(jí)別對(duì)模型的準(zhǔn)確率提升更為明顯,其中單詞+片段遷移(全遷移)模型的情感分類效果最好。該實(shí)驗(yàn)證明了結(jié)合深層次遷移學(xué)習(xí)和層次注意網(wǎng)絡(luò)機(jī)制將數(shù)據(jù)量大的句子級(jí)別情感分析數(shù)據(jù)集遷移到數(shù)據(jù)量小的基于方面級(jí)情感分析任務(wù)中的可行性和有效性。

表4 實(shí)驗(yàn)結(jié)果表明,BERT-DTL-HAN 模型在三個(gè)數(shù)據(jù)領(lǐng)域中相較于七個(gè)基準(zhǔn)模型都取得了最好的實(shí)驗(yàn)結(jié)果。在筆記本電腦評(píng)論語(yǔ)料數(shù)據(jù)集中,相對(duì)于基準(zhǔn)模型中最優(yōu)結(jié)果模型Feature+SVM,準(zhǔn)確率提升了1.40%;在推特評(píng)論語(yǔ)料數(shù)據(jù)集中,相比較于基準(zhǔn)模型中的最優(yōu)結(jié)果模型Feature+SVM 模型,其準(zhǔn)確率提升了0.96%;在餐館評(píng)論數(shù)據(jù)集中本模型的效果相較于基準(zhǔn)模型的最優(yōu)結(jié)果SVM 模型的80.13%提升了0.93%。

3 結(jié)束語(yǔ)

針對(duì)由于數(shù)據(jù)集偏小且特征提取不足而導(dǎo)致方面級(jí)情感分析分類效果不佳問(wèn)題,文中構(gòu)建了一種BERT-DTL-HAN 模型,模型首先通過(guò)BERT 進(jìn)行預(yù)處理獲得多維度的詞向量信息,再通過(guò)深層次遷移學(xué)習(xí)將數(shù)據(jù)量豐富的句子級(jí)別信息遷移到數(shù)據(jù)量較小的方面級(jí)情感分析任務(wù)中,最后通過(guò)層次遷移網(wǎng)絡(luò)增強(qiáng)對(duì)方面級(jí)特征信息的提取。實(shí)驗(yàn)結(jié)果表明,該模型有效解決了基于方面級(jí)情感分析任務(wù)中數(shù)據(jù)量小和方面級(jí)特征獲取不足的問(wèn)題,其分類精度也優(yōu)于對(duì)比實(shí)驗(yàn)中的一眾基準(zhǔn)模型。

在后續(xù)的工作中,將會(huì)嘗試進(jìn)一步增強(qiáng)深度遷移學(xué)習(xí)的維度來(lái)更高效地豐富基于方面級(jí)情感分析的數(shù)據(jù)集并進(jìn)一步優(yōu)化模型的分類效果。

猜你喜歡
單詞分類情感
分類算一算
如何在情感中自我成長(zhǎng),保持獨(dú)立
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
單詞連一連
情感
分類討論求坐標(biāo)
如何在情感中自我成長(zhǎng),保持獨(dú)立
數(shù)據(jù)分析中的分類討論
看圖填單詞
教你一招:數(shù)的分類
主站蜘蛛池模板: 2022国产无码在线| 欧美亚洲国产一区| 国产精品久久久久鬼色| 亚洲永久免费网站| 99热这里只有精品5| 国模粉嫩小泬视频在线观看| 成人噜噜噜视频在线观看| 精品无码日韩国产不卡av | 欧美午夜在线播放| 国产区在线看| 亚洲欧美自拍一区| 在线观看欧美国产| 欧美在线三级| 国产精品自在拍首页视频8| 免费毛片a| 成人在线观看一区| 国产精品女人呻吟在线观看| 久久一色本道亚洲| 在线免费a视频| 女人18毛片久久| 国产精品亚洲一区二区三区z| 欧美福利在线播放| hezyo加勒比一区二区三区| 欧类av怡春院| 亚洲国产理论片在线播放| 国产精品视频猛进猛出| 国产好痛疼轻点好爽的视频| 美女无遮挡免费视频网站| 欧美综合中文字幕久久| 三上悠亚精品二区在线观看| 国产美女在线观看| 国产精品丝袜视频| 韩日午夜在线资源一区二区| 亚洲无码电影| 免费一级α片在线观看| 久久综合国产乱子免费| 97超碰精品成人国产| 精品撒尿视频一区二区三区| 在线观看热码亚洲av每日更新| 国产乱子伦精品视频| 亚洲欧美不卡视频| 久久semm亚洲国产| 亚洲成人一区二区| 欧美日韩第二页| 久久国产黑丝袜视频| 高清欧美性猛交XXXX黑人猛交| 天天综合网站| 综合人妻久久一区二区精品| 无码专区国产精品一区| yjizz视频最新网站在线| 丰满人妻久久中文字幕| 自慰网址在线观看| 自慰高潮喷白浆在线观看| 亚洲三级a| 欧美亚洲一二三区| 日韩免费无码人妻系列| av在线无码浏览| 国产高清国内精品福利| 久久综合色视频| 香蕉久久永久视频| 久久久久人妻一区精品| 91日本在线观看亚洲精品| 97国产成人无码精品久久久| 国产精品七七在线播放| 一级毛片免费观看久| 看你懂的巨臀中文字幕一区二区 | 久久精品视频一| 欧美三级视频网站| 日韩人妻无码制服丝袜视频| 成年人福利视频| 91精品国产一区| 久久鸭综合久久国产| 暴力调教一区二区三区| 国产免费高清无需播放器| 色成人综合| 免费无码在线观看| 亚洲色成人www在线观看| 欧美精品导航| 国产福利在线观看精品| 亚洲综合婷婷激情| 欧美精品导航| 99热最新在线|