楊秀璋,宋籍文,武 帥,3,廖文婧,任天舒,劉建義
(1.貴州財經大學信息學院,貴州 貴陽 550025;2.貴州高速公路集團有限公司;3.漣水縣財政局)
隨著微博、博客、網頁新聞等領域的出現,網絡輿情已成當下研究熱點。現階段表現較好的機器學習方法大都依賴于標注大量原始文本數據,再對測試數據進行處理,通常訓練集和測試集均需來源于相同領域、平臺或場景的數據。然而,這些方法較難對場景遷移或跨平臺、跨領域的輿情事件進行情感分析研究,且遷移場景的輿情態勢感知越來越重要。因此,如何高效地檢測場景遷移和跨平臺輿情事件的情感傾向和走勢,將是未來研究重點,且能減少數據標注花費的精力,讓模型具有更強的魯棒性和準確性。
針對上述問題,本文提出一種融合Bert (Bidirectional Encoder Representations from Transformers)預訓 練和BiLSTM(Bi-directional Long Short-Term Memory)的場景遷移情感分析模型,該模型能在少量數據標注的情況下,對未知類型進行預測并有效解決數據漂移問題。該模型將對微博輿情事件數據集進行訓練,然后遷移預測知乎輿情事件的情感傾向,最終體現模型對遷移場景具有較好的魯棒性和準確性。此外,本文通過詳細的對比實驗有效評估Bert-BiLSTM 模型的性能,這優于團隊之前的相關工作,即對“巴黎圣母院火災”輿情事件和“新冠肺炎疫情”輿情事件進行情感分析,并且該模型能應用于跨目標、跨領域、跨事件的輿情監測和情感分析。
二十一世紀以來,情感分析作為自然語言處理領域的重要研究熱點,在網絡輿情、文本挖掘領域均有較為廣泛的研究范疇。……