999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

定制產品用戶評論情感分析系統

2021-08-24 01:38:00鄒亞男宋學官
機電產品開發與創新 2021年4期

張 林, 鄒亞男, 孫 偉, 宋學官

(大連理工大學 機械工程學院, 遼寧 大連 116024)

0 引言

隨著經濟的快速發展,高層建筑的數量逐漸增多,電梯慢慢成為了人們生活中不可或缺的工具之一。 電梯使用頻率的增加, 也導致人們對于電梯的性能品質有了更高的需求。 因此,在產品定制過程中,消費者的乘梯體驗顯的尤為重要。構建電梯評價情感分析系統,可以幫助企業直觀的了解用戶的體驗,使電梯產品的開發與創新更加精準與高效。

因具有將海量文本信息量化的優點,目前,文本情感分析技術被廣泛應用于工業、 服務業等。 2003 年Kusha等[1]人開發了第一個情感分析系統“ReviewSeer”,從用戶評論中挖掘產品優劣勢。之后,越來越多的情感分析系統應運而生。 但是,目前還未出現針對電梯領域的情感分析系統。 本文建立電梯用戶評價情感分析系統,為電梯的生產改進提供意見。

1 情感分析系統總體設計

用戶乘梯后輸入評價,系統存入評論數據至數據庫。獲得評論語料后劃分句子, 基于依存句法分析定位評價電梯的情感詞,識別表征電梯產品特性的屬性詞,例如,“速度”等。 抽取評價單元后,判斷其情感極性和強度,并將評價單元歸類。 最后,利用可視化技術,直觀表達情感分析結果。 系統流程見圖1。

圖1 系統流程

2 情感分析系統功能實現

2.1 電梯評價單元的抽取

在句子中,兩個詞語之間的語法關系稱為依存關系[2]。挖掘產品特征,主要關注句子中詞語之間的依存關系及詞性。 文本預處理后, 使用HanLP 包進行依存句法分析,實例如圖2 所示。

圖2 依存句法樹

本文根據句法依存特點, 總結了四類評價單元抽取規則: ①從句子核心詞 (核心關系指向詞)詞性出發。 當核心詞為屬性詞或情感詞,通過限制其詞性和依存關系,提取評價單元;②從核心詞的依存關系出發。限定依存關系,查找出依賴于核心詞的屬性詞或情感詞,從而提取評價單元;③對于前兩步提取的屬性詞和情感詞,查找其依存關系為并列關系的詞語;④對于前面提取的屬性詞和情感詞, 通過限制與其依賴關系和詞語詞性,提取否定副詞、程度副詞等。

基于上述評價單元抽取規則, 隨機選取1000 條分句,抽取示例見表1。 同時進行算法和人工抽取,N正—抽取的正確評價單元數量,N抽—抽取出的全部評價單元數量,N實—評價中實際含有的評價單元數量, 實驗評價結果如下:

表1 評價單元抽取示例

正確率從質量的角度反映系統的分類準確率; 召回率是從數量的角度來考察系統分類的完備性。 本文抽取規則的實驗結果在這兩個指標方面表現均衡。

2.2 情感詞極性的判斷

用戶通過情感詞對電梯特性做出評價,所以,判斷評價單元中評價詞的情感詞極性成為用戶情感分析的關鍵。 本文運用情感詞典、 同義詞林和word2vce 結合的方法,將評價詞的情感極性劃分為積極和消極兩類。

2.2.1 情感詞典構建

情感詞典是文本感情分類的核心部分, 主要由積極情感詞典、消極情感詞典、否定詞典、程度副詞詞典以及領域搭配詞典五部分組成。本文整合HowNet 詞典[3]、中文褒貶詞典[4]和臺灣大學NTUSD 詞典[4]作為基礎詞典。

另外,在電梯行業,“小”形容“噪音”是積極情感,而搭配“空間”則是消極情感。因此,本文建立了電梯領域的搭配詞典,以達到盡可能高的情感分類準確率。

程度副詞來自HowNet 情感詞典,否定詞詞典采用公認的中文否定詞詞典。

2.2.2 基于同義詞林和word2vec 的相似度計算

(1)基于同義詞林的相似度計算。本文采用由朱新華等人改進的同義詞詞林[5],該詞林層次結構關系見圖3。

圖3 同義詞林樹形結構

本文采用朱新華等人提出的基于信息內容詞語相似度計算方法[6],如公式(1)所示,即計算出所有概念組合的相似度后,取相似度最大值作為詞語W1和W2的相似度,公式如(2)所示:

其中,MinDIFF 、MaxDIFF 分別表示C1、C2兩個詞語之間的最小、最大差異值,dis(C1,C2)為Jiang 等[7]提出的計算C1、C2差異性的函數。

(2)基于word2vec 的語義相似度計算。word2vec 是一種將詞表征為實數值向量的單隱層神經網絡模型, 通過訓練實現文本到向量的轉化, 通過計算向量之間的cosine 值來量化文本語義上的相似度。 余弦相似度計算公式如(3)所示:

其中,Xi、Yi代表詞語對應向量。 本文爬取電梯用戶評價3000 條,用于訓練word2vec 模型,計算詞語之間的相似性。

2.2.3 判斷情感詞極性

判斷情感詞極性的算法流程,見圖4。 評價單元首先與詞典匹配,識別含有描述電梯特定屬性的情感評價詞,標記評價詞的情感極性。

圖4 情感詞極性判斷流程

未被匹配的評價單元,利用同義詞林、詞向量和已識別的情感詞進行傾向判斷。 計算與已標記的積極評價詞相似度均值和消極評價詞相似度均值的差值, 判斷評價詞的情感極性。 計算公式如(4)所示,PN、NN 分別為已標記的積極和消極情感詞數量。 S>0 時,標記評價詞情感極性為正面,反之為負面。

從上述抽取規則等到的評價單元中隨機選取200 條數據, 同時進行算法和人工識別, 實驗結果評價如下: 精確率:P=92%; 召回率:R=98%;綜合指標:F=94.9%。

2.3 評價單元情感強度計算

計算評價單元情感強度需考慮詞組中詞語的詞性和位置。評價詞組中,程度副詞和否定詞直接影響詞組的情感極性和強度。 因此,對于程度副詞和否定詞,本文按照詞典中劃分的不同等級進行賦值, 其值分別用ID、IN表示。 另設定積極情感詞權值為1,消極情感詞權值為-1。按照圖5 所示規則計算評價詞組情感強度。

圖5 情感強度計算規則

首先定位評價詞組中情感詞位置, 檢測其前面詞語的詞性類別。 例如,前面僅有一個程度副詞或否定詞時,評價單元的情感權重I 取情感詞權重的ID或IN倍。 最終得到的評價單元權重即為情感強度, 其值為正表示評價單元為正面評價,反之則為負面。

3 基于語義相似度計算的指標歸類

在對電梯某一特性評價時, 可能會出現不同的文本表述,因此本系統對這些不同的評價表達進行歸類,使評價結果更好的展現出來。文本結合項目需求,調整歸納關鍵詞,確定外觀、噪音等12 個評價指標。

利用上文訓練的word2vec 語義相似度計算模型,判斷各評價單元中屬性詞與預先設定指標的相似度, 將相應的評價單元歸類于相似度最大的指標。 隨機抽取200組評價單元, 同時進行算法和人工歸類, 實驗結果評價為:準確率P=86%,滿足系統需求。

4 結束語

本文提出了一種基于文本情感分析技術的電梯用戶評論情感分類與量化方法,并利用Django 與Vue 結合的技術開發了相應的情感分析系統。 用戶輸入評價后,經過后端數據處理,電梯各評價指標評價正負面評價數量、指標得分、電梯總體得分等數據均有直觀展示。該系統具有從大量文本中高效的提取用戶情感并量化為具體數值的功能,定制產品生產過程中為制造商洞察用戶體驗提供便利。

主站蜘蛛池模板: 一级香蕉视频在线观看| 一级成人a做片免费| 亚洲 日韩 激情 无码 中出| 亚洲男人天堂网址| 91麻豆精品视频| 成人免费网站久久久| 国产一级片网址| 欧美色99| 欧美精品亚洲精品日韩专| 国产女主播一区| 亚洲有无码中文网| 中文字幕色站| 日韩大乳视频中文字幕| 91视频99| 国产99在线观看| 亚洲欧美综合另类图片小说区| 国产本道久久一区二区三区| 亚洲国产精品不卡在线 | 婷婷亚洲综合五月天在线| 九九久久精品国产av片囯产区| 亚洲欧洲一区二区三区| 精品久久777| 亚欧成人无码AV在线播放| 热伊人99re久久精品最新地| 欧美性天天| 免费在线观看av| 91在线播放国产| 日本人妻丰满熟妇区| 中日无码在线观看| 最新日本中文字幕| 国产人妖视频一区在线观看| 欧美一道本| 国产一区二区三区精品久久呦| 国产成人久视频免费| 伦精品一区二区三区视频| 久久成人免费| 在线观看国产黄色| 全午夜免费一级毛片| 综合人妻久久一区二区精品| 中文成人在线视频| 夜夜爽免费视频| 国产69囗曝护士吞精在线视频| 人妻熟妇日韩AV在线播放| 一本二本三本不卡无码| 国产成年无码AⅤ片在线| 亚洲精品中文字幕无乱码| 色综合手机在线| 欧美国产日产一区二区| 男女猛烈无遮挡午夜视频| 亚洲日韩高清在线亚洲专区| 波多野结衣国产精品| 99视频精品全国免费品| av无码久久精品| 玖玖免费视频在线观看| …亚洲 欧洲 另类 春色| 国产新AV天堂| 国产精品尤物在线| 99热这里只有精品在线观看| 97成人在线视频| 国产熟女一级毛片| 在线观看热码亚洲av每日更新| 日韩在线中文| 天天色天天操综合网| 久久久久亚洲AV成人网站软件| 亚洲三级色| 人妻21p大胆| 黄色在线不卡| 中美日韩在线网免费毛片视频| 国产91高清视频| 国产波多野结衣中文在线播放| 国产xxxxx免费视频| 69av免费视频| 欧美成人手机在线观看网址| 在线国产你懂的| 国产乱子精品一区二区在线观看| 国产精品对白刺激| 日韩黄色精品| 亚洲黄色高清| 自拍偷拍欧美| 色综合日本| 好吊色妇女免费视频免费| 国产精品性|