999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于主題挖掘和情感分析的在線健康社區(qū)用戶評(píng)論研究

2025-07-30 00:00:00郭羽婷姚宣合
現(xiàn)代情報(bào) 2025年8期

摘 要:[目的/意義]在線健康社區(qū)為用戶提供線上健康服務(wù),分析其用戶評(píng)論的潛在信息,對(duì)于醫(yī)療服務(wù)質(zhì)量的提高和健康社區(qū)信息建設(shè)的優(yōu)化具有重要意義。[方法/過(guò)程]本文提出了一個(gè)在線健康社區(qū)用戶評(píng)論分析模型。首先,通過(guò)隱含狄利克雷分布(Latent Dirichlet Allocation,LDA)主題模型挖掘患者評(píng)論的主題;其次,使用分類模型對(duì)患者評(píng)論進(jìn)行主題分類;最后,通過(guò)詞頻—逆文檔頻率(Term Frequency-Inverse Document Frequency,TF-IDF)方法以及情感傾向點(diǎn)互信息(Semantic Orientation Pointwise Mutual Information,SO-PMI)方法構(gòu)建領(lǐng)域情感詞典,計(jì)算各個(gè)主題的患者評(píng)論文本的情感得分,分析不同情感傾向的評(píng)論信息。[結(jié)果/結(jié)論]通過(guò)分析“好大夫在線”綜合性三甲醫(yī)院的用戶評(píng)論數(shù)據(jù),對(duì)其進(jìn)行實(shí)證研究,根據(jù)實(shí)驗(yàn)結(jié)果的信息內(nèi)容和規(guī)律,提出了改進(jìn)醫(yī)療服務(wù)和信息建設(shè)的相關(guān)參考建議。

關(guān)鍵詞:健康社區(qū);用戶評(píng)論;主題挖掘;文本分類;情感分析

DOI:10.3969/j.issn.1008-0821.2025.08.011

〔中圖分類號(hào)〕G203 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2025)08-0135-11

Research on User Reviews of Online Health Community

Based on Topic Mining and Sentiment Analysis

Guo Yuting* Yao Xuanhe

(Department of Information Science and Technology,Northeast Normal University,Changchun 130117,China)

Abstract:[Objective/Significance]Online health communities provide online health services for users,and analyzing the potential information of user comments is of great significance for improving the quality of medical services and optimizing the information construction of healthy communities.[Method/Process]The study proposed an online health community user comment analysis model.Firstly,the LDA topic model was used to dig the topic of patient comments.Next,the classification models were used to classify the patient comments into different topics.Finally,word frequency screening,TF-IDF and SO-PMI method were used to construct a domain sentiment dictionary which was employed to calculate the sentiment score of patient comments in each topics.And comment information of different sentiments were further analyzed.[Result/Conclusion]Empirical research is conducted by analyzing the user comment data of General Grade Three hospital from“Good Doctor Online”.According to the information content and rules of the experimental results,relevant reference suggestions for improving medical service and information construction are put forward.

Key words:healthy communities;user reviews;topic mining;text classification;sentiment analysis

在科技發(fā)展、政策支持以及民眾就醫(yī)習(xí)慣改變的背景下,中國(guó)醫(yī)療健康互聯(lián)網(wǎng)化趨勢(shì)明顯,以移動(dòng)健康管理以及在線健康社區(qū)為代表的互聯(lián)網(wǎng)健康實(shí)踐發(fā)展迅猛[1]。據(jù)第54次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,截至2024年6月,中國(guó)互聯(lián)網(wǎng)醫(yī)療用戶規(guī)模達(dá)3.65億人,占網(wǎng)民整體的33.2%[2]。在線健康社區(qū)是用戶進(jìn)行健康信息交流、經(jīng)驗(yàn)分享、問(wèn)答咨詢的開放式網(wǎng)絡(luò)平臺(tái)[3],為公眾快捷地獲取和利用健康信息提供了極大的便利。患者評(píng)論是在線健康社區(qū)信息的重要內(nèi)容之一,能夠充分體現(xiàn)患者在診療過(guò)程中的真實(shí)感受;且患者是在線健康社區(qū)使用的直接用戶,因此,挖掘當(dāng)前在線健康社區(qū)用戶發(fā)表評(píng)論的規(guī)律,分析患者評(píng)論信息的內(nèi)涵和結(jié)構(gòu),對(duì)于提升醫(yī)療服務(wù)質(zhì)量、優(yōu)化健康社區(qū)信息組織建設(shè)具有重要價(jià)值。

本文提出了一個(gè)在線健康社區(qū)用戶評(píng)論分析模型,對(duì)患者評(píng)論文本進(jìn)行主題挖掘和情感分析。以“好大夫在線”綜合性三甲醫(yī)院患者評(píng)論數(shù)據(jù)為例,基于隱含狄利克雷分布(Latent Dirichlet Allocation,LDA)方法挖掘患者關(guān)注的主題,采用機(jī)器學(xué)習(xí)方法,較為精確地對(duì)用戶評(píng)論進(jìn)行主題分類,并構(gòu)建健康社區(qū)領(lǐng)域情感詞典,分析不同主題下患者評(píng)論的情感傾向。根據(jù)負(fù)面評(píng)論主題內(nèi)容回溯、評(píng)論信息的潛在規(guī)律,從患者、健康社區(qū)用戶角度出發(fā),提出改善醫(yī)療服務(wù)、優(yōu)化在線健康社區(qū)信息組織和建設(shè)的參考建議。

1 相關(guān)研究

隨著中國(guó)互聯(lián)網(wǎng)醫(yī)療的快速發(fā)展,許多健康社區(qū)平臺(tái)都推出了患者評(píng)論功能,如“好大夫在線”“39健康網(wǎng)”“微醫(yī)網(wǎng)”等[4],患者在醫(yī)院接受了醫(yī)療服務(wù)后,可以通過(guò)在線健康社區(qū)平臺(tái)分享就醫(yī)感受。患者評(píng)論是由已就診的患者或患者家屬撰寫,通過(guò)相關(guān)手機(jī)應(yīng)用或者網(wǎng)頁(yè)發(fā)表于在線健康社區(qū)平臺(tái)上的評(píng)論,是在線評(píng)論的一個(gè)分支。患者評(píng)論的形式包括文字、圖片、語(yǔ)音等,內(nèi)容包括就診體驗(yàn)、感受、實(shí)況等。患者評(píng)論作為一種醫(yī)療評(píng)論信息,對(duì)解決傳統(tǒng)醫(yī)療服務(wù)環(huán)境中的信息不完全和信息不對(duì)稱問(wèn)題起著至關(guān)重要的作用[5],為其他用戶提供了擇醫(yī)、就醫(yī)、愈后相關(guān)的參考信息。患者評(píng)論具有實(shí)時(shí)性強(qiáng)、易于獲取、成本低等特點(diǎn),蘊(yùn)含巨大的研究潛力。然而,健康社區(qū)并未對(duì)海量患者評(píng)論內(nèi)容進(jìn)行挖掘和特征標(biāo)識(shí),導(dǎo)致用戶若想?yún)⒖即祟愒u(píng)論,需要耗費(fèi)大量的時(shí)間和精力閱讀評(píng)論內(nèi)容。為了挖掘在線健康社區(qū)用戶評(píng)論蘊(yùn)含的醫(yī)療服務(wù)和健康信息,相關(guān)研究者分別從情感分析、主題挖掘等方面展開研究。

情感分析是自然語(yǔ)言處理研究領(lǐng)域中的一個(gè)重要的研究方向,主要研究如何從文本中發(fā)現(xiàn)或挖掘人們對(duì)于某種事物、產(chǎn)品或服務(wù)所表達(dá)出的情感或意見[6]。高慧穎等[7]根據(jù)在線患者評(píng)論文本具有專業(yè)性強(qiáng)、差異性大、非規(guī)范性的特點(diǎn),提出了基于特征加權(quán)詞向量的在線患者評(píng)論情感分析方法。該方法利用Word2vec構(gòu)建詞向量模型,抽取情感詞集合,完善醫(yī)療服務(wù)領(lǐng)域情感詞典,有效地獲知在線醫(yī)療評(píng)論的情感傾向。Rahim A I等[8]對(duì)影響馬來(lái)西亞醫(yī)院Facebook評(píng)論中表達(dá)積極情感的決定因素,以及醫(yī)院認(rèn)證與Facebook評(píng)論中表達(dá)的情感之間的關(guān)系進(jìn)行實(shí)證研究,構(gòu)建情感分類器和服務(wù)質(zhì)量分類器,自動(dòng)對(duì)評(píng)論的情感和SERVQUAL維度進(jìn)行分類,利用邏輯回歸分析來(lái)探究影響表達(dá)積極情感的決定因素。王輝等[9]通過(guò)SOPMI算法擴(kuò)充基礎(chǔ)情感詞典、構(gòu)建領(lǐng)域情感詞典來(lái)分析“好大夫在線”健康社區(qū)中重大慢病患者評(píng)論的情感傾向,分析重大慢病患者評(píng)論負(fù)面傾向的重要影響因素。熊回香等[10]就如何從海量針對(duì)醫(yī)生服務(wù)的用戶評(píng)論中挖掘出醫(yī)生服務(wù)的相關(guān)特征,并使用BiLSTM模型獲取用戶對(duì)目標(biāo)醫(yī)生每一服務(wù)特征類別的情感分值,結(jié)合權(quán)重計(jì)算得出醫(yī)生服務(wù)的評(píng)價(jià)。

主題挖掘是指對(duì)文本內(nèi)容進(jìn)行整理、分析與邏輯推斷,從而分析出文本主題內(nèi)涵的過(guò)程[11]。Shah A M等[12]基于雙因素理論分析在線醫(yī)療評(píng)論,探討了患者對(duì)英國(guó)醫(yī)療服務(wù)的滿意度和不滿意度。該研究基于SentiNet和LDA相結(jié)合的文本挖掘方法來(lái)揭示患者評(píng)論的語(yǔ)義,發(fā)現(xiàn)了高風(fēng)險(xiǎn)和低風(fēng)險(xiǎn)疾病類別中的潛在主題。周歡等[4]基于社會(huì)網(wǎng)絡(luò)視角,分析在線健康社區(qū)評(píng)論的有用性。首先,使用TF-IDF、TextRank以及LDA方法分析患者評(píng)論的主題分布;隨后,將各類患者評(píng)論文本分別轉(zhuǎn)換為文本關(guān)聯(lián)網(wǎng)絡(luò),使用社會(huì)網(wǎng)絡(luò)分析方法進(jìn)一步分析患者評(píng)論的有用性特征。文獻(xiàn)[13-14]采用情感分析和主題挖掘相結(jié)合的方式對(duì)健康社區(qū)用戶評(píng)論進(jìn)行分析。葉艷等[13]以“好大夫在線”平臺(tái)上的高血壓患者評(píng)論作為研究數(shù)據(jù),采用LDA主題模型得到13個(gè)患者評(píng)論主題,再結(jié)合相關(guān)文獻(xiàn)將得到的患者評(píng)論主題合并為6個(gè)醫(yī)療服務(wù)質(zhì)量主題,然后根據(jù)BiLSTM模型得到各服務(wù)質(zhì)量主題的情感傾向分布,并分析產(chǎn)生負(fù)面情感的原因。余佳琪等[14]在LDA主題模型的基礎(chǔ)上融入情感信息與時(shí)間信息,對(duì)甜蜜家園糖尿病患者的評(píng)論數(shù)據(jù)進(jìn)行挖掘。考慮了評(píng)論數(shù)據(jù)的時(shí)間屬性對(duì)主題與情感可能產(chǎn)生影響,識(shí)別疾病確診階段、并發(fā)癥階段等共7個(gè)時(shí)間片內(nèi)的評(píng)論熱點(diǎn)主題與伴生的情感強(qiáng)度及類型,揭示了主題、情感隨時(shí)間演化的特征。

綜上所述,已有健康社區(qū)用戶評(píng)論相關(guān)的研究從情感分析和主題挖掘?qū)︶t(yī)療評(píng)價(jià)、情感傾向影響因素、特殊疾病患者關(guān)注主題、信息有用性分析、主題和情感演化特征等方面展開工作。在相關(guān)研究中,將主題挖掘和情感分析相結(jié)合來(lái)研究患者評(píng)論的工作較少。文獻(xiàn)[13]分析了不同服務(wù)質(zhì)量主題的情感傾向分布,但文獻(xiàn)[13]未考慮同一評(píng)論可能涉及不同的主題,而將LDA主題模型中概率最大的主題作為該評(píng)論的主題,文檔所屬主題類別歸類方式較為粗略。文獻(xiàn)[14]在LDA主題模型的基礎(chǔ)上融入情感信息,但文獻(xiàn)[14]側(cè)重于分析評(píng)論數(shù)據(jù)的時(shí)間屬性對(duì)主題與情感可能產(chǎn)生的影響、主題情感隨不同時(shí)間段演化的特征情況。且文獻(xiàn)[13-14]針對(duì)特定群體(高血壓患者和糖尿病患者)的在線評(píng)論進(jìn)行研究,僅僅分析了某種特殊疾病群體的情感和關(guān)注主題。為了突破現(xiàn)有工作的局限性,本文提出一種針對(duì)患者評(píng)論分析的主題挖掘與情感分析框架。首先,采用LDA主題模型對(duì)患者評(píng)論進(jìn)行主題挖掘;其次,將患者評(píng)論切分為子句序列,通過(guò)人工進(jìn)行主題類別標(biāo)注;然后,使用人工標(biāo)注的患者評(píng)論數(shù)據(jù)訓(xùn)練機(jī)器學(xué)習(xí)分類模型,再使用分類模型對(duì)未標(biāo)注的評(píng)論子句進(jìn)行較高精度的主題分類;最后,構(gòu)建領(lǐng)域情感詞典,使用領(lǐng)域情感詞典對(duì)各個(gè)主題下的患者評(píng)論文本進(jìn)行情感分類。在實(shí)證研究中,本文對(duì)“好大夫在線”平臺(tái)上北京、上海的5家綜合性三甲醫(yī)院的患者評(píng)論進(jìn)行分析,探討在不同主題下患者的情感傾向,挖掘當(dāng)前在線健康社區(qū)用戶發(fā)布評(píng)論的信息和規(guī)律。

2 研究設(shè)計(jì)

本文提出了一種基于LDA主題挖掘和情感分析的在線健康社區(qū)患者評(píng)論分析框架,以中文在線健康社區(qū)的患者評(píng)論為數(shù)據(jù)源,分析患者關(guān)注的主題內(nèi)容和情感傾向。研究框架如圖1所示。

圖1 研究框架Fig.1 Research Framework

2.1 評(píng)論數(shù)據(jù)的采集與預(yù)處理

2.1.1 患者評(píng)論采集

本文使用后羿采集器軟件,采集在線健康社區(qū)平臺(tái)上的患者評(píng)論數(shù)據(jù)。首先,瀏覽多個(gè)在線健康社區(qū)上患者發(fā)表的相關(guān)評(píng)論內(nèi)容,主要考慮患者評(píng)論的數(shù)量;其次,確定目標(biāo)在線健康社區(qū)平臺(tái),獲取該平臺(tái)上患者發(fā)表評(píng)論的頁(yè)面地址;最后,設(shè)計(jì)后羿采集器的爬蟲模式,在爬蟲的目標(biāo)網(wǎng)頁(yè)中點(diǎn)擊選中所需的字段內(nèi)容,并制定后羿采集器采集網(wǎng)頁(yè)信息的頁(yè)面加載規(guī)則,采集患者評(píng)論數(shù)據(jù)。

2.1.2 數(shù)據(jù)的預(yù)處理

在線評(píng)論文本包含網(wǎng)頁(yè)地址、表情等噪聲數(shù)據(jù),且為無(wú)結(jié)構(gòu)文本形式,如不加以處理,可能會(huì)影響后續(xù)主題挖掘的結(jié)果,以及文本分類和情感分類的準(zhǔn)確性。因此,需要對(duì)在線評(píng)論進(jìn)行數(shù)據(jù)預(yù)處理[15]。數(shù)據(jù)預(yù)處理是指對(duì)采集到的原始數(shù)據(jù)進(jìn)行清理、加工,去除具有干擾性的無(wú)效信息,將原始數(shù)據(jù)轉(zhuǎn)化為完整、一致的形式。本文的數(shù)據(jù)預(yù)處理方法包括數(shù)據(jù)剔除、分詞、去除停用詞3個(gè)步驟。

使用Jieba分詞工具下的精確模式對(duì)患者評(píng)論文本進(jìn)行分詞。

2.2 患者評(píng)論主題挖掘

LDA(Latent Dirichlet Allocation)模型是由Blei D M等[16]于2003年提出的一種文檔集(或語(yǔ)料庫(kù))的生成式概率模型,其基本思想是將文檔表示為潛在主題的隨機(jī)混合,其中每個(gè)主題都以單詞分布為特征。LDA模型采用詞袋模型降低文本維度,通過(guò)無(wú)監(jiān)督方式挖掘“文檔—主題”分布和“主題—詞”分布,在文本挖掘中常用于識(shí)別大規(guī)模、非結(jié)構(gòu)化文檔集(或語(yǔ)料庫(kù))中的隱藏主題信息。LDA主題模型原理如圖2[16]所示。

圖2 LDA模型Fig.2 LDA Model

M表示文檔的總數(shù)、N表示文檔包含詞總數(shù),K是主題數(shù)。α和η是兩個(gè)參數(shù)。θ表示文檔m的主題分布,m=1,2,…,M;β表示第k個(gè)主題的詞分布,k=1,2,…,K。由參數(shù)為α的狄利克雷分布采樣生成θ,θ~Dir(α);由參數(shù)為η的狄利克雷分布采樣生成β,β~Dir(η)。文檔和主題之間服從多項(xiàng)式分布,主題和詞之間也服從多項(xiàng)式分布。由參數(shù)為θ的多項(xiàng)式分布采樣生成主題z,z~Multinomial(θ);由以z、β為條件的多項(xiàng)式分布采樣生成詞w,如此循環(huán)直到生成一個(gè)文檔,并最終生成M個(gè)文檔。最終生成文檔與原始文檔一致性越高,模型的性能越好。LDA模型的聯(lián)合分布如式(1)[16]所示:

p(θ,z,w|α,β)=p(θ|α)∏Nn=1p(zn|θ)p(wn|zn,β)(1)

最佳主題數(shù)K可根據(jù)計(jì)算一致性來(lái)確定,一致性最大時(shí),所對(duì)應(yīng)的主題數(shù)為最佳主題,一般情況下,當(dāng)一致性不再增加或處于拐點(diǎn)時(shí)的主題數(shù)為最優(yōu)。

2.3 患者評(píng)論主題分類

2.3.1 文本分類的數(shù)據(jù)處理

經(jīng)過(guò)對(duì)患者評(píng)論文本進(jìn)行主題挖掘,得到主題挖掘的結(jié)果。然而,在患者的一條評(píng)論中,往往會(huì)包含多個(gè)主題信息。這種現(xiàn)象在較長(zhǎng)的評(píng)論中尤為常見。而在較短的評(píng)論子句中,表達(dá)的主題通常會(huì)比較單一。因此,在本文的主題分類中,為了提高分類的準(zhǔn)確性,需要把每條評(píng)論分割為多個(gè)子句。在漢語(yǔ)的表達(dá)中,除了頓號(hào)之外,其他的標(biāo)點(diǎn)符號(hào)通常用于將前后表達(dá)的不同內(nèi)容分開。因此,本文將逗號(hào)、分號(hào)、句號(hào)、感嘆號(hào)、問(wèn)號(hào)作為每條患者評(píng)論的切割點(diǎn)[20],按照切割點(diǎn)對(duì)患者評(píng)論進(jìn)行切割,把每條患者評(píng)論分割成多條子句,如表1所示。

2.3.2 人工標(biāo)注

隨機(jī)抽取10%的評(píng)論子句,按照主題挖掘的結(jié)果對(duì)子句進(jìn)行主題類別的人工標(biāo)注。為了保證人工標(biāo)注的客觀性,由兩位研究人員在互不干擾的情況下,根據(jù)挖掘出的主題特征,對(duì)樣本子句所屬的主題類別進(jìn)行標(biāo)注。人工標(biāo)注完成后,使用SPSS軟件計(jì)算標(biāo)注結(jié)果的Kappa系數(shù),從而判斷人工標(biāo)注的可靠性。計(jì)算得到的Kappa系數(shù)值若是在可靠的范圍內(nèi),則用其進(jìn)行下一步研究;計(jì)算得到的Kappa系數(shù)值未在可靠的范圍之內(nèi),則重新歸納總結(jié)挖掘出的主題特征,再次進(jìn)行人工標(biāo)注和計(jì)算人工標(biāo)注結(jié)果的Kappa系數(shù)值,直至其數(shù)值在可靠的范圍內(nèi)。此外,使用Python數(shù)據(jù)分析工具對(duì)兩位標(biāo)注者的標(biāo)注結(jié)果做差異對(duì)比,找出標(biāo)注結(jié)果不同的評(píng)論子句。兩位標(biāo)注者針對(duì)標(biāo)注結(jié)果不一致的評(píng)論子句進(jìn)行協(xié)商討論,最終使用意見一致的標(biāo)注結(jié)果作為本文實(shí)驗(yàn)的數(shù)據(jù)。

2.3.3 訓(xùn)練分類模型

本文使用Python Sklearn庫(kù)中的CountVectorizer包對(duì)人工標(biāo)注的子句評(píng)論文本進(jìn)行特征提取,分類器采用Sklearn庫(kù)中的決策樹模型、支持向量機(jī)模型、K近鄰模型以及樸素貝葉斯模型。本文用訓(xùn)練集訓(xùn)練4種分類模型,用測(cè)試集測(cè)試4種模型的分類效果,以準(zhǔn)確率、精準(zhǔn)率、F1-Score這3個(gè)指標(biāo)作為評(píng)估分類模型的評(píng)價(jià)指標(biāo),采用5折交叉驗(yàn)證策略調(diào)參。

選擇最優(yōu)分類模型對(duì)其余未人工標(biāo)注的子句進(jìn)行主題分類后,將ID值相同、且所屬主題相同的子句進(jìn)行合并,如圖3所示,再對(duì)各個(gè)主題的評(píng)論進(jìn)行歸類匯總,能更客觀地、可靠地分析患者對(duì)于不同主題評(píng)論的信息。

圖3 合并子句示例圖Fig.3 Merging Short Sentences Sample

2.4 患者評(píng)論文本情感分析

2.4.1 構(gòu)建領(lǐng)域情感詞典

首先,將知網(wǎng)的HowNet情感詞典和臺(tái)灣大學(xué)簡(jiǎn)體中文情感詞典(National Taiwan University Simplified Chinese Sentiment Dictionary,NTUSD)情感詞典合并作為基礎(chǔ)情感詞典[17];其次,對(duì)患者評(píng)論語(yǔ)料文本按照前文介紹的數(shù)據(jù)預(yù)處理方法進(jìn)行分詞和過(guò)濾停用詞處理,觀察后總結(jié)出在該領(lǐng)域中,情感詞出現(xiàn)頻率較高的詞性;其次,通過(guò)TF-IDF方法提取關(guān)鍵詞,并同時(shí)添加詞性篩選條件,獲得詞性為形容詞、名詞、動(dòng)詞、副詞的關(guān)鍵詞[21],并對(duì)關(guān)鍵詞進(jìn)行人工篩選,確定種子情感詞;最后,使用情感傾向點(diǎn)互信息(Semantic Orientation Pointwise Mutual Information,SO-PMI)方法確定其他詞語(yǔ)與種子情感詞的關(guān)聯(lián)程度,設(shè)定關(guān)聯(lián)閾值,從而篩選出候選情感詞,將種子情感詞與候選情感詞合并加入基礎(chǔ)情感詞典中,構(gòu)建領(lǐng)域情感詞典。

2.4.2 計(jì)算患者評(píng)論情感得分

將正面情感詞權(quán)重設(shè)定為1,負(fù)面情感詞權(quán)重設(shè)定為-1。程度詞劃分為6個(gè)級(jí)別,從小到大依次賦予的分值為:0.5、0.8、1.2、1.5、1.7、2。當(dāng)評(píng)論中出現(xiàn)“沒(méi)有”“不”等否定詞時(shí),否定詞會(huì)顛倒整條語(yǔ)句的情感傾向,并且每出現(xiàn)一次否定詞,情感傾向就會(huì)發(fā)生一次反轉(zhuǎn)。因此,將否定詞權(quán)重設(shè)定為-1,情感得分的計(jì)算公式如式(2)~(3)所示:

score分句=∑(-1)n·wa·ws(2)

score總句=∑score分句(3)

其中,wa表示程度詞權(quán)重,ws表示情感詞權(quán)重,n為否定詞出現(xiàn)的次數(shù),總句指被計(jì)算情感得分的評(píng)論語(yǔ)句,分句指根據(jù)分割符號(hào)將總句分割后得到的子句。

3 實(shí)證研究

3.1 數(shù)據(jù)準(zhǔn)備

中國(guó)比較知名的在線健康社區(qū)有“好大夫在線”“春雨醫(yī)生”“39健康網(wǎng)”“丁香園”等。其中,“好大夫在線”平臺(tái)于2006年創(chuàng)建,目前已有18年的歷史,具備豐富的健康信息數(shù)據(jù)和較為成熟的運(yùn)行模式。該平臺(tái)收錄了全國(guó)10 083家醫(yī)院905 175位醫(yī)生數(shù)據(jù),且醫(yī)生在該平臺(tái)上的活躍度較高[18]。文本挖掘研究需要大量的數(shù)據(jù)支持,而綜合型三甲醫(yī)院的病患相對(duì)較多,其患者評(píng)論數(shù)據(jù)也較為豐富。因此,本文選取了北京和上海的5家三甲綜合性醫(yī)院(包括:北京朝陽(yáng)醫(yī)院、北京同仁醫(yī)院、上海第六人民醫(yī)院、上海瑞金醫(yī)院、上海新華醫(yī)院)在“好大夫在線”平臺(tái)上的患者評(píng)論作為研究的數(shù)據(jù)來(lái)源。

使用后羿采集器對(duì)這5所醫(yī)院在2020年10月1日—2022年9月22日的患者評(píng)論數(shù)據(jù)進(jìn)行采集,共獲得40 293條評(píng)論文本。評(píng)論前面存在“看病描述:”“看病過(guò)程:”“康復(fù)狀況:”3個(gè)提示詞,這是“好大夫在線”平臺(tái)標(biāo)準(zhǔn)的患者評(píng)論內(nèi)容描述,因此將這些詞語(yǔ)刪除。進(jìn)行分詞和去停用詞處理后,用詞頻統(tǒng)計(jì)方法觀察文本預(yù)處理的效果,發(fā)現(xiàn)其中“醫(yī)生”“醫(yī)院”等詞出現(xiàn)的頻數(shù)排在前列。“醫(yī)生”“醫(yī)院”等詞在患者評(píng)論中的出現(xiàn)頻率雖然很高,但是不具備實(shí)際意義,對(duì)信息挖掘幫助不大,因而將詞頻高且無(wú)特殊性的詞添加到停用詞表中,再次使用過(guò)濾停用詞的方法刪除評(píng)論文本中的這類詞語(yǔ)。

3.2 患者評(píng)論的主題挖掘

本文通過(guò)計(jì)算LDA模型在不同主題數(shù)量下的一致性分值來(lái)確定最佳的主題個(gè)數(shù)。當(dāng)LDA主題模型的主題個(gè)數(shù)為4時(shí),如圖4所示,一致性分?jǐn)?shù)達(dá)到最高,為0.6576。同時(shí),運(yùn)用pyLDAvis將主題個(gè)數(shù)為4的LDA主題模型結(jié)果可視化,主題的4個(gè)氣泡分布均勻,并且無(wú)重疊現(xiàn)象,表明將LDA模型主題個(gè)數(shù)設(shè)置為4較為合理。

圖4 一致性系數(shù)Fig.4 Consistency Coefficient

LDA模型提取到各個(gè)主題下的主題詞屬于某個(gè)主題的概率值越大,表明該主題詞屬于這一主題的可能性越大。同一主題下主題詞之間的排序也是由概率值而定,概率越大,主題詞排序越靠前。表2展示了4個(gè)主題的前15個(gè)高概率主題詞。其中,在T1主題下的15個(gè)高頻詞主要是描繪醫(yī)者的醫(yī)術(shù)技能水平、態(tài)度和品德,因此將T1主題命名為“醫(yī)術(shù)醫(yī)德”;T2主題下的15個(gè)高頻詞中,“治療”“診斷”“方案”等詞與看病的過(guò)程有關(guān),“用藥”“效果”“好轉(zhuǎn)”“痊愈”等詞與用藥效果有關(guān),因此將T2主題命名為“用藥診斷”;T3主題下的15個(gè)高頻詞主要是描述手術(shù)及術(shù)后情況,因此將T3主題命名為“手術(shù)”;T4主題下的15個(gè)高頻詞中出現(xiàn)“掛號(hào)”“預(yù)約”“檢查”等詞,說(shuō)明T4主題與流程有關(guān),“手術(shù)室”“地方”等詞表示T4主題與環(huán)境有關(guān),因此將T4主題命名為“環(huán)境流程”。

3.3 患者評(píng)論的文本分類

從40 293條患者評(píng)論文本中隨機(jī)抽取20 200條評(píng)論進(jìn)行下一步研究。按照2.3.1小節(jié)介紹的文本分類數(shù)據(jù)處理方法對(duì)20 200條患者評(píng)論進(jìn)行處理后,得到51 002條評(píng)論子句。

將51 002條評(píng)論子句隨機(jī)打亂順序后,抽取其中10%的數(shù)據(jù)進(jìn)行人工標(biāo)注。人工標(biāo)注完成后,使用Kappa系數(shù)進(jìn)行人工標(biāo)注數(shù)據(jù)的一致性校驗(yàn),SPSS軟件計(jì)算Kappa系數(shù)的結(jié)果為0.796,根據(jù)一致性參考指標(biāo)(Kappa≥0.8為十分可靠,Kappa≥0.69較為可靠)[19],說(shuō)明本文人工標(biāo)注的數(shù)據(jù)結(jié)果較為可靠。

分類模型采用決策樹、樸素貝葉斯、支持向量機(jī)和K近鄰,使用隨機(jī)搜索和網(wǎng)格搜索相結(jié)合的策略尋找4個(gè)分類模型的最優(yōu)參數(shù)并訓(xùn)練分類模型。為了減少評(píng)估結(jié)果的隨機(jī)性,使用5折交叉驗(yàn)證的方式,最終結(jié)果取準(zhǔn)確率、精準(zhǔn)率、F1-Score的平均值,如表3所示。通過(guò)觀察4個(gè)分類模型、3個(gè)指標(biāo)的平均得分,發(fā)現(xiàn)支持向量機(jī)的3個(gè)評(píng)價(jià)指標(biāo)的平均得分都是最高。因此,選擇支持向量機(jī)作為患者評(píng)論文本的分類模型。

使用訓(xùn)練好的支持向量機(jī)分類模型對(duì)未人工標(biāo)注的評(píng)論進(jìn)行分類。然后將文本ID值和所屬主題類別相同的子句進(jìn)行合并。合并后,得到4個(gè)主題的患者評(píng)論共計(jì)29 767條。其中,提及“醫(yī)術(shù)醫(yī)德”主題的評(píng)論文本有16 001條;提及“用藥診斷”主題的評(píng)論文本有5 584條;提及“手術(shù)”主題的評(píng)論文本有5 297條;提及“環(huán)境流程”主題的評(píng)論文本有2 885條。4個(gè)主題的患者評(píng)論比例如圖5所示。

圖5 各個(gè)主題的患者評(píng)論占比Fig.5 The Proportion of Patient Reviews for EachSubject Category

由圖5可知,患者發(fā)表的評(píng)論中,“醫(yī)術(shù)醫(yī)德”主題評(píng)論的占比最高,“用藥診斷”和“手術(shù)”主題評(píng)論的占比緊隨其后,“環(huán)境流程”主題的評(píng)論占比是最低的。因此,“醫(yī)術(shù)醫(yī)德”是患者真實(shí)關(guān)注度最高的主題。該主題的評(píng)論大多數(shù)是描述醫(yī)方態(tài)度的,態(tài)度方面容易給患者留下較為深刻的印象,尤其是有不少患者在評(píng)論中表示,醫(yī)生作為專家,卻沒(méi)有架子,使患者感到親近感和尊重。患者在就醫(yī)之后,治療效果可能需要一段時(shí)間才能呈現(xiàn)。大多數(shù)用戶習(xí)慣在就診后不久發(fā)表評(píng)論,這個(gè)時(shí)間段發(fā)表的評(píng)論內(nèi)容可能只有對(duì)醫(yī)生態(tài)度的感受。“用藥診斷”和“手術(shù)”兩個(gè)主題下的評(píng)論占比相差不大,原因之一可能是在實(shí)際的治療過(guò)程中,用藥和診斷與手術(shù)是緊密聯(lián)系的,因此提及率類似。此外,“好大夫在線”平臺(tái)的患者評(píng)論發(fā)表的頁(yè)面中,該平臺(tái)設(shè)置了“看病過(guò)程:”“康復(fù)情況:”等提示,因此,患者發(fā)表關(guān)于“環(huán)境流程”類的評(píng)論較少,從而導(dǎo)致該主題的評(píng)論占比較低。

3.4 患者評(píng)論的情感分類

3.4.1 領(lǐng)域情感詞典的構(gòu)建結(jié)果

HowNet情感詞典包含4 566個(gè)正面情感詞,4 370個(gè)負(fù)面情感詞。NTUSD情感詞典包含2 810個(gè)正面情感詞,8 276個(gè)負(fù)面情感詞。首先,將HowNet和NTUSD情感詞典合并、去重得到基礎(chǔ)情感詞典,隨后,對(duì)基礎(chǔ)情感詞典進(jìn)行觀察,發(fā)現(xiàn)在基礎(chǔ)負(fù)面情感詞表中,存在“疾病”“病弱”等詞匯,這些詞匯在醫(yī)療服務(wù)領(lǐng)域中不具備負(fù)面情感。據(jù)統(tǒng)計(jì),其中共有71個(gè)詞匯在醫(yī)療服務(wù)領(lǐng)域不具備負(fù)面情感,因此將這些詞從基礎(chǔ)負(fù)面情感詞表中刪除。最終得到的基礎(chǔ)情感詞典中共包含7 176個(gè)正面情感詞,11 991個(gè)負(fù)面情感詞。使用TF-IDF在患者評(píng)論語(yǔ)料庫(kù)中提取正面種子情感詞389個(gè),負(fù)面種子情感詞68個(gè),然后采用SO-PMI方法確定語(yǔ)料庫(kù)中其他詞語(yǔ)與種子情感詞的關(guān)聯(lián)程度,獲得129個(gè)正面候選情感詞,111個(gè)負(fù)面候選情感詞。最終經(jīng)過(guò)去重后,形成醫(yī)療服務(wù)領(lǐng)域情感詞典,如表4所示。

3.4.2 情感分類結(jié)果

用上述構(gòu)建好的醫(yī)療服務(wù)領(lǐng)域情感詞典,計(jì)算4個(gè)主題下患者評(píng)論的情感得分。將情感得分大于0、小于0、等于0的患者評(píng)論分別劃分為正面評(píng)論、負(fù)面評(píng)論和中性評(píng)論。各個(gè)主題下的患者評(píng)論情感分類占比結(jié)果如圖6所示。結(jié)果發(fā)現(xiàn),4個(gè)主題下的患者評(píng)論均為正面評(píng)論居多,中性評(píng)論和負(fù)面評(píng)論占比較低,并且中性評(píng)論的占比大于負(fù)面評(píng)論占比。其中,“用藥診斷”和“手術(shù)”主題類的正面評(píng)論、中性評(píng)論、負(fù)面評(píng)論占比類似。“醫(yī)術(shù)醫(yī)德”主題類的正面評(píng)論占比位居4個(gè)主題的首位,高達(dá)98.37%,“環(huán)境流程”主題類的正面評(píng)論占比最低,為77.44%,且該主題的負(fù)面評(píng)論占比最高,為10.12%。

3.4.3 情感分類結(jié)果分析

對(duì)上述4個(gè)主題的正面評(píng)論、負(fù)面評(píng)論文本進(jìn)行詞云圖展示,展示結(jié)果如圖7~10所示。評(píng)論的情感極性是對(duì)該評(píng)論包含情感詞綜合衡量后的最終判定,但在評(píng)論文本中可能同時(shí)包含了負(fù)面情感詞和正面情感詞,因此,詞云圖中的單獨(dú)關(guān)鍵詞本身的極性可能并不能代表其所在評(píng)論的情感極性。根據(jù)下文詞云圖中關(guān)鍵詞,回溯到相應(yīng)的評(píng)論原文中,歸納出患者發(fā)表關(guān)于各類主題的正面評(píng)論、負(fù)面評(píng)論的原因。

觀察“醫(yī)術(shù)醫(yī)德”的正面評(píng)論詞云圖可知,“醫(yī)術(shù)”“醫(yī)德”“態(tài)度”等詞占據(jù)詞云圖中較大的面積。根據(jù)這些詞定位回評(píng)論原文中,發(fā)現(xiàn)“醫(yī)術(shù)”主要是與“精湛”“高超”等詞相連,稱贊醫(yī)生醫(yī)術(shù)好。“醫(yī)德”主要是與“高尚”等詞相連,贊美醫(yī)護(hù)人員的品德好。在“醫(yī)術(shù)醫(yī)德”的負(fù)面評(píng)論詞云圖中,“態(tài)度”一詞仍然占據(jù)詞云圖中較大的面積,意味著“態(tài)度”在該類主題的評(píng)論文本中是比較重要的,并且也分為待人態(tài)度和工作態(tài)度。在“醫(yī)術(shù)醫(yī)德”類的負(fù)面評(píng)論文本中,形容醫(yī)護(hù)人員的待人態(tài)度的詞主要有“不耐煩”“惡劣”“冷漠”等詞。形容醫(yī)護(hù)人員的工作態(tài)度的詞主要有“不負(fù)責(zé)任”“打發(fā)”“草草了事”等。

在“用藥診斷”主題下,觀察正面評(píng)論詞云圖,得到“問(wèn)診”“詳細(xì)”“耐心”“效果”等關(guān)鍵詞,用上述關(guān)鍵詞定位回“用藥診斷”類的正面評(píng)論文本,發(fā)現(xiàn)在用藥方面,讓患者滿意的主要是醫(yī)生能精準(zhǔn)用藥,且用藥效果良好,患者病情得到好轉(zhuǎn)。在診斷方面,讓患者滿意的原因有:醫(yī)生詳細(xì)地詢問(wèn)患者情況;醫(yī)生仔細(xì)檢查和看片子;能快速且準(zhǔn)確找到病因;耐心地給患者分析講解病情;制定適合的治療方案;給予患者合理的建議和指導(dǎo)。觀察“用藥診斷”主題下的負(fù)面評(píng)論的詞云圖,基于圖中“檢查”“看病”“治療”“不適”等詞,定位到該主題的負(fù)面評(píng)論文本中,歸納總結(jié)出患者發(fā)表關(guān)于“用藥診斷”主題不滿意的緣由。對(duì)于用藥方面,患者不滿意的原因有:醫(yī)生開的藥物過(guò)多,患者認(rèn)為已經(jīng)屬于過(guò)度醫(yī)療;藥物治療效果差,患者病情無(wú)好轉(zhuǎn)跡象,甚至出現(xiàn)嚴(yán)重的不良反應(yīng);醫(yī)生開的藥物貴,且不在可報(bào)銷藥物之列。對(duì)于診斷方面,患者不滿意的原因有:醫(yī)生看病敷衍,問(wèn)診不詳細(xì),甚至沒(méi)有問(wèn)診;醫(yī)生不給患者解釋病情;醫(yī)生給出的治療方案不合格;就診的時(shí)間太急促,患者沒(méi)有充足的時(shí)間與醫(yī)生交流;醫(yī)生無(wú)法確診病因,甚至給出錯(cuò)誤診斷;患者掛了號(hào),醫(yī)生不接診,沒(méi)有向患者提供其所需的治療。

通過(guò)觀察“手術(shù)”主題的正面評(píng)論詞云圖得知,“恢復(fù)”“成功”“術(shù)后”等詞占據(jù)詞云圖的大部分面積。定位到“手術(shù)”主題的正面評(píng)論文本中,總結(jié)出患者發(fā)表正面評(píng)論的原因可分為在手術(shù)前、手術(shù)過(guò)程中、手術(shù)后3個(gè)方面。在術(shù)前方面,患者發(fā)表正面評(píng)論的原因有:醫(yī)方詳細(xì)解釋患者病況;說(shuō)明采取手術(shù)方案的緣由;制定合理的手術(shù)方案;多次與患者及其家屬交流;耐心地向患者和家屬講解手術(shù)方案;告知術(shù)前相關(guān)的注意事項(xiàng)。在手術(shù)的過(guò)程中,患者發(fā)表正面評(píng)論的原因包括:患者的主治醫(yī)生親自操刀;手術(shù)過(guò)程中及時(shí)與患者交流,時(shí)刻掌握患者術(shù)中情況和安撫患者情緒;術(shù)中遇到困難,醫(yī)方能積極認(rèn)真處理,并及時(shí)與家屬溝通;醫(yī)生手術(shù)嫻熟,手法精妙,手術(shù)高效完成。在術(shù)后方面,患者發(fā)表正面評(píng)論的原因包括:術(shù)后效果好,恢復(fù)快,疼痛少;刀口整齊,創(chuàng)口面積小,疤痕不明顯;術(shù)后有詳細(xì)的康復(fù)指導(dǎo);術(shù)后回訪積極,詳細(xì)詢問(wèn)患者恢復(fù)狀況;術(shù)后積極解答患者問(wèn)題。“手術(shù)”主題的負(fù)面評(píng)論詞云圖顯示了大量的負(fù)面情感詞,比如“疼痛”“痛感”“疼”等,患者表示手術(shù)帶來(lái)的痛感強(qiáng)烈,難以忍受。負(fù)面評(píng)論文本詞云圖中還出現(xiàn)“并發(fā)癥”“腫脹”“嘔吐”等形容不適癥狀的詞,說(shuō)明手術(shù)產(chǎn)生副作用引發(fā)患者情感偏向于負(fù)向。

觀察“環(huán)境流程”主題的正面評(píng)論詞云圖發(fā)現(xiàn):“安排”“回復(fù)”“住院”“手術(shù)”“網(wǎng)上”“順利”等詞占據(jù)正面評(píng)論詞云圖的大部分面積。回溯定位到“環(huán)境流程”主題的正面評(píng)論文本中,總結(jié)對(duì)于環(huán)境方面的發(fā)表正面評(píng)論原因主要有:醫(yī)院干凈衛(wèi)生;環(huán)境安靜,適合養(yǎng)病;醫(yī)院設(shè)備先進(jìn)齊全;飯菜清淡可口有營(yíng)養(yǎng),適合患者恢復(fù)健康。總結(jié)對(duì)于流程方面的正面評(píng)論原因主要包括:網(wǎng)上掛號(hào)快捷,預(yù)約方便;醫(yī)生幫忙加號(hào);檢查過(guò)程高效;網(wǎng)上診室回復(fù)問(wèn)題及時(shí),減少病人往返跑的次數(shù);安排手術(shù)、檢查、住院等事宜迅速;流程簡(jiǎn)單、有序、緊湊、速度快;設(shè)置醫(yī)導(dǎo)人員指導(dǎo)患者就診;醫(yī)院整體秩序管理到位;主動(dòng)為經(jīng)濟(jì)困難的患者申請(qǐng)慈善基金。患者發(fā)表負(fù)面評(píng)論的原因包括:排隊(duì)時(shí)間太長(zhǎng),等待時(shí)間久;患者太多;患者掛不上號(hào);患者就診需要多次往返跑,很麻煩;醫(yī)療機(jī)器設(shè)備有故障;病床不足;患者不知道如何咨詢相關(guān)事項(xiàng),就診指南不明確;醫(yī)院環(huán)境差,衛(wèi)生條件堪憂;就診程序復(fù)雜,手續(xù)繁瑣;秩序混亂,管理不到位;節(jié)假日醫(yī)院人手不足;加號(hào)費(fèi)用太貴;只能線上掛號(hào),不能線下掛號(hào),導(dǎo)致老年人無(wú)法掛號(hào)。

4 建議策略

根據(jù)實(shí)驗(yàn)結(jié)果的信息內(nèi)容和規(guī)律,分別從醫(yī)院醫(yī)療服務(wù)視角、健康社區(qū)信息組織視角提出針對(duì)三級(jí)甲等醫(yī)院和在線健康社區(qū)提高服務(wù)質(zhì)量的建議。

醫(yī)院醫(yī)生方面:①關(guān)注患者情緒變化,加強(qiáng)人文關(guān)懷。醫(yī)方應(yīng)關(guān)注患者情緒變化,及時(shí)給予患者必要的包容和關(guān)愛,加強(qiáng)對(duì)患者門診治療的心理關(guān)注與疏導(dǎo)。加大對(duì)疾病、藥物、就診過(guò)程、醫(yī)生常規(guī)操作的宣傳,盡量減少由于信息不對(duì)等導(dǎo)致患者產(chǎn)生的消極情緒。②增設(shè)業(yè)務(wù)辦理場(chǎng)所,分散業(yè)務(wù)辦理,加大資金投入,確保設(shè)備供應(yīng),設(shè)置溫馨導(dǎo)航,院內(nèi)進(jìn)一步設(shè)置清晰的路標(biāo),明示就醫(yī)流程,增加導(dǎo)診服務(wù)人員,縮短患者等待時(shí)間。③鼓勵(lì)開展線上診療和線下相結(jié)合。利用線上診療提供有效的患者咨詢反饋渠道,及時(shí)幫助患者解決問(wèn)題和困擾,為患者帶來(lái)極多便利。

在線健康社區(qū)方面:①判斷患者發(fā)布評(píng)論信息的情感傾向,為在線健康社區(qū)用戶構(gòu)建用戶畫像,并對(duì)情緒特征鮮明的患者進(jìn)行有針對(duì)性的情感支持。②將患者評(píng)論按照主題進(jìn)行分類,利于患者和在線健康社區(qū)更好地利用評(píng)論信息。③為患者提供個(gè)性化的檢索服務(wù),推出基于主題的智能查詢功能,從而輔助患者快速地找到自身所需的主題健康信息,提高健康信息檢索的效率與查詢的質(zhì)量。

5 總 結(jié)

本文首先基于LDA主題模型對(duì)患者評(píng)論進(jìn)行主題挖掘,得到“醫(yī)術(shù)醫(yī)德”“手術(shù)”“環(huán)境流程”“用藥診斷”4個(gè)主題;其次,采用支持向量機(jī)對(duì)患者評(píng)論文本進(jìn)行分類,將評(píng)論文本劃分到4個(gè)主題下;最后,使用詞性篩選、TF-IDF和SO-PMI的組合方法構(gòu)建了醫(yī)療服務(wù)領(lǐng)域情感詞典,用該詞典對(duì)患者評(píng)論進(jìn)行情感分析,得到各個(gè)主題下不同情感傾向的患者評(píng)論文本。對(duì)4個(gè)主題的正面評(píng)論、負(fù)面評(píng)論文本進(jìn)行詞云圖展示,根據(jù)詞云圖中關(guān)鍵詞,回溯到相應(yīng)的評(píng)論原文中,歸納出患者發(fā)表各類主題正面評(píng)論、負(fù)面評(píng)論的原因。利用“好大夫在線”平臺(tái)上三甲醫(yī)院的患者評(píng)論數(shù)據(jù)進(jìn)行實(shí)證研究,根據(jù)對(duì)負(fù)面評(píng)論及相關(guān)結(jié)論的分析,提出了幫助在線健康社區(qū)改進(jìn)醫(yī)療服務(wù)和幫助在線社區(qū)改進(jìn)信息建設(shè)的相關(guān)參考建議。

參考文獻(xiàn)

[1]孟猛,尤劍,劉晨暉,等.健康信息采納行為研究——概念界定、理論模型與未來(lái)展望[J].現(xiàn)代情報(bào),2024,44(6):157-167.

[2]中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心.第54次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》[R/OL].[2024-10-25].https://www.cnnic.net.cn/NMediaFile/2024/0911/MAIN1726017626560DHICKVFSM6.pdf.

[3]翟冉冉,韓正彪.在線健康社區(qū)用戶信息交互的驅(qū)動(dòng)因素研究[J].圖書情報(bào)工作,2024,68(3):15-26.

[4]周歡,劉嘉,張培穎,等.復(fù)雜網(wǎng)絡(luò)視角下在線健康社區(qū)評(píng)論有用性研究[J].情報(bào)科學(xué),2022,40(9):88-97.

[5]李昂,趙志杰.基于信號(hào)傳遞理論的在線評(píng)論有用性影響因素研究[J].現(xiàn)代情報(bào),2019,39(10):38-45.

[6]Messaoudi C,Guessoum Z,Ben Romdhane L.Opinion Mining in Online Social Media:A Survey[J].Social Network Analysis and Mining,2022,12(1):25.

[7]高慧穎,公孟秋,劉嘉唯.基于特征加權(quán)詞向量的在線醫(yī)療評(píng)論情感分析[J].北京理工大學(xué)學(xué)報(bào),2021,41(9):999-1005.

[8]Rahim A I,Ibrahim M I,Musa K I,et al.Assessing Patient-Perceived Hospital Service Quality and Sentiment in Malaysian Public Hospitals Using Machine Learning and Facebook Reviews[J].International Journal of Environmental Research and Public Health,2021,18(18):9912.

[9]王輝,王曉玉,李衛(wèi)東,等.在線健康社區(qū)重大慢病患者負(fù)面評(píng)論傾向的關(guān)鍵影響因素分析[J].情報(bào)科學(xué),2024,42(6):12-20,28.

[10]熊回香,向瀛泓,孟璇,等.在線健康社區(qū)中基于用戶評(píng)論挖掘的醫(yī)生服務(wù)評(píng)價(jià)研究[J].情報(bào)科學(xué),2024,42(8)::118-125,163.

[11]祁瑞華,付豪.新冠肺炎疫情相關(guān)政策擴(kuò)散特征與主題挖掘研究[J].智庫(kù)理論與實(shí)踐,2021,6(6):55-64.

[12]Shah A M,Yan X B,Tariq S,et al.What Patients Like or Dislike in Physicians:Analyzing Drivers of Patient Satisfaction and Dissatisfaction Using a Digital Topic Modeling Approach[J].Information Processing amp; Management,2021,58(3):102516.

[13]葉艷,吳鵬,周知,等.基于LDA-BiLSTM模型的在線醫(yī)療服務(wù)質(zhì)量識(shí)別研究[J].情報(bào)理論與實(shí)踐,2022,45(8):178-183,168.

[14]余佳琪,趙豆豆,劉蕤.在線健康社區(qū)慢性病患者評(píng)論主題情感協(xié)同挖掘研究——以甜蜜家園為例[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2023,7(10):95-108.

[15]龐慶華,董顯蔚,周斌,等.基于情感分析與TextRank的負(fù)面在線評(píng)論關(guān)鍵詞抽取[J].情報(bào)科學(xué),2022,40(5):111-117.

[16]Blei D M,Ng A Y,Jordan M I.Latent Dirichlet Allocation[J].Journal of Machine Learning Research,2003,3(4/5):993-1022.

[17]吳琦,李陽(yáng).融入領(lǐng)域風(fēng)險(xiǎn)詞典的社會(huì)安全事件網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)評(píng)估研究[J].情報(bào)理論與實(shí)踐,2024,47(6):175-183.

[18]馬騁宇.在線醫(yī)療社區(qū)醫(yī)患互動(dòng)行為的實(shí)證研究——以好大夫在線為例[J].中國(guó)衛(wèi)生政策研究,2016,9(11):65-69.

[19]Carletta J.Assessing Agreement on Classification Tasks:The Kappa Statistic[J].Computational Linguistics,1996,22(2):249-254.

[20]徐海燕,姜瑛.針對(duì)復(fù)雜用戶評(píng)論的代碼質(zhì)量屬性判斷[J].軟件學(xué)報(bào),2021,32(7):2183-2203.

[21]鄧淑卿,李玩?zhèn)ィ旖?基于句法依賴規(guī)則和詞性特征的情感詞識(shí)別研究[J].情報(bào)理論與實(shí)踐,2018,41(5):137-142.

(責(zé)任編輯:楊豐僑)

主站蜘蛛池模板: 三级国产在线观看| 夜夜操天天摸| 中文国产成人久久精品小说| 一本大道无码高清| 成人精品亚洲| 国产色网站| 亚洲天堂精品视频| 久久人与动人物A级毛片| 亚洲中文字幕97久久精品少妇| 成年人视频一区二区| 亚洲电影天堂在线国语对白| 啪啪免费视频一区二区| 男女精品视频| 欧美精品成人| 中文字幕va| 亚洲欧美一区二区三区图片| 国产综合日韩另类一区二区| 日韩人妻少妇一区二区| 日韩欧美色综合| 天天视频在线91频| 在线国产91| 高清欧美性猛交XXXX黑人猛交 | 久久77777| 中文字幕有乳无码| 福利一区三区| 国产在线观看精品| 日韩欧美国产综合| 久久窝窝国产精品午夜看片| 丝袜无码一区二区三区| 中国国产A一级毛片| 韩日午夜在线资源一区二区| 亚洲男女天堂| 日日噜噜夜夜狠狠视频| 黄色网址手机国内免费在线观看 | 夜夜操狠狠操| 国产精品99在线观看| 国产一区二区三区精品久久呦| 99久久免费精品特色大片| 日韩区欧美国产区在线观看| 乱人伦中文视频在线观看免费| 国产无遮挡猛进猛出免费软件| 亚洲中文字幕精品| 91娇喘视频| 色综合色国产热无码一| 久久精品这里只有国产中文精品| 久久久久青草大香线综合精品| 午夜a视频| 99国产精品国产高清一区二区| 日本午夜三级| 色综合热无码热国产| 韩国自拍偷自拍亚洲精品| 999在线免费视频| 国产凹凸一区在线观看视频| 四虎影视国产精品| 国内精品视频| 欧美成人免费午夜全| 精品第一国产综合精品Aⅴ| 国产精品久久久久久影院| 精品人妻无码中字系列| 国产xx在线观看| 少妇精品在线| 国产无码精品在线播放| 国产91精品久久| AV色爱天堂网| 免费看美女自慰的网站| 视频二区国产精品职场同事| 国产无码网站在线观看| 国产第一色| 91在线无码精品秘九色APP| 91久久国产成人免费观看| 亚洲国产精品日韩欧美一区| 日本一区中文字幕最新在线| 日本亚洲欧美在线| 国产成人精品高清不卡在线| 欧美在线导航| 国产成+人+综合+亚洲欧美| 国产一级二级在线观看| 在线免费a视频| 国产第一页第二页| 亚洲天堂啪啪| 亚洲欧美成人在线视频| 美女被狂躁www在线观看|