,, ,
隨著“新醫改”的推進,醫療機構和相關管理部門對改進醫療服務質量的關注度日益提高。作為衡量醫療服務質量的主要標準之一,患者體驗是一種可監測的重要變量,而患者投訴又是反映患者體驗的重要指標。通過對患者投訴的分類,可以從中觀測到醫療糾紛關注的重點和患者關心的主要問題。
國內對患者投訴分類主要參照國際上比較通用的分類標準。如使用醫療投訴分析工具(Healthcare Complaints Analysis Tool,HCAT),將患者投訴分為質量、安全、環境、制度流程、傾聽、溝通及尊重和病人權利等7類[1-4]。然而,由于語境、醫療管理制度、文化方面的差異,國外患者投訴的關注重點和國內患者存在著一定差異。因此,根據國內患者的具體情況,結合已有的患者投訴的文本信息,構建一個關于患者投訴的科學合理的分類框架,成為一個亟待解決的重要問題。目前,患者投訴的主題建模主要使用潛在狄利克雷分布(Latent Dirichlet Allocation,LDA)主題模型[5-6]。LDA主題模型有如下缺陷:一是無法確定主題個數,如果采用交叉驗證的方法,確定主題個數既浪費資源又比較繁瑣;二是模型中Dirichlet隨機向量各分量間的弱相關性(其相關性僅僅是各分量之和必須為1),使得潛在主題之間幾乎是不相關的,這與很多實際問題并不相符合[7]。
hierarchical latent Dirichlet allocation(hLDA)層次主題模型是Blei[8-9]等提出的一種基于nCRP(nested Chinese Restaurant Process)的層次潛在狄利克雷分布非參數模型,是一種無監督的機器學習方法,能夠從無結構、開放式的數據中學習層次主題。相比經典的LDA主題模型[10]所抽取的平行主題,hLDA層次主題模型基于主題樹更能夠挖掘出語料庫中的語義層次結構[11-12]。另外,hLDA純數據驅動的方式,能夠識別主題間的關系,即抽象和具體主題之間的關系。在多文檔摘要生成、圖書信息組織等領域,hLDA層次主題模型得到了很好運用,但是在患者投訴文本信息挖掘領域,還未見運用hLDA層次主題模型進行文本挖掘的相關研究。
本文利用hLDA層次主題模型,對患者投訴的文本信息進行層次主題挖掘。通過對患者投訴文檔的分析,挖掘患者投訴文本集中所包含的深層次語義信息,發現潛在的主題,并基于這些患者投訴關注的主題構建一個更加科學合理的分類框架。
本文所用患者投訴的文本數據來源于某三甲醫院患者隨訪系統。患者投訴有10 000條,經過人工篩選,去除重復、殘缺的數據,最終留下8 690條,作為實驗語料庫。
數據預處理過程是根據hLDA層次主題模型的數據格式需要,對患者投訴的原始語料進行加工處理,生成相應層次主題挖掘所需要的數據格式。患者投訴語料預處理的具體流程如圖1所示。

圖1 患者投訴語料預處理流程
患者投訴語料預處理具體包含以下4個步驟:一是分詞及去停用詞,本文采用jieba分詞工具對患者投訴的語料進行分詞,再使用四川大學機器智能實驗室停用詞表[13]對患者投訴的文檔語料進行去停用詞處理;二是生成詞表,即對分詞及去停用詞獲得的所有詞進行合并、去重,得到一個相應的詞表;三是生成評論詞向量,根據已經生成的詞表將評論轉化為詞的向量,然后進行詞頻統計,計算每個詞在每條評論中出現的次數;四是生成評論-詞矩陣,所有患者評論的詞向量構成一個關于患者投訴的評論-詞矩陣,矩陣中每行對應1條患者評論,每列對應1個詞,矩陣的每一元素值為評論中詞的詞頻。
本次實驗使用Blei的hLDA-C軟件包,對預處理后的患者投訴語料進行主題建模。實驗的關鍵步驟是確定hLDA建模算法的關鍵參數取值,以取得最優的建模結果。hLDA層次主題模型生成的主題樹結構主要取決于迭代次數、主題樹深度、GEM分布超參數(m,π)、是否抽樣、狄利克雷分布超參數η和nCRP超參數γ。
參考相關研究的常用參數[14],本文設定層次主題樹的深度為L=3,迭代次數為10 000,GEM分布超參數的初始值為m=0.35,π=100。hLDA層次主題建模隨著層次主題樹深度的增加,后驗推理的復雜度會不斷增大,最終得到的最優結果的穩定性也會越差[15]。現有的分類標準通常為兩層結構,所以L=3是一個合適的主題數深度(hLDA主題樹第一層僅包含一個根主題)。同時,隨著迭代次數增加,經過吉布斯抽樣而得到的主題樹結構也會更趨于穩定。當迭代次數設置為10 000次,得到樹的路徑已經趨向于一種較為穩定的變化狀態。另外,GEM分布超參數m控制著從根節點到葉子節點的分配比例,而π則指定該分配比例的嚴格程度。狄利克雷分布超參數η對主題詞的分配和路徑數有影響,nCRP超參數γ決定先驗樹結構的形狀,即每個文檔每一層的路徑選擇[15]。
參數SAMPLE_ETA、SAMPLE_GEM會影響hLDA層次主題建模的時間復雜度、人工調整參數的作用和結果的可解釋性[15]。在現有研究中,這些參數的最優取值尚無定論。本文通過實驗調整參數,比較各種參數設置下的建模結果,選擇主題區分度最高、層次主題分布均勻的層次主題模型作為最優結果,相應參數設置作為最優參數取值。
對實驗得到的最優層次主題模型進行合并歸納后如表1所示。表1中給出了每個主題中出現條件概率最高的10個主題詞,相應的參數值為:L=3,SE=1(抽樣),SG=1(抽樣),m=0.35,γ=5e-1。
由于hLDA層次主題模型隨著層級的增加,模型的穩定性會變弱,加之投訴語料的有些文本包含多種主題的可能性,某些主題相關投訴的數量較少,因此對實驗結果中第三層主題中出現的相似主題進行合并處理,以保證主題之間的可區分性。如在主題樹中不同第二層主題下,第三層主題都存在相應溝通不及時的情況,故而將其合并到第二層與溝通相關的主題“搞錯 語氣 告知 病情 手術 懷疑 解釋 主任醫師 釘太長 醫生”大類下面,再依次對相應主題時行歸納,最終生成的分類框架(圖2)。

表1 建模結果的主題詞對應表

圖2 建模結果樹狀結構圖
對模型生成的患者投訴條件概率分布結果進行可視化分析,患者投訴的相關主題分布如圖3所示。
從圖3可以看出,患者投訴主要集中在臨床服務類、環境類、管理類,共計7 679條,占88.37%。患者投訴的具體子類主要集中在臨床服務質量、生活環境、制度流程等方面,其中臨床服務質量3 756條,占43%;生活環境2 199條,占25.57%;制度流程1 169條,占14%。

圖3患者投訴的相關主題分布(左圖為第二層大類,右圖為第三層子類)
本文運用hLDA層次主題建模,對患者投訴的語料數據進行層次主題挖掘,進而構建了一個關于患者投訴關注領域的分類框架,目的是得到一個更符合真實患者投訴主題分布的患者投訴分類框架。
4.1.1 獲得了hLDA層次主題建模最優參數配置
根據相關研究,參數SAMPLE_ETA、SAMPLE_GEM對模型生成的結果具有重要影響。當SAMPLE_ETA、SAMPLE_GEM等于0時,表示對先驗參數η、m、π不進行抽樣估計。此時hLDA層次主題建模的時間復雜度比較低,人工調整參數對主題結果的影響較大,但層次主題結果的可解釋性會相對較弱。當SAMPLE_ETA(SE)、SAMPLE_GEM(SG)等于1時,表示對先驗參數η、m、π進行抽樣估計。此時hLDA層次主題建模的時間復雜度比較高,人工調整參數對主題結果的影響較小,但層次主題結果的可解釋性會相對較強。具體影響分布見表2。
現有研究大多缺乏具體可參考的建模策略。如何通過優化hLDA建模實驗流程,獲得滿意的主題模型尚無權威的結論。在患者投訴語料層次主題建模的實驗中,本文根據hLDA層次主題模型參數的性質,結合關鍵參數值是否進行抽樣估計對主題模型的影響,采取參數設置——結果反饋——修正參數設置的優化策略,獲得了較為理想的實驗結果。

表2 抽樣與否對hLDA層次主題建模的影響
4.1.2 獲得了更切合實際數據的患者投訴分類框架
本次實驗中,對患者投訴的文本進行層次主題建模,獲得了圖2所示的患者投訴分類框架。與HACT分類框架對比,除了在制度流程、環境、安全醫療差錯、溝通等方面外,兩種分類框架都有涉及相關患者投訴的問題(圖4)。

圖4 兩種分類框架的對比
相比較而言,國際通用的HACT分類標準還反映了患者投訴在質量、傾聽及尊重和權利方面的問題,而基于hLDA模型對國內患者投訴數據得出的分類框架則反映了患者投訴在生活支持、管理類其他和臨床服務質量方面的問題。國際通用的HACT分類框架與基于國內患者投訴數據的hLDA建模結果的主題分布有所差異,說明基于hLDA層次主題建模得到的患者投訴的分類框架更符合國內患者投訴的主題分布,是一種更切合實際數據的患者投訴分類框架。
4.2.1 語料來源單一
由于本文所用患者投訴語料均來自于同一家醫院,患者投訴的主題分布可能具有一定的偏倚,在反映國內患者醫療投訴所關注的主題和重點時,其通用性會受到一定限制。
4.2.2 對主題建模結果評估不足
目前,hLDA層次主題建模算法不能自動對建模結果進行合理的評估。采取人工評估的方法評估建模結果在一定程度上受主觀性的影響,這也是以后的研究需要改進和探索的地方。
本文通過hLDA層次主題模型算法,對某醫院的患者投訴進行主題挖掘,再對挖掘出的主題進行歸納,得到了一個兩層的患者投訴分類框架。與常用的分類框架(如HACT)相比,存在著一定差異。經過對建模結果的分析,發現患者投訴關注的領域和重點主要集中在臨床服務質量、生活環境和制度流程等方面。本文基于無監督數據挖掘得到的分類框架,更貼近患者投訴主題的真實分布,有利于對醫療服務的質量進行更加科學、合理的評估。