中圖分類號:S511.099文獻標志碼:A
文章編號:1673-6737(2025)05-0029-06
Analysis of the Medication Pattern of Rice Bud-malt in Chronic Kidney Diseases Based on Cluster Analysis
TONG Zhi-shuang
(Qinggang County Hospital of Traditional Chinese Medicine, Suihua Heilongjiang 151699, China)
Abstract:Riceisoftenusedincombination with wheat sproutsasanadjuvantdrugforthetreatmentofchronic kidneydiseases. However,themedicationpaternoficesproutsandmalt inthisprocesshasnotbeensystematicallyexplained.Therefore,the studyproposedaninteligentanalysismethodformedicationpatternsbasedonclusteranalysisand graph neuralnetworks.The experimentalresultsshowthattheadjustedRandindicesoftheproposedmethodforclusteringthreetypesofdata,namely prescriptions,medication stages andtherapeutic efects,areO.82,0.86andO.87respectively,andtheaverage AdjustedRand IndexvalueisO.85.Andfinall,itwasconcludedthatusing5-15gofricespore-maltasanadjunctiveagent inthearlyand middlestagesofchronickidneydiseasecanefectivelyimprovethetherapeuticefectofchronic kidneydisease.Theaboveresults demonstratethesignificanceandefectivenessofriceinthetreatmentofchronickidneydiseases,andfurtherilustratethe medicinal value of rice.
Key Words: Rice;Rice bud-malt; Cluster analysis; Chronic kidney diseases
水稻是人類最主要的糧食安全基石,同時水稻芽作為一種重要的中藥材常與麥芽協同使用,用于脾胃功能的調理和脾胃疾病的治療-3]。雖然稻芽-麥芽的主治用途是腸胃功能的調理,但在中醫學中稻芽-麥芽還常被用于慢性腎臟疾病(ChronicKidneyDisease,CKD)的治療,許多病例表明稻芽-麥芽能有效提升對CKD的治療效果,但對于在CKD中的稻芽-麥芽添加量、添加配比等關鍵信息還未得到系統性的驗證4。因此,為了更好地發揮稻芽-麥芽在CKD治療中的效果,急需對稻芽-麥芽在CKD中的用藥規律進行分析。聚類分析是一種通過要素間相似性進行集合生成的無監督學習法,而圖神經網絡是專門用于圖形處理的深度學習算法,其能通過分析圖形的節點、邊或嵌入信息實現數據的分類、生成等任務。聚類分析能夠有效將大量相似醫學數據進行直接聚類,劃分為具有同一特征的集合,而GNN能將這些集合和集合間的關系化作圖像中的點與邊界,進而實現用藥規律分析[-]。因此,研究提出基于聚類分析和GNN的稻芽-麥芽在CKD中的用藥規律分析法。期望研究提出的方法能有效提升稻芽-麥芽在CKD治療中的使用效果,進一步提升水稻的藥用價值。
1基于醫學數據分析的藥用規律分析模型設計
1.1基于聚類分析的醫學數據處理方法設計
水稻在具有強大的經濟效益時還具有一定的藥用價值,水稻芽常和小麥芽一同用作治療脾胃問題的藥用成分,同時還常作為協同藥物用于CKD 的治療當中[12-14。但對于在CKD的治療中何時使用稻芽-麥芽以及稻芽-麥芽配比等問題卻缺乏系統性的研究5。聚類分析法中的層次聚類法具有無需預設聚類數量、能同時進行多維度數據處理等優勢,而高爾距離能將目標聚類分析算法進行優化,使其更加適用于混合數據的相似度度量[6-18]。在高爾距離優化的層次聚類法能夠將大量的醫學數據進行縮減,以集合的方式將同類和相似數據進行聚合后,可以通過聚類點之間關系的分析實現對稻芽-麥芽在CKD治療過程中的用藥規律的分析。因此,研究使用高爾距離優化后的層次聚類法對稻芽-麥芽在CDK治療過程中的藥方、用藥階段和治療效果進行聚類分析。高爾距離優化的層次聚類法如圖1所示。
圖1通過高爾距離優化的層次聚類法

如圖1所示,研究采用的是自下向上的聚類方式,在進行聚類時將每一個樣本看作一個單獨個體,隨后對所有樣本進行遍歷,并按照一定方式對其進行相似度賦值,隨后根據相似度將樣本聚合為具有一定內部相似性的子單元。之后對子單元按照新提出的相似度計算方法進行遍歷、賦值、聚合的過程。不斷持續此過程,直到達到算法結束條件。該過程中,對于子單元的相似度計算包括三種單連接距離、全連接距離和平均距離三種方式。其中單連接距離的計算過程如式(1)所示。
D(C,C′)=minxεC,y=Cd(x,y)
式(1)中, c 和 C' 為兩個不同的子樣本, d 為樣本間的距離。單連接表示單元內樣本間的距離,而全連接距離表示不同單元間樣本的距離,計算過程如式(2)所示。
D(C,C')=maxxεC,y=Cd(x,y)
式(2)中的全連接距離在樣本量較少的聚類問題中往往取得更好的效果。而平均距離是指所有聚類樣本之間距離的平均值,計算過程如式(3)所示。

式③中, |C| 和 |C′| 為兩個聚類子單元含有的樣本量。而使用高爾距離對其進行優化的原理是使用高爾距離替代層次聚類法中的距離計算方法,使得層次聚類法能夠適用于漢字、數字和符號等不同類型的信息。高爾距離的計算過程如式(4)所示。

式(4)中, w 為不同數據類型的調節系數, d 為不同數據類型的定義公式 ,j 為某類型數據的個數。通過由高爾距離優化的層次聚類法,能將稻芽-麥芽在CKD治療過程中的藥方、用藥階段和治療效果進行聚類,隨后通過分析三者之間的關系能夠實現對稻芽-麥芽用藥規律的有效把握。
1.2基于GNN的藥用規律分析方法設計
水稻作為一種常用的食材與中藥成分,其和小麥一同在脾胃疾病的治療和調養方面的效果已經得到了較多的驗證并建立了相對完整的用藥機制[19-20]。但對于稻芽-麥芽在CKD 治療過程中的用藥機制還不太明了,需要得到進一步的完善2。研究已經提出將大量醫療數據進行篩選分類的高爾距離優化的層次聚類法,但要把握稻芽-麥芽在CKD中的用藥規律還需要進行進一步分析。關系圖卷積神經網絡(Relational Graph ConvolutionalNetworkCoefficient,SC)能同時,RGCN)是圖神經網絡中的一種重要異質圖處理方法,具有多維度數據融合、數據分組等多種功能,而元路徑是圖像數據處理中的另一重要概念,元路徑能在圖像處理過程中連接不同數據的序列關系[22-24]。因此,研究通過RGCN實現藥方、用藥階段與治療效果的異質性關聯,并通過元路徑最終把握出藥方、用藥階段與治療效果關系。融合元路徑的RGCN對于稻芽-麥芽聚類圖進行處理的過程如圖2所示。
圖2融合元路徑的RGCN流程圖

如圖2所示,當收到聚類后的數據后,RGCN首先會對其進行卷積處理,將其轉換為節點帶有一定含義的異質圖層。該過程首先通過拉普拉斯矩陣對數據進行歸一化處理,過程如式(5)所示。

式(5)中,A為鄰接矩陣 ?I 和D分別為單位矩陣和度矩陣。隨后進行卷積操作,如式(6所示,
Hl+1=Φ(AHlWl)
式(6中, σσσ 為激活函數 ?H 為卷積圖層、 ?W 為對應的權重矩陣 Ω,l 表示卷積層數。最后總的RGCN卷積公式如式(7)所示。

式(7)中, c 和N分別為節點與周圍節點的歸一化常數和節點集合。 i,j 和 r 分別為節點序號和節點關系。在建立了卷積圖層以后,可以使用元路徑分析方法構建不同圖層間的序列關系。該過程中建立路徑的依據如式(8)所示。
Ifthere existsa path from itoj defined by p Others
式(8)中, p 為路徑連接方式。通過元路徑連接可以建立相似藥方、用藥階段和治療效果之間的關系。之后通過分析最佳治療效果路徑的藥方組分、用藥時間和出現頻率就能找到稻芽-麥芽的用藥規律。最后得到基于高爾距離優化后的層次聚類法進行數據聚類,并由元路徑RGCN進行進一步分析的稻芽-麥芽用藥規律研究方法,方法流程如圖3所示。
圖3融合優化層次聚類法與RGCN的稻芽-麥芽用藥規律研究模型

在圖3中,在進行稻芽-麥芽在CKD治療中的用藥規律研究之前,首先要收集涉及稻芽-麥芽的藥方、使用階段和治療效果的相關數據。隨后對其進行分別聚類,按照各自的異質性分為不同的聚類子單元,并在最終輸出三個聚類子單元集合。之后,通過元路徑RGCN將其轉換為帶有節點語義信息的特征圖,并按照藥方、用藥階段和治療效果的順序構建相應的元路徑。通過分析最終圖層中元路徑出現的概率來評價藥方、用藥階段和治療效果的關聯性,最終得到類似于“特定藥方在某階段的使用如何影響治療效果”的結果。
2基于聚類分析的稻芽-麥芽用藥規律實例研究
2.1基于高爾距離優化的層次聚類法有效性驗證
為了評估研究提出方法是否有效,首先需要確定基于高爾距離優化的層次聚類法是否能實現醫學數據的有效聚類。因此,使用中醫傳承輔助平臺中收集到的關于稻芽-麥芽和CKD治療的數據進行聚類分析實驗。實驗時硬件方面選擇Windows11作為操作系統,AMDRyzen7為中央處理器,NVIDIAGeForceRTX4O80為圖形處理器。軟件方面選擇Python3.1作為編程語言,深度學習框架采用PyTorch2.2,可視化庫選擇Seaborn0.13。調整蘭德指數(AdjustedRandIndex,ARI)常用于評價整體聚類效果,輪廓系數(SilhouetteCoefficient,SC)能同時評價整體與單個聚類效果。因此研究對聚類后藥方、使用階段和治療效果的ARI和SC進行統計分析,結果如圖4所示。
圖4基于高爾距離優化的層次聚類法的ARI和SC分析

由于4(a)4(b)和4(c)可知,通過高爾距離優化的層次聚類法在對藥方進行聚類分析的平均SC值為0.71,對不同的用藥階段聚類的平均SC值為0.85,對治療效果聚類的平均SC值為0.86。由圖4(d)可知,在進行聚類分析時,藥方、用藥階段和治療效果的ARI值分別為0.82、0.86和0.87,平均ARI值為 0.85 。綜上所述,使用高爾距離優化的層次聚類法能實現藥方、用藥階段和治療效果三種數據的有效聚類,且整體分類效果和聚類內部的相似性等指標均有一定的顯著性,說明了高爾距離優化的層次聚類法的有效性。
2.2稻芽-麥芽在CKD治療中的用藥規律分析
在驗證了對于醫療數據的聚類效果后,還需要進一步對藥方、用藥階段和治療效果之間的關系進行進一步分析。因此研究基于元路徑RGCN算法將聚類后的數據進行耦合,并通過路徑構造來把握深層規律。首先,為了找到稻芽-麥芽與其他藥物的協同使用規律,并找到最佳用藥時機,將藥方聚類中稻芽-麥芽與其他藥物同時出現情況進行分析,并建立稻芽-麥芽用量與治療階段的鏈路關系,結果如圖5所示。
由圖5(a)可知,在與茯苓、白術、山藥、陳皮、黨參、砂仁和黃芪7種藥材進行混合使用時添加的稻芽、麥芽量和比例是不同的,不過稻芽用量和麥芽用量的平均值分別為 8.1g 和
。由圖5(b)可知,在不同的用藥階段稻芽和麥芽用量也有所不同,隨著病情的加重,使用稻芽和麥芽的用量逐漸降低。同時在全階段中,稻芽與麥芽的用料比基本保持在1:1左右。由此可知,稻芽-麥芽在CKD的治療過程中有一定的泛用性。隨后,為了進一步把握稻芽-麥芽在CKD治療中的用藥規律,通過元路徑方法研究不同“藥方-使用階段-治療效果\"路徑的出現概率,結果如圖6所示。
圖5稻芽-麥芽與其他藥物協同使用情況與用藥時期分析

圖6各模型30天平均故障反饋時間對比圖

由圖6(a)可知,當稻芽-麥芽量超過 15g 時,在整個治療過程中均無明顯的效果。而當稻芽-麥芽量處于 0~5g 與 10-15g 兩個區間時,僅會在腎臟功能正常、輕度下降和中度下降時取得一定的治療效果。而當稻芽-麥芽在 5~10g 時,在各個時期的治療效果均優于其他方案,同時在中度下降時使用 5~10g 稻芽-麥芽輔助治療的效果最好。由圖6(b)可知,對于稻芽-麥芽的使用在用量上主要集中于 5~15g 的區間,而使用階段主要集中在腎功能正常、輕度下降和重度下降三個階段。在用量上處于 5~10g 與 10-15g 的使用占比最大。綜上所述,可以歸納出稻芽-麥芽在CKD用藥過程中的規律為:在CKD患病初期和中期使用 5~15g 的稻芽-麥芽作為輔助藥劑,可以有效提高CKD的治療效果。
3結語
水稻芽常和小麥芽同時使用作為CKD治療過程中的輔助藥劑,但對于過程中的用藥規律并未得到系統性的研究。因此,研究基于優化的層次聚類分析法和元路徑RGCN提出一種稻芽-麥芽在CKD治療過程中用藥規律的智能分析方法。結果表明,通過高爾距離優化的層次聚類法能有效對藥方、用藥階段和治療效果數據進行聚類分析,最終的ARI值分別為0.82、0.86和0.87,平均SC值分別為0.71、0.85和 0.86 。并且在后續用藥規律分析中發現,對于稻芽-麥芽的使用量主要集中在 5~15g ,使用階段主要是腎功能正常、輕度下降和中度下降三個階段。最后研究得出了在CKD患病初期和中期使用 5~15g 的稻芽-麥芽作為輔助藥劑,可以有效提高CKD的治療效果的結論。但研究僅僅是通過人工智能算法對以往的病歷記錄進行分析,稻芽-麥芽在CKD治療過程中的效果還需要進行相應的臨床試驗進行進一步的驗證。
參考文獻:
[1]杜愛紅.國際水稻研究合作中的英語溝通策略與技巧[J].北方水稻,2025,55(1):142-144.
[2]張艷麗,韓雷.我國水稻供應鏈優化與實施[J].北方水稻,2024,54(4):52-54.
[3]于海.面向鄉村振興的水稻種植產業鏈整合與優化對策研究[J].北方水稻,2024,54(3):61-63.
[4]謝秀雯,黎耀和,胡莉文,等.丘和明教授治療血液病藥對經驗[J].中國臨床研究,2024,37(10):1573-1577
[5]王帥,厲歡松,屠晶晶,等.基于數據挖掘研究沈力治療胃癌用藥規律[J].新中醫,2023,55(16):105-110.
[6]黃鏞,李成輝,王琳,等.基于數據挖掘探討真實世界中醫藥治療小兒積用藥規律[J].新中醫,2023(13):52-57.
[7]李家新,景亞泓,張俊,等.基于GIS技術和聚類分析的汾河上游草地土壤養分空間特征分析[J].草業學報,2025,34(3):17-28.
[8]李麗娟,袁梓楊,張露,等.碳青霉烯類耐藥肺炎克雷伯菌的基因組特征和聚類分析研究[J].中華預防醫學雜志,2024,58(9):1372-1378.
[9]劉小平,鄭企雨,朱相麗.圖神經網絡在材料化學中的應用研究[J].化學通報,2024,87(11):1309-1318.
[10]王賀亞,羅靜靜,孟玲,李懷勝,艾海峰,賈東海.基于主成分和聚類分析綜合評價塔額盆地油菜新品種(系)[J].新疆農業科學,2025,62(1):118-128.
[11]肖國慶,李雪琪,陳玥丹,等.大規模圖神經網絡研究綜述[J].計算機學報,2024,47(1):148-171.
[12]徐懷瑾,張馨月,王潔瓊,等.基于數據挖掘探討薛曉紅教授辨治粉刺性乳癰用藥規律[J].上海中醫藥大學學報,2023,37(6):82-89.
[13]申祺,馬凌云,黃裕普,等.周叢生物在稻田生態系統中的作用研究進展[J].北方水稻,2022,52(2):61-64.
[14]王淑蕓.水稻產業鏈融資模式與風險管理研究[J].北方水稻,2025,55(1):121-123.
[15]譚翔,曾龍,潘斌,等.鄉村振興背景下水稻產業的創新發展路徑研究[J].北方水稻,2025,55(1):90-92.
[16]彭繼達,張春桂.基于PCA-RF組合模型的福建省空氣負氧離子濃度預測研究[J].能源與環保,2024,46(1):17-24.
[17]任建超,馮彥軍,呂揚,等.基于K-Means模糊聚類的采場覆巖運移微震能量簇時空分析[J].能源與環保,2023,45(3):308-312.
[18]周贛,茅歡,馮燕鈞,等.基于多特征符號聚合近似和層次聚類的戶變關系識別方法[J]電力系統自動化,2024,48(3):133-141.
[19]靳亞茹,陳斌,王歆凱,等.利用基因編輯產生長片段缺失創制低谷蛋白水稻種質[J].中國農業科學,2025.58(6):1052-1064.
[20]洪俐,劉濤,孫成明,等.基于改進 U-Net++ 的水稻病害圖像分割研究[J].江蘇農業科學,2024,52(12):201-208.
[21]楊璧英,劉相,胡爽,等.基于鐵死亡探討慢性腎臟病的發病機制及中醫藥干預進展[J]:中國中藥雜志,2024,49(10):2629-2639.
[22]孔博,艾廷華,楊敏,等.等高線形態知識與圖神經網絡聯合作用下的黃土地貌類型識別[J]:測繪學報,2024,53(6):1154-1164.
[23]賈霄生,趙中英,李超,等.互信息與多條元路徑融合的異質網絡表示學習方法[J]:軟件學報,2023,34(7):3256-3271.
[24]楊英光,李陽陽,彭浩,等.基于對抗多關系圖神經網絡的機器賬號檢測[J].中文信息學報,2023,37(7):162-172.