999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于聯合條件概率矩陣的藥對提取算法設計及應用*

2019-10-10 01:16:38汪葉群李鑫欣謝佳東董海艷胡孔法
世界科學技術-中醫藥現代化 2019年6期
關鍵詞:關聯中醫藥規則

汪葉群,楊 濤,李鑫欣,謝佳東,董海艷,胡孔法

(南京中醫藥大學 南京 210023)

藥對,又稱對子藥,姐妹藥,專指臨床中常用的相對固定的兩味藥物的配伍形式,是中藥配伍中的最小單位[1]。中藥復方是中醫臨床用藥的常用形式,復方往往藥物組成眾多、配伍復雜,如何挖掘復方中蘊含的藥物配伍規律已經成為中醫藥研究的熱點之一。藥對作為中藥復方組成的核心,體現了經典復方的療效,使系列復方具備共同點,且結構簡單便于研究[2]。因此,從藥對配伍規律入手,深入探索復方的配伍規律及科學內涵,可為復方的配伍規律研究提供參考和借鑒[3]。藥對是溝通方劑和中藥的橋梁,各類方劑著作中記載了常用藥對,然而在幾千年的中醫發展中,浩如煙海的醫案中仍存有大量待挖掘的潛在藥對,且各派中醫在臨床診療用藥中均各有獨特的藥對使用習慣。因此,如何從海量的醫案中挖掘潛在藥對,為中醫復方的配伍規律研究提供方法支撐,進而發掘名老中醫的學術思想和診療經驗,已經成為目前中醫藥傳承與發展的重要課題之一。

1 相關方法研究

數據挖掘技術是目前中醫方藥研究不可或缺的一種強有力工具[4],在中醫藥領域研究中常見的挖掘方法有頻數分析、聚類分析、因子分析、關聯規則、人工神經網絡等[5]。將數據挖掘技術應用到藥對研究中,可以極大地提高藥對發現效率。在藥對研究中主要采用關聯規則算法[6],利用置信度判斷兩種藥物是否屬于藥對。雖然這種方法能夠發現部分藥對,但存在明顯的片面性,即當A藥物到B藥物的置信度很高,并不能保證B 藥物到A 藥物中的置信度也高,如有“藥中國老”之稱的甘草,在臨床中使用頻繁,能挖掘出與許多藥物都有數據關聯,但只有當它和這些藥物在實際運用中存在明確的配伍關系時才可以將其稱為藥對[7]。因此不能僅僅依據置信度把同時出現的藥物定義為藥對[8],藥對中的藥物彼此間置信度應該都是較高的。也有學者認識到上述問題,對傳統算法進行了改進,如黃黎明[9]、曾令明[10]、曹玉潔[11]等均在關聯規則算法的基礎上做了改進,雖然提高了藥對發現的效率與準確度,但基于關聯規則的算法(尤其是Apriori 算法)其本身存在計算過程繁瑣、復雜度較高等問題。需要進行全新的方法。楊洪軍[12]等人運用熵方法定量描述中風病方劑中每兩味藥中藥之間的關聯度;王師菡[13]等人用廣義信息熵法成功提取名老中醫藥專家治療冠心病心絞痛的常用藥對;Yan Li[14,15]等人提出了一種新的DMIM(distance-based mutual information model)算法以發現方劑中藥物之間的潛在關聯;楊銘[16]等人用復雜系統熵網絡發現中醫方劑中有顯著性關聯的核心藥對;樊鳳杰[17]等人基于偏序結構圖的可視化方法從原始數據中發現常用藥對和藥組。近年來出現的大量針對中醫藥開發的中醫藥類傳承平臺對方劑藥對提取也提供了一定的方法支持[18-20]。上述方法在核心方挖掘和藥對發現上作了有益探索,但大多基于經典的關聯分析算法進行改進和優化,尚存在計算相對復雜,藥對發現的適用性不強等問題。鑒于此,本文根據藥對特點,提出一種全新的藥對發現算法TCM-HPD,以矩陣運算為基礎,以聯合條件概率為藥對提取依據,能夠高效解決中醫醫案中的藥對提取問題。

表1 方劑—藥物對應表

2 中藥條件概矩陣構建算法

2.1 相關定義

2.1.1 共現矩陣

共詞分析方法[21]為一種內容分析方法,它通過對一組詞兩兩統計它們在同一篇文獻中出現的次數,以此為基礎對這些詞進行分層聚類處理,從而反映出這些詞之間的親疏關系,進而分析這些詞所代表的學科和主題的結構變化[22]。共現矩陣即是由共詞分析方法中的共現頻數構成,是用來描述兩兩事物在同一批樣本中共同出現的次數。其定義如下:

其中X[i,j]、X[j,i]均表示樣本中事物i,j共同出現的次數,X[i,i]、X[j,j]分別表示事物i、事物j在樣本中出現的次數。

2.1.2 條件概率

條件概率為概率論與數理統計中的概念,指一個事件B在事件A已經發生的情況下發生的概率,記為P(B|A)。在其數學定義如下:

設A、B是兩個事件,且P(A)>0,稱

為在事件A發生的條件下事件B發生的條件概率[23]。其中P(A)是A發生的概率,P(AB)是A、B同時發生的概率。

2.1.3 聯合條件概率

聯合概率是指在多元的概率分布中多個隨機變量分別滿足各自條件的概率[24]。聯合條件概率即指在多元的概率分布中多個隨機變量分別滿足各自條件的條件概率。其定義如下:

2.2 算法流程

在醫案中判斷兩味藥是否為藥對可通過判斷兩味藥的配伍是否相對固定,即兩味藥中的其中一味藥出現時另一味藥是否也出現。這一問題可以轉換為在一味藥出現的前提下另一味藥出現的概率,即條件概率問題,以聯合條件概率作為判定藥對的依據。

2.2.1 共詞矩陣的構建

通過掃描藥物數據庫,計算任意出現的藥物之間共同出現的次數,構建共詞矩陣M1;

2.2.2 條件概率矩陣的構造

假設A、B 為任意兩味藥物,通過在共詞矩陣中對應的共現次數計算藥物A、B的條件概率,并構造條件概率矩陣M2;

2.2.3 提取藥對

將條件概率矩陣M2 乘以M2 的轉置矩陣,得到新的矩陣M3,設定合適的標準,利用M2、M3提取藥對。

下面以具體數據(表1)為例進行說明,其中F1-F3為不同的方劑編號,a-e為不同的中藥。

(1)計算共現矩陣

掃描藥物數據,得到所有的藥物集合X={a,b,c,d,e},構造5*5的零矩陣S0,行列均為藥物;再次掃描藥物數據,如果掃描到藥物組X1∈X,則X1對應的藥物行列都置為1,形成F1矩陣;將S0矩陣加上F1矩陣,形成新的矩陣S1;循環掃描數據庫,直到掃描完畢。

圖1 共詞矩陣計算過程

圖2 聯合條件概率矩陣計算過程

(2)構造條件概率矩陣

將共現矩陣中的每一個元素,除以該行對腳線上的元素,其表達式如下:

其中S[i,j]為共現矩陣中的第i行j列的元素值,C[i,j]為對應的條件概率值。C[i,j]構成條件概率矩陣C3;利用C3乘以C3的轉置矩陣,得到矩陣C4。

(3)藥對提取

設定最小聯合條件概率閾值(minUnion),將聯合條件概率≧minUnion 的藥物組合提取出來,作為潛在藥對。

3 實驗及結果分析

3.1 數據預處理

本文病案來源于國醫大師周仲瑛傳承工作室數據庫中的冠心病病案資料1512 診次,包含306 味不同中藥。參照《中華人民共和國藥典》對病案中的中藥進行規范化處理,包括藥名拆分、藥名統一等,例如“丹皮參”拆分為“丹皮”和“丹參”兩味藥,“南北沙參”拆分為“南沙參”和“北沙參”,“白夕利”改為“白蒺藜”等。

3.2 實驗過程

為了比較傳統關聯分析提取藥對與本文算法提取藥對的差異。本實驗①利用經典的Apriori 對藥物數據進行分析,篩選其中的二元規則作為潛在藥對;②按照TCM-HPD算法流程,構造構造聯合條件概率矩陣,分析不同minUnion 閾值下的潛在藥對分布及藥物網絡情況,根據分析結果確定最佳minUnion 閾值,最后結合中醫理論歸納總結上述兩種方式發現的潛在藥對,以說明TCM-HPD算法的優越性。

圖3 潛在藥對分布

3.3 實驗結果

3.3.1 Apriori藥對提取結果

(1)取最小支持度為0.05,最小置信度為0,利用Apriori 得到二元規則(潛在藥對)5487條。以0.1作為置信度的間隔,以置信度區間作為橫坐標,潛在藥對數目作為縱坐標,得到潛在藥對分布情況(圖3)。

(2)設定最小置信度閾值為0.9,得到潛在藥對共40個(表2)。

表2 潛在藥對表(最小置信度≥0.9)

3.3.2 TCM-HPD藥對提取結果

(1)構造共現矩陣,其中出現次數前10 的高頻藥物共現矩陣(表3)。

(2)設定最小聯合條件概率閾值為0.4,利用TCMHPD計算聯合條件概率矩陣,得到潛在藥對(表4):

(3)為更直觀展示TCM-HPD 算法提取的藥對結果,繪制不同聯合條件概率區間下藥對分布圖(圖4),以及不同聯合條件概率閾值下對應的藥物網絡圖(圖5)。

3.4 結果分析及討論

從Apriori 藥對提取結果可知:通過置信度進行藥對篩選,其候選記錄多達5487 個,隨著置信度閾值的增大,藥對數量相應減少(圖3),當最小閾值大于等于0.9 時,仍然有40 個潛在藥對,其中存在相同的藥對,如表2中規則“煅龍骨,煅牡蠣,1.0000”和“煅牡蠣,煅龍骨,1.0000”,二者為不同的關聯規則,但對應的是同一組藥對,故關聯規則提取藥對存在冗余,且提取精度不佳;此外,某些關聯規則雖然單個方向上置信度值很高,但在反方向上的置信度卻很低,如“竹茹→法半夏,1.0000”和“法半夏→竹茹,0.1429”,很顯然這類規則中的藥物不應該被認為是潛在藥對,但由于“竹茹→法半夏”的置信度較高,因此也被納入潛在藥對中,導致藥對提取效果不佳。藥對中兩個藥物具有平等的地位,在規則上也應該具有兩個方向上相當水平的置信度。由于置信度表現的是一味藥物在另一味藥物已經存在的前提下存在的可能性,僅能單方面的反映兩味藥之間的關聯。而藥對作為兩味藥在臨床中常見的相對固定的配伍形式,利用置信度顯然不能體現其“相對固定”的特點,因此,僅僅依賴置信度判定藥對顯然是不合理的。

表3 高頻藥物共現矩陣(Top 10)

表4 潛在藥對表(minUnion=0.4)

圖4 潛在藥對分布圖

從TCM-HPD 藥對提取結果可知:高頻共現的藥物組合不一定為藥對,以丹參相關高頻藥物組合為例(表3,表4),丹參和法半夏(549)、丹參和砂仁(450)、丹參和黨參(387)、丹參和黃連(352)、丹參和雞血藤(324)、丹參和知母(306)均未出現在潛在藥對中,而丹參和川芎、丹參和麥冬、丹參和太子參被判定為潛在藥對。丹參和川芎為常用均為活血化瘀藥,二者相須為用,增強活血化瘀作用;丹參和麥冬、丹參和太子參是滋陰活血常用藥對,周老臨床經常丹參合生脈飲治療冠心病氣陰兩虛證,因而出現上述藥對。從潛在藥對分布圖(圖4)可以看出TCM-HPD 算法對最小聯合概率minUnion 高度敏感,隨著minUnion 增大,潛在藥對數量急劇減少,當到達0.4左右,曲率逐漸趨于平緩。

從藥物網絡(圖5)可以看出,當minUnion較小時,網絡中出現大量藥物社團,且并非是兩個藥物的組合,當minUnion 為0.4時,社團呈現兩三味藥的小網絡,趨近于藥對網絡,其中包括經典藥對,如澤蘭和澤瀉、南沙參和北沙參、煅龍骨和煅牡蠣、川芎和丹參、全瓜蔞和薤白,同時也蘊含了周老臨證的特殊藥對,如九香蟲和莪術、莪術和甘松、陳皮和竹茹,九香蟲理氣止痛、溫中助陽,莪術行氣破血、消積止痛,二者相須為用,治療肺癌氣滯血瘀的病證;甘松理氣止痛、開郁醒脾,莪術和甘松同用,共奏行氣散瘀止痛之效;陳皮和竹茹是《金匱要略》陳皮竹茹湯的核心藥物,該方具有理氣降逆、益胃清熱之功效,周老臨證用方意而不用全方,用陳皮行氣和胃以止嘔,竹茹清熱和胃以止嘔,二藥同用,使熱去氣降,治療肺癌導致的胃氣上逆。此外,潛在藥對中還出現了太子參、麥冬、丹參兩兩之間的藥對,這是由于周老臨床喜用生脈飲合丹參飲加減治療氣陰兩虛、絡脈瘀阻的病證,因而在藥對網絡中呈現出這三味藥兩兩之間的特殊藥對。

圖5 藥物網絡分布圖

綜上可知:Apriori算法作為經典的關聯算法之一,通過對數據庫進行多次掃描來計算項集的支持度,發現所有的頻繁項集從而生成關聯規則,整個過程是十分繁瑣的,且因要多次掃面數據庫,其時間復雜度和空間復雜度都很大,導致其效率較低。利用置信度作為事物間關聯強度標準,易忽視一些隱含的規律;若置信度設置過低,結果保留太多,則干擾信息多,增加人工再整理的難度。TCM-HPD 算法從矩陣運算為出發點,通過共現矩陣計算條件概率,省去循環迭代掃描數據庫的過程,時間復雜度和空間復雜度均大大降低,用聯合條件概率作為提取藥對的條件提高了結果準確度,TCM-HPD 算法對最小聯合概率minUnion 高度敏感也大大減少人工再刪減工作,運算簡單、高效。minUnion 是兩個條件概率的乘積P1×P2,當minUnion較小時,對條件概率約束也相對較差,而當minUnion為0.4 時,P1、P2至少大于0.4,極端情況下P1=0.4,P2=1.0,如果P1、P2值處于同一水平,那么至少要保持在(約0.63)以上(即,左右條件概率均需在0.63以上),從而保證藥對的有效提取。

4 結語

本文通過分析藥對發現的重要意義及對藥對提取方法現狀進行思考,提出了一種全新的藥對發現算法TCM-HPD。將藥對發現問題轉化為矩陣運算問題,從醫案中的藥物入手,構造聯合條件概率矩陣,利用最小聯合條件概率篩選潛在藥對。利用該算法對冠心病醫案方藥進行分析,成功提取了相關藥對,結果符合專家經驗。本文提出的TCM-HPD 算法具有原理簡單、易于實現等特點,可以為廣大中醫藥臨床和科研工作者提供便捷、高效、易用的藥對發現工具,提高中醫臨床醫案研究的效率。

中醫藥在漫長的發展過程中形成了自己獨特的理論和診療經驗,名老中醫的學術經驗是中醫藥事業的一筆巨大的財富。總結名老中醫的經驗,繼承他們的學術,既是今天振興中醫藥事業的需要,也是歷史賦予我們的重任。藥對是聯系方劑和中藥的重要環節,相比于傳統的利用置信度的關聯規則方法,本算法利用最小聯合條件概率進行藥對提取更加符合藥對的特點,可以為名老中醫用藥規律挖掘提供方法學參考。

猜你喜歡
關聯中醫藥規則
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
中醫藥在惡性腫瘤防治中的應用
中醫藥在治療惡性腫瘤骨轉移中的應用
數獨的規則和演變
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
從《中醫藥法》看直銷
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
主站蜘蛛池模板: 国产精品2| 国产免费羞羞视频| 中文国产成人精品久久| 国产在线观看人成激情视频| 亚洲视频在线网| 欧美日韩综合网| 亚洲Va中文字幕久久一区| 国产门事件在线| 伊人激情久久综合中文字幕| 99在线观看国产| 四虎影视国产精品| 亚洲中文字幕日产无码2021| 欧美国产日本高清不卡| 亚洲二区视频| 一级毛片a女人刺激视频免费 | 日韩视频免费| 亚洲一区网站| 久久国产亚洲欧美日韩精品| 5555国产在线观看| 国产精品污污在线观看网站| 亚洲精品不卡午夜精品| 国产成人区在线观看视频| 久久精品免费国产大片| 亚洲国产日韩一区| 亚洲精品成人片在线观看| 欧美一区中文字幕| 一级在线毛片| 国产精品亚洲天堂| 久久久精品国产SM调教网站| 亚洲91精品视频| 国产经典在线观看一区| 99国产在线视频| 日本欧美一二三区色视频| 国产国产人在线成免费视频狼人色| yjizz国产在线视频网| 成人免费一级片| 九色国产在线| 99久久国产精品无码| 国产成人精品男人的天堂 | 国产一区二区精品高清在线观看| 亚洲欧美激情另类| 一本久道久综合久久鬼色| 日本午夜影院| 欧美日韩专区| 最新国产成人剧情在线播放| 欧美在线国产| 狠狠亚洲五月天| 亚洲天堂视频网站| 亚洲AV无码精品无码久久蜜桃| 国产精品99一区不卡| 国产在线观看91精品| 怡红院美国分院一区二区| 亚洲国产欧洲精品路线久久| 久久免费成人| 欧美日韩国产综合视频在线观看| 成人午夜久久| 国产超碰一区二区三区| 国产美女丝袜高潮| 精品无码视频在线观看| 九九热精品免费视频| 亚洲人人视频| 国产成人精品2021欧美日韩| 奇米影视狠狠精品7777| 无码AV日韩一二三区| 国产精品无码久久久久久| 99热这里只有精品在线播放| 麻豆精品久久久久久久99蜜桃| 91久草视频| 在线中文字幕网| 国产麻豆aⅴ精品无码| 一边摸一边做爽的视频17国产| 国产毛片高清一级国语 | 亚洲啪啪网| 青草免费在线观看| 国产精品女同一区三区五区| 国产另类视频| 中文字幕欧美日韩高清| 看你懂的巨臀中文字幕一区二区| 亚洲精选无码久久久| 伊在人亚洲香蕉精品播放| 亚洲天堂网在线播放| www.狠狠|