999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于關聯規則的隧道掘進中巖機信息感知互饋數據挖掘方法研究

2021-09-17 01:10:38喬金麗徐源浩劉建琴胡建幫
隧道建設(中英文) 2021年8期
關鍵詞:數據挖掘關聯規則

喬金麗,徐源浩,劉建琴,胡建幫

(1.河北工業大學土木與交通學院,天津 300401; 2. 天津大學機械工程學院,天津 300072)

0 引言

掘進機在服役過程中對巖體條件敏感,巖體信息不明確將直接影響智能掘進決策,造成操作參數不合理、預警不及時等問題,因此,必須保證掘進過程中的安全與效率[1-2]。為了研究掘進機掘進過程中各因素之間的相互作用影響,近年來,越來越多的人工智能技術手段開始應用于巖土工程領域。Boubou等[3]利用神經網絡對地表沉降進行預測;朱北斗等[4]利用BP神經網絡對掘進參數進行訓練,建立了地層識別模型; Liu等[5]同樣利用神經網絡建立了巖體特征預測模型; 田睿等[6]利用改進的深度神經網絡對巖爆烈度等級進行預測; 張天瑞等[7]通過數據挖掘技術對掘進機運行中出現的故障加以診斷,提高了診斷速度; Khamesi等[8]將最近鄰聚類與梯度下降、粒子群(PSO)、帝國主義競爭(ICA)3種算法結合模糊系統反智能推測土層類別; Zhou 等[9]建立粒子群算法與支持向量機的混合模型,對TBM掘進能耗進行預測,用于幫助確定TBM的性能和效率;Yagiz等[10-12]利用粒子群、灰狼算法等基于隧洞地質條件來預測TBM的掘進速度; Masoud等[13]則用基因規劃表達在Yagiz的基礎上進一步做出了TBM掘進速度的擬合公式。

以上工作大都是揭示定量關系,且由于神經網絡等是黑箱操作,未能清楚地表達各項因素之間的因果關系。在數據挖掘方面,關聯規則可以實現直觀定性描述,已經成功地應用于揭示各種領域中的因果關系[14-15]。本文基于數據挖掘理念,對數據進行K-means聚類分析與預處理,應用關聯算法,建立數據挖掘模型,得到多條關聯規則,關聯規則可直觀顯示各因素在不同類別下的相互影響作用,建立明確的因果導向。為掘進機提供先導判據,與決策樹預測結果進行比對,綜合現場巖體參數結果等多源信息,進行巖機的交互式耦合預測,以期實現在靜態預測基礎上的掘進過程動態分析。

1 關聯規則挖掘算法

1.1 關聯規則原理

關聯規則分析是為了從數據集中找出各項之間的關聯關系。Apriori算法[16]是一種最有影響的挖掘布爾關聯規則頻繁項集的算法,其核心思想是通過連接產生候選項與其支持度,然后通過剪枝生成頻繁項集。

頻繁項集是指支持度大于或等于給定的最小支持度閾值的事項集。關聯規則參數之間的關聯度可以用支持度和置信度2個指標來表示,同時使用提升度作為鑒定強關聯規則是否有效的標準。支持度、置信度與提升度的表達式分別如式(1)、式(2)、式(3)所示。

Support(A→B)=P(A∪B)=count(A∪B)/D。

(1)

Confidence(A→B)=P(B│A)。

(2)

Lift(A→B)=P(B│A)/P(B)=

Confidence(A→B)/P(B)。

(3)

式(1)—(3)中:D為數據集;A、B為事項集。

在建立關聯模型前需要設定好最小支持度和置信度,只有支持度和置信度不小于最小值,且提升度大于1的結果才被選為推薦的強關聯規則。

關聯規則模型的建立流程如下:

1)對于給定的最小支持度閾值,遍歷數據集D,剔除小于該閾值的項集,得到1項頻繁項集L1。

2)由頻繁項集L1自身連接產生2項候選集D1;同樣對比閾值,保留滿足條件的2項頻繁項集L2。

3)由頻繁項集L2自身連接產生3項候選集D2;同樣對比閾值,保留滿足條件的3項頻繁項集L3。

4)循環2)、3)步,每一步增加1項,直到得到最大頻繁項集Lk。

1.2 關聯規則實例演示

以某一商場的簡單交易清單為例(如表1所示),假定只存在4種商品,分別為商品0、1、2、3。所探索的是商品組合被一起購買的概率,其組合類型如圖1所示。

表1 某商場的簡單交易清單

圖1 商品的組合類型

圖1顯示了商品之間所有可能的組合,從上往下第1個集合是?,表示不包含任何物品的空集,商品集合之間的連線表明2個或者更多集合可以組合形成1個更大的集合。

使用集合的支持度來度量其出現的頻率。設定最小支持度為60%,商品0、1、2、3的支持度分別為4/5、4/5、4/5、2/5,則商品3明顯不符合,因此1項頻繁集為商品0、1、2。

如果1個項集是非頻繁的,那么它的所有超集也是非頻繁的。因此,所有含有商品3的超集都是不頻繁的,只余下{0,1}、{0,2}、{1,2}、{0,1,2},其支持度分別為3/5、3/5、3/5、2/5,因此{0,1,2}為非頻繁項,只存在2項頻繁集。

置信度計算: 對于2項頻繁集,設定最小置信度為70%,有關聯規則{0}→{1}、{0}→{2}、{1}→{2},其置信度分別為3/4、3/4、3/4,都滿足最小置信度要求,對于關聯規則{0}→{1}可以說購買商品0的人有很大可能購買商品1,其他關聯規則同樣如此。

2 影響因素的數據K-means聚類預處理

2.1 試驗數據

研究中,關聯模型所采用的數據來自于一個硬巖隧道開挖項目(皇后區3號輸水隧道,第2階段)編制的數據庫[10]。此數據庫包括巖石單軸抗壓強度(UCS)、巴西抗拉強度(BTS)、用于量化巖石脆韌性的峰斜指數(PSI)、巖體連續性方向的α角、薄弱面間距(DPW)、掘進速度(ROP)、巖石破碎等級及巖石類型,共計153例。其中,峰斜指數是施加在試樣上的最大載荷(kN)與相應位移(mm)的比值。巖石共有5種類型,編號設置為1—5,分別是: 花崗質(長英質)片麻巖和正片麻巖,占比29.4%; 正片麻巖,占比20.3%; 片麻巖、角閃巖和片巖,占比39.8%; 塊狀石榴石角閃巖和較大的巖墻,占比9.1%; 流紋英安巖脈巖,占比1.3%。巖石破碎等級與薄弱面間距除極少數環有不同外基本相同,將破碎等級與薄弱面間距合并為1項,共分為3種不同類型,間距小于0.4 m為一類,大于1.6 m 為一類,0.4~16 m為一類。

數據庫中UCS、BTS、PSI與α參數曲線、掘進速度曲線分別如圖2和圖3所示,可以看到巴西抗拉強度與峰斜指數的變化較為平緩,另外3個參數的變化則非常明顯。所有數據是在整條隧道的不同環隨機選取的,保證了數據的隨機性與代表性。表2示出各個參數的最大值、最小值、平均值、標準差與偏差值。標準差越小,說明數據值與平均值的偏差就越??;偏差值可以用標準差/平均值的比值來表示,抗拉強度的偏差值最小,說明BTS的變化最小。

圖2 數據庫中UCS、BTS、PSI與α參數曲線圖

圖3 掘進速度曲線圖

表2 各項參數統計

2.2 聚類處理

使用K-means聚類方法對數據庫中的各項參數進行聚類分析,指定數據劃分為3類,隨機選取樣本集中3個對象作為初始聚集中心,針對所有對象,計算其與3個聚集中心點的距離,然后將該對象歸為距離最小的聚集中心代表的簇。1次計算歸類結束之后,針對每個簇類,重新計算聚集中心,然后針對剩余對象,重新尋找距離最近的聚集中心。如此循環,直到前后2次迭代的簇類沒有變化。

各項參數的聚集結果見表3,按照高、中、低對聚類結果用0、1、2進行標注。由表3可知,高抗壓強度為170.3~199.7 MPa,中抗壓強度為144.8~169 MPa,低抗壓強度為118.3~143.4 MPa,超過一半的巖體屬于低抗壓類; 高抗拉強度為9.8~11.4 MPa,中抗拉強度為8.6~9.6 MPa,低抗拉強度為6.7~8.4 MPa,接近一半的巖體為高抗拉強度; 高峰斜指數為52~58 kN/mm,中峰斜指數為35~46 kN/mm,低峰斜指數為25~34 kN/mm,64.1%的巖體屬于低峰斜指數;α高角度為57°~89°,中角度為31°~56°,低角度為2°~30°,α的分布較為平均,各聚類結果基本接近1/3。掘進機的掘進速度則呈現中間大的分布,高掘進速度為2.39~3.07 m/h,中掘進速度為1.93~2.37 m/h,低掘進速度為1.27~1.91 m/h。

表3 各項參數的聚類結果

3 隧道巖機數據挖掘模型

3.1 基于關聯規則的隧道巖機數據挖掘

在本模型中,設置最小支持度為5%,最小置信度為80%,由于當全部數據用于分析時,前置條件和后置結果存在相互支持的現象,所以指定掘進機的掘進速度這一參數作為后置結果,對數據庫選取的7個參數進行數據挖掘,共生成符合預先設定閾值條件的有效關聯規則20條,如表4所示。

表4 掘進機掘進關聯規則結果

表4中的每一條關聯規則都代表著一條因果關系。例如,關聯規則1揭示了抗拉強度(MPa)在[8.6,9.6]、α(°)在[57,89]、巖石類型為正片麻巖時,掘進速度(m/h)位于低速掘進區[1.27,1.91]的置信度為100%。換言之,基于強相關特性,所有4個參數值會同時出現。

基于關聯規則整理出的20條規則,可以看到,有6條規則置信度為100%,4條規則不低于90%,剩余規則置信度則全部低于90%;而在掘進速度方面,所得出的結果要么是處于低掘進區間,要么處于中掘進區間,沒有高掘進區間。導致這一結果可能的原因,一方面在于采用的數據集中高區間本身所占比例就遠遠小于中低區間,沒有足夠的樣本數量;另一方面高區間掘進速度實際出現的情況偏少。

從規則1與規則3中可以看到,在增加了一項因素之后,其他條件不變的情況下,所得到的結果并沒有發生變化;但這不能說明UCS的影響是可以忽略不計的,如規則10與規則11所示,存在UCS條件的規則,比存在BTS條件的規則置信度高。

從規則4、8、10、14及16、17、18可以近似得到低抗壓強度與低的α角對于低掘進速度是非常必要的,這與通常認為的低抗壓強度會使得破巖速度加快有所出入。但在破巖速度與掘進速度之外,還要考慮貫入度等其他因素,如α角較小,在掘進時巖體與掘進機偏向正對,從而導致掘進速度較低。這一推斷與其他規則中高等程度的α角得到的是中等掘進速度相比較后可以進一步推論,α角在中等掘進區間可能有助于掘進速度的提高。

在巖石類型方面,出現的是第2種和第3種巖體,即正片麻巖與片麻巖、角閃巖和片巖,但考慮到出現巖體類型的規則僅有6條,說明巖體類型對掘進速度的影響偏小,是次要因素;縱觀整個規則表,薄弱面間距大都表現為低間距區間,其與掘進速度呈現出正相關。

隨著隧道掘進進度的不斷推進,關聯規則模型逐步建立,一方面在前期地質勘察的基礎上,根據測點地質條件及應用模型給出的關聯規則,推斷掘進參數的選取范圍; 另一方面通過正向地質勘探或超前地質預測對掌子面地質進行推定,然后對各項地質參數分類后由關聯規則導出掘進參數范圍。即先獲取地質參數,再由當前模型參數聚類結果明確范圍,最后根據符合的關聯規則推斷合適的掘進參數范圍。隨著掘進過程不斷獲取新數據,更新關聯規則模型,使其更加完善。

3.2 基于決策樹的隧道巖機數據挖掘

決策樹模擬人通過條件判斷將集合進行分割的過程,通常有3個步驟: 特征選擇、決策樹的生成、決策樹的修剪。1顆決策樹包含1個根節點、若干個內部節點及若干個葉子節點。根節點與內部節點的劃分條件取決于當前數據集的最優劃分屬性,即通過該屬性使劃分出去的下一級節點的數據集盡可能純凈;葉子節點是決策樹最終的決策結果,全部葉子節點數據集的合集是樣本全集;整個決策樹就是多條由根節點到葉子節點的判定測試序列組成。

決策樹的直觀表示見圖4,A對應為根節點,包含了樣本全集;B對應為內部節點;C、D、E為葉子節點;T表示符合當前劃分條件,F表示不符合。

圖4 決策樹示意圖

通過每一次決策的判定,在圖4中包含的決策規則有3條: 決策1,A→B→D; 決策2, A→B→E; 決策3,A→C。

在決策樹模型中,選取全數據集的80%作為訓練集,20%為測試集。為充分發揮決策樹本身對于最優特征選擇的能力,只將掘進效率進行分類,其余參數保持原有數據。決策樹運行結果見表5。

表5 決策樹結果

決策樹模型的決策鏈中特征可能出現不止一次,但從葉子節點進行倒推時,每個特征的區分區間必包含于上級節點中。以某一決策鏈為例,最后葉子節點全部數據集為24組低區間,整個決策鏈中α角出現過2次,DPW出現3次,由高至低α角分別為高于14°、高于57°,DPW分別為高于0.4 m、高于0.8 m、高于1.6 m。

3.3 決策樹與關聯規則的預測模型對比

為確定決策樹預測模型的可靠性,使用測試集進行驗證,但其在測試集中只有58.97%的正確率。決策結果分散大,說明其決策鏈對于樣本量要求比較高;數據量少時,模型容易受到個別數據的影響發生波動,這是準確率低的主要原因之一。相較之下,關聯規則是基于全體數據庫建立的,每條規則在建立時首先進行了置信度評價,其得出的規則結論直觀清晰,具有較高的可信度。當前研究著力于單一隧道的模型預測。在隧道開挖初期,數據采集器獲得的數據量偏少,關聯規則模型對數據的充分利用使其能在開挖初期仍能得到有效結論,對智能掘進具有一定的參考價值。

在隧道開挖初期,關聯規則模型在一定巖體條件的地層進行隧道掘進時,可以預估掘進參數的大致范圍,或者根據正常隧道掘進時的相關隧道參數,實現對其他地質特征的初步推測,有助于保證隧道施工的安全與效率。

4 結論與討論

采用基于關聯規則的數據挖掘手段,對巖體地質關鍵參數與掘進機工作參數之間的因果關系進行分析,有效地揭示地質參數與掘進參數之間的耦合關系,達到優化控制參數、指導掘進的目的。主要結論如下:

1)K-means聚類算法的應用將原始數據按照其臨近程度分為高、中、低3組,并編號處理;分類編碼后,確定了地質參數中的抗壓強度、抗拉強度、峰斜指數、薄弱面間距、掘進速度、巖石連續性方向的α角、巖石類型等7個主要因素,為建立關聯規則提供了支撐。

2)關聯規則結果顯示,巖體的抗拉強度、抗壓強度及巖石連續性方向的α角是影響隧道掘進的重要因素,薄弱面間距的大小雖然也有一定影響,但在20條規則中出現次數明顯少于其他因素。

3)在隧道開挖前,通過地質勘測初步確定了巖石的單軸抗壓強度、巴西抗拉強度、峰斜指數、巖石連續性方向的α角、薄弱面間距等地質參數,結合本文所述關聯規則可以得到相應的掘進參數范圍,為智能掘進的實現提供理論參考依據。

4)多維關聯規則挖掘方法分析多個參數之間的相關性,在原始數據集的基礎上進行數據預處理、關聯規則挖掘,對于多因素影響的相關性分析有著廣泛的適用性;較之決策樹結論更直觀清晰,適用于開挖初期數據量較少時的模型建立;在實際的工程中,有助于隧道掘進中各參數的協調一致。

因此,針對掘進機和巖體參數復雜的隧道施工數據收集,引入數據挖掘是一種簡單而較為成功的嘗試,但規則簡單粗放,各個簇的范圍較大,最終結果限定在一定范圍內,沒有明確的參數值,參考意義大于決定意義;隨著參數種類的豐富,隧道數據的積累,能夠建立越來越完善的關聯模型。而使用更多的數據挖掘手段,特別是建立多參數間的明確的模型,可以為隧道的智能化施工奠定基礎。

猜你喜歡
數據挖掘關聯規則
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
探討人工智能與數據挖掘發展趨勢
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 亚洲天堂视频网站| 欧美成人午夜视频免看| 青青久久91| 国产天天色| 伊人天堂网| 91麻豆精品国产91久久久久| 天天综合亚洲| 99久久精品免费看国产电影| 国产主播喷水| 色综合激情网| 亚洲伊人天堂| 自拍亚洲欧美精品| 国产精品亚洲专区一区| 国产成人一区| 国产特级毛片| 亚洲 成人国产| 久久精品亚洲中文字幕乱码| 国产一二三区在线| 久久女人网| 2020国产精品视频| 国产最新无码专区在线| 在线va视频| 久久精品亚洲热综合一区二区| 一区二区午夜| AV无码国产在线看岛国岛| 丁香五月婷婷激情基地| 丁香婷婷激情综合激情| 粗大猛烈进出高潮视频无码| 91成人精品视频| 日本精品中文字幕在线不卡| 伊在人亚洲香蕉精品播放| 久久不卡精品| 91精品aⅴ无码中文字字幕蜜桃| 欧美中文字幕一区二区三区| 91久久青青草原精品国产| 911亚洲精品| 2020国产免费久久精品99| 女人av社区男人的天堂| 日韩精品专区免费无码aⅴ| 日韩在线第三页| 久久人人爽人人爽人人片aV东京热 | 久久婷婷五月综合色一区二区| 人妻出轨无码中文一区二区| 美女国内精品自产拍在线播放| 四虎综合网| 67194亚洲无码| 亚洲国产系列| 无码'专区第一页| 这里只有精品在线播放| 欧美性精品| 五月激情综合网| 亚洲成年人片| 亚洲欧美极品| 日本午夜三级| 伊人久久精品亚洲午夜| 欧美成人精品一级在线观看| 91精品aⅴ无码中文字字幕蜜桃| 网久久综合| 久久精品视频亚洲| 无码网站免费观看| 国产欧美日韩另类精彩视频| 国产欧美日韩视频怡春院| 日本少妇又色又爽又高潮| 人人妻人人澡人人爽欧美一区| 国产精品毛片一区| 欧美国产精品不卡在线观看 | 国产乱子伦无码精品小说| 91青青草视频| 免费国产高清视频| 国产麻豆va精品视频| 亚洲精品福利视频| 久久这里只有精品66| 国产美女自慰在线观看| 欧美精品1区2区| 一区二区影院| www.91在线播放| 中国一级特黄视频| 亚洲第一极品精品无码| 免费又爽又刺激高潮网址 | 国产一区成人| 国产99视频精品免费视频7| 亚洲日韩精品伊甸|