曹作忠 張 默 朱君星 江東平
(1.中鋼集團馬鞍山礦山研究院有限公司,安徽馬鞍山243000;2.金屬礦山安全與健康國家重點實驗室,安徽馬鞍山243000;3.金屬礦產資源高效循環利用國家工程研究中心,安徽馬鞍山243000)
一般來說,表征尾礦的物理性質有多個因素,一個因素有一個或多個指標來體現,如尾礦的孔隙情況可以用孔隙率或孔隙比來表示,指標或因素之間往往又是相互關聯的。因此,如能從尾礦眾多物理指標中探求決定尾礦堆體穩定性的物理性能本質指標,既可節省人力財力,又可最大限度地減少人為因素和偶然因素對指標精度的影響,本文在研究大量尾礦物理性質試驗數據的基礎上,利用計算機,采用現代數學中的相關分析與聚類分析法,對尾礦物理性質參數進行分類,從中尋求代表性指標。
通過對國內外尾礦物理性質指標的研究,常用的物理指標可分為物理性質指標和粒級及級配指標,其中物理性質指標包括重力密度、孔隙比、含水量、滲透系數、壓實度、固結系數等17個,粒級及級配指標包括平均粒徑、不均勻系數等5個。由于尾礦的物理性質指標有基礎指標和計算指標,有的基礎指標和計算相關性很明顯,因此在基礎指標選取時刪除部分計算指標。另外尾礦的液限、塑限、塑性指數和液限指數是表現尾礦狀態的指標,本次研究也將其排除在外。
為了使指標樣本具有代表性,本研究在多個銅、鐵礦山尾礦試驗結果中隨機抽取了104個樣本[1-2],樣本含有12個基礎指標,表1列出了部分參入分析的樣本指標。

表1 尾礦物理參數樣本Table 1 The sample of tailings physical parameters
在統計學中常用相關系數來表示變量之間的相關程度,用相似系數來描述變量之間的相似程度。其原理是假設自變量xi和因變量yi都呈正態分布,則xi和 yi之間的相關系數[3]定義為


以上相關是單向相關分析,當2個相關變量受到其他各變量影響時,可采用偏相關與單相關分析進行比較,確定其受其他變量的影響。偏相關是用固定其余的變量,消除其余變量的影響,只研究指定兩個變量間的純相關關系,它彌補了簡單相關不能真實地反映2個變量間的相關關系。偏相關分為一級偏相關、二級偏相關、……和最高級偏相關,本研究采用最高級偏相關與單相關比較。最高級偏相關是將m-2個變量固定,研究其他2個變量的相關關系。其最高級偏相關系數[4-5]定義為

式中,i,j是1~m個因素中任意2個因素;k是除i,j外的固定因素,有 m - 2 個;cij,k是固定 k 后,i和 j因素的最高級偏相關系數。
按照表1中從左到右的樣本參數順序,12個基礎樣本參數的平均相關性系數計算結果如下:

相關系數是相關性大小的度量,其定義域為[-1,1],一般地:相關系數0.0≤|r|<0.4為低度相關;相關系數0.4≤|r|<0.7為中度相關;相關系數0.7≤|r|<1.0為高度相關。
從相關系數矩陣得出含水量、孔隙比、壓縮系數等相關;有效粒徑和限制粒徑相關;濕密度與干密度、土粒比重相關;滲透系數和固結系數相關;等等。以上相關性通過以下的相關檢驗,得出相關組。
一般地,假設樣本值、計算值和隨機變量x、y母體服從正態分布[2],則按照下列步驟檢驗:
(1)當母體相關系數ρ=0,表示隨機變量ξ和η之間不相關;ρ≠0,表示隨機變量ξ和η之間相關。
(2)選擇檢驗時風險率(也稱顯著水平)α,本研究選擇α=0.01。

(3)計算統計量此統計服從自由度為(n-2)的t分布。
(4)根據風險率α和統計量t,查t分布表的t臨界值ta,本次研究104個樣本,ta為2.624,計算臨界相關系數

(5)檢驗相關矩陣,如r≥ra,則2變量與母體顯著相關,2變量屬于反映事物的同一特征的變量。
各指標之間的相關程度分析見表2所示。

表2 各指標之間的相關程度Table 3 Relative correlation among the index
從檢驗結果得知:含水量與干密度、孔隙比、限制粒徑、不均勻系數中度相關,而與土粒比重低度相關;不均勻系數與限制粒徑高度相關,而與含水量中度相關等。按照相關系數的顯著性,整個基礎指標可以分為3個相關類別,即:第1類,孔隙比、含水量、壓縮系數;第2類,壓縮模量、土粒比重、干密度、濕密度;第3類,固結系數、滲透系數、不均勻系數、限制粒徑、有限粒徑。
另外,有些變量為正相關,有的為負相關,在尾礦物理性質分類變量組合時,為避免正負抵消,本研究將采用原始數據倒數的方法對原始數據進行調整后,進行聚類分析。
為使分類合理,必須存在一個描述樣品或變量之間親疏關系的變量,在統計學上一般用“距離”來形象地描述樣品或變量之間親疏關系,“距離”越小表示他們關系越近,“距離”越大則反之。對于單變量很好理解,對于雙變量或三變量事物,可以用兩維或三維坐標空間2點之間距離描述事物之間的親疏關系,以次類推,對于m個變量的事物可以看成m維空間的一個點,在點與點之間定義距離。
在統計學上,距離的定義有多種,本研究采用歐氏距離[3-6]。歐氏距離相當于任意m維體的斜邊長,簡單明了,但它與m個變量的量綱有關,為此,本研究在樣品和指標分析時采用以下方法進行調整:

式中,X'ij為標準后的Xij;珔Xij為j(j=1,2,…,m)變量的均值;Xij為第i個樣本的j變量;Sj為j變量的標準差;n為樣本數目;m為變量數目。
相關分析給出了各指標之間所存在的聯系,但由于其只滿足自反性和對稱性,而不一定滿足傳遞性,因此在相關的基礎上還需對指標進行聚類分析。
在分析時需要輸入的是12個變量的相關系數,其系統聚類結果見圖1,模糊C均值聚類結果見表3和表4。

圖1 基礎指標的聚類圖Fig.1 The clustering chart of basic indicators

表3 基礎指標模糊C均值聚類分析類中心坐標Table 3 The center coordinates for fuzzy C means clustering analysis of the basic index
圖1表述的變量系統聚類過程很清楚,指標從各自成類到最后聚集到一類,而表4說明各指標分別聚集到某一類的隸屬模大小,某指標在某一類別的隸屬模最大,該指標就屬于那一類,例如,含水量屬于第1、2、3 類的隸屬模分別為0.50、0.23、0.27,則含水量屬于第1類,以此類推,從而可得到其屬類見表5。

表4 基礎指標模糊C均值聚類分析隸屬模矩陣Table 4 The membership matrix for fuzzy C means clustering analysis of the basic index

表5 基礎指標模糊C均值聚類分析結果Table 5 The result of fuzzy C means clustering analysis of the basic index
為了減少試驗,使分析指標簡單明了,可在每類指標中選擇一個指標作為代表指標,本研究利用(5)式[4]計算每一個指標與同類指標相關系數平均值中最大的作為代表指標,計算結果見表6。


表6 各類指標相關系數平方的平均值Table 6 The average value of correlation coefficient square of all indexes
從表6可以看出,在第1類指標中孔隙比的 值最大,因此孔隙比作為第1類的代表參數,同理,濕密度為第2類代表參數,滲透系數為第3類代表參數,也就是說尾礦的物理性質主要由尾礦的孔隙比、濕密度和滲透系數3個參數決定。
(1)通過對尾礦物理性質參數分析,選擇了孔隙比、濕密度、滲透系數等12個指標作為尾礦物理性質參數相關分析的基礎指標,相關分析表明,基礎指標可分為3個相關類別。
(2)在相關的基礎上,通過聚類分析,也可將基礎指標分為3類,即:第1類:孔隙比、含水量、壓縮系數;第2類:壓縮模量、土粒比重、干密度、濕密度;第3類:固結系數、滲透系數、不均勻系數、限制粒徑、有限粒徑。
(3)通過同類指標相關系數平均值分析,得出了決定尾礦物理性質的指標主要是尾礦的孔隙比、濕密度和滲透系數3個參數。
[1] 張 默,等.某鐵尾礦土工織物復合體的真三軸數值試驗[J].金屬礦山,2012(11):132-134.Zhang Mo,et al.True triaxial numerical experiment of tailing geotextile compound in an iron mine[J].Metal Mine,2012(11):132-134.
[2] 沃廷樞.尾礦庫手冊[M].北京:冶金工業出版社,2013.Wo Tingshu.Tailings Handbook[M].Beijing:Metallurgical Industry Press,2013.
[3] 浙江大學.概率論與數理統計[M].北京:高等教育出版社,2002.Zhejiang University.Probability Theory and Mathematical Statistics[M].Beijing:Higher Education Press,2002.
[4] John A Rice .Mathematical Statistics and Data Analysis[M].Belmont,California:Duxbury Press,2007.
[5] 胡良平.SAS統計分析教程[M].北京:電子工業出版社,2010.Hu Liangping.Statistical Analysis of SAS Tutorial[M].Beijing:E-lectronics Industry Publishing House,2010.
[6] 何正風.MATLAB概率與數理統計分析[M].北京:機械工業出版社,2012.He Zhengfeng.MATLAB Probability and Mathematical Statistics[M].Beijing:Mechanical Industry Press,2012.