嚴利偉,王昌南,唐高林,劉琪
?
多元線性回歸計算礦石體重方法的優(yōu)化——以某銅鋅礦為例
嚴利偉,王昌南,唐高林,劉琪
(四川金伯利地質(zhì)勘查有限公司,成都 610091)
本文提出多元線性回歸計算礦石體重的優(yōu)化方法,并以某銅鋅礦為例,采用優(yōu)化方法計算出體重值與礦石品位之間的方程關系。結果表明,銅鋅礦的礦石體重與銅(Cu)、硫(Sp)品位之間線性關系明顯,線性方程的擬合效果極好。預測體重與實際體重之間平均誤差<5%,可以直接利用于實際生產(chǎn)。
礦石體重;礦石品位;多元線性回歸;優(yōu)化
礦石體重是礦床勘查開發(fā)過程的一項重要參數(shù),獲得準確的體重估值是礦床資源量估算的前提條件。傳統(tǒng)上礦石體重值是通過小樣本抽樣求算術平均值或者根據(jù)體積或重量進行加權平均求得。但受樣本大小局限,并且由于取樣方式的隨機性,求得的礦石體重往往與理想的礦石體重存在較大偏差。近年來,許多學者嘗試建立小體重與礦石品位之間的線性方程,直接通過礦石品位推算礦石體重值,取得了一定的效果,但實際操作中存在以下問題:①沒有排除不同元素品位之間可能存在的自相關性;②默認礦石體重和品位之間直接線性相關,沒有建立模型加以驗證;③對線性方程的擬合優(yōu)度以及自變量顯著性缺乏統(tǒng)一的評判標準。以上問題直接影響線性方程式的準確建立,從而影響估值結果的準確性。為此,本文以川西南某銅鋅硫化物礦床為例,重點結合上述三個問題,對多元線性回歸計算礦石體重的方法進行優(yōu)化。
1.1 元素品位之間自相關性的排除
由于礦石中礦物組合的多樣性,元素品位之間往往并非相互獨立不相關聯(lián)。例如,當兩種元素出現(xiàn)在同一種礦物中時,元素品位實際呈現(xiàn)出固定比例的關系。同時采用這兩種元素品位參與回歸,相當于重復引入自變量。當一種元素同時賦存于多種礦物中的時候,其品位實際可以通過這些礦物中其他元素進行計算得出,相當于這種元素品位與其他元素品位值之間存在已知的線性關系。線性回歸模型中的自變量之間存在的精確相關關系或高度相關關系會使模型估計失真或難以估計準確。但由于礦石中礦物類型以及成礦元素的賦存狀態(tài)往往是已知的,我們可以依據(jù)上述信息對自變量進行預篩選及預處理,確定或者分離出與體重相關且不存在已知自相關性的自變量,從而排除這種自相關性對線性方程擬合的影響。
1.2礦石體重與元素品位的線性關系的建立
礦石體重與元素品位之間的具體關系需要建立相對理想的模型來確定。馮適安[1]通過鉛鋅礦的理想模型構建了鉛鋅礦中鉛、鋅品位與礦石體重之間的方程式。在假定所有成礦元素均賦存于不同礦物中的前提下,這種方法可以推廣應用到其他多金屬礦床。方法如下:
假設脈石礦物比重為常數(shù)0,為礦石量,為礦石體積,vvv為各礦石礦物體積,ddd為各礦石礦物比重則有:

設ccc為各元素在所賦存的礦石礦物內(nèi)的品位,PPP為各元素金屬量為礦石體重,,xxx為各元素在礦石中的品位,kkk為常數(shù),則有:

表1 某銅鋅礦品位及小體重值
根據(jù)理論模型的推算表明,礦石體重的倒數(shù)與元素品位之間可能存在顯著的相關關系。因此采用體重倒數(shù),而不只是體重值作為因變量,可以獲得更為準確的擬合方程。
1.3 線性方程擬合效果的分析方法
前人一般都是采用復相關系數(shù)R或者R2或來評判多元線性方程的擬合效果[2-3],R的絕對值越接近于1,說明擬合效果越好。為了驗證因變量與自變量總體存在線性關系,擬合方程還必須通過顯著性檢驗(F檢驗)。由于礦石體重值會直接應用于儲量計算,因此在統(tǒng)計參數(shù)的評判之外還必須要考慮實際的應用效果。一般而言,體重值的誤差遠小于儲量值的誤差時才有較好的應用價值。結合生產(chǎn)實際情況,我們推薦預測體重與實際體重的平均誤差應當控制在10%以內(nèi)。
復相關系數(shù)只是對于模型擬合優(yōu)度的考量,并非說明各個自變量對因變量的影響顯著。在回歸分析中,不僅要模型的擬合度高,還要得到總體回歸系數(shù)的可靠估計量[4]。基于前述的模型,在礦石品位值較高的情況下,一般都可以認為其對體重值的影響較大,可以先作為自變量參與回歸。少數(shù)元素品位較低,對體重影響較小,可以采用變量顯著性檢驗(t檢驗)加以排除。這樣可以確保包括所有可能影響體重的因素,同時排除了無關信息的干擾。

表2 Cu、Sp、Zn三個自變量多元線性回歸統(tǒng)計量
某銅鋅礦圍巖地層為古元古界里伍巖群,圍巖巖性以石英巖、蝕變二云片巖為主。礦體呈似層狀大致平行于片理產(chǎn)出,礦石礦物以黃銅礦、磁黃鐵礦、閃鋅礦為主,次為方鉛礦、黃鐵礦等,含量較少。脈石礦物主要為石英、黑云母、絹云母、綠泥石等。礦石多為浸染狀、條帶狀、網(wǎng)團狀構造,少量為塊狀構造。29塊樣品測定的體重值2.66~3.69(g/cm3),礦石品位分析主要成礦元素Cu、Zn、S三項,其中S品位0.45%~26.7%,Cu品位0.1%~9.43%,Zn品位0.02%~1.8%(表1)。樣品均為致密塊狀巖石、孔隙度與濕度對體重影響較小,可不作考慮。
由于礦石中的成礦礦物主要為磁黃鐵礦(Fe1-xS, x=0-0.17)、黃銅礦(CuFeS2)、閃鋅礦(ZnS),其中Cu和Zn分別只賦存于黃銅礦和閃鋅礦中,S同時賦存于三種礦物之中,與Cu、Zn均有一定相關性,因此需要在S品位中除去黃銅礦和閃鋅礦中的S含量,以磁黃鐵礦中的S(以S表示)作為一個自變量引入。

表3 Cu、Sp兩個自變量多元線性回歸統(tǒng)計量
本次多元線性回歸采用EXCEL軟件中加載的回歸分析工具進行,以Cu、S、Zn三個自變量對體重倒數(shù)進行回歸,得到以下統(tǒng)計結果:
由于回歸統(tǒng)計值中復相關系數(shù)R值和R2分別為0.97和0.94,均接近于1,給定顯著性水平0.05,F(xiàn)值>F0.025(3,24)=2.33,說明方程線性擬合的效果非常好。設計原假設H0:bi=0(i=1,2…k)與備擇假設:H1:bi10,給定顯著性水平a=0.05,查得相應臨界值:t0.025(24)=2.064。包括常數(shù)項在內(nèi)的3個自變量(截距、Cu、S)標準誤差較小,且都在95%的水平下顯著,都通過了變量顯著性檢驗。Zn品位值的標準誤差較大,且由于| t |< t0.025(24),接受原假設H0。因此我們認為Zn的品位值與體重之間沒有關聯(lián),轉而采用Cu、S兩個自變量進行回歸,回歸結果見表3。

表4 預測體重與真實體重誤差
給定顯著性水平a=0.05,F(xiàn)>F0.025(2,25)=2.53,表明方程總體線性顯著。包括常數(shù)項在內(nèi)的3個自變量都通過了顯著性檢驗。據(jù)上述參數(shù),設y為體重值,擬合的方程為:y=1/(0.370594-0.00495Cu-0.00406S)。以0.00495Cu+0.00406S為x,體重倒數(shù)為y’,進行坐標投影(圖1)。結果表明(表4),體重倒數(shù)與品位值呈現(xiàn)明顯線性趨勢。經(jīng)統(tǒng)計,通過回歸方程計算的預測體重與真實體重的誤差大部分在8%以下,平均誤差僅有4.61%,因此可以認為回歸方程有較好的預測效果,可以直接用于儲量計算中。

圖1 體重倒數(shù)與品位之間線性關系
3.1回歸分析的質(zhì)量
本文采用的回歸實例采用有限數(shù)據(jù)就獲得了比較好的回歸結果,主要是因為本例中礦石組成與理想的礦石模型比較接近。具體表現(xiàn)為礦石礦物種類較少,對體重影響較大,且脈石成分、比重比較穩(wěn)定。在實際生產(chǎn)應用中可能會出現(xiàn)一些問題。例如對于某些比如低品位礦或者稀有金屬礦,其元素品位與體重之間可能不存在相關性,回歸方法可能并不適用?;蛘邔w重影響較大的是一些非成礦元素,僅利用成礦元素品位,回歸效果往往不佳。因此在應用之前需要對其可行性有基本的判斷,同時通過增加樣本數(shù)、優(yōu)選自變量的方法提高回歸方程的質(zhì)量。
3.2 應用前景
礦石體重的多元線性回歸方程實際上提供了采用品位值來預測體重值的最佳方法,在實際生產(chǎn)中的應用十分廣泛。例如,通過回歸方程計算體重與平均方法求得的礦石體重對比,可以及時發(fā)現(xiàn)小體重取樣中存在的偏差。在儲量計算方面,可以根據(jù)塊段內(nèi)礦石平均品位為各塊段分別計算體重。同樣,在基于礦體三維模型的儲量計算中,也可以引入多元線性方程分別為礦塊進行體重賦值。以上方法相當于對礦體不同部位的體重值進行量化賦值,更符合礦體的自然特征,可以極大提高儲量計算的精度。
[1] 馮適安.1983.多金屬礦床中礦石體重與金屬品位的關系[J].湖南地質(zhì),2(2):58-61.
[2] 張景平,李社.2001. 基于SPSS的礦石小體重與品位的多元回歸分析模型的構建[J].華東理工大學學報(自然科學版),34(1):62-66.
[3] 林喜.礦石體重的多元線性回歸分析及其檢驗[J].福建地質(zhì),2009,29:157-163.
[4] 劉曉石,陳鴻建,何臘梅,等.概率論與數(shù)理統(tǒng)計(第二版) [M].北京:科學出版社,2005.
Optimization of Multiple Linear Regression Analysis of Ore Density — By the Example of a Cu-Zn Deposit
YAN Li-wei WANG Chang-nan TANG Gao-lin LIU Qi
(Sichuan Jinboli Geological Exploration Co., Ltd., Chengdu 610091)
This article puts forward an optimized method of calculating ore density by use of multivariate linear regression and by the example of a Cu-Zn deposit. The results show that ore density value has a clear linear relationship to the grades of copper(Cu) and sulfur(S). The average error between the predicted density and the measured density is less than 5%. Such method can be well adapted to production.
ore density; ore grade; multivariate linear regression
P628+.1;P618.41
A
1006-0995(2017)02-0331-04
10.3969/j.issn.1006-0995.2017.02.037
2016-06-26
嚴利偉(1986-),男,江蘇南通市人,碩士,從事地質(zhì)勘查工作