










【摘" 要】 文章主要通過研究玻璃含有的不同化學成分,分析和鑒別古代的玻璃制品。首先分析了現有玻璃文物的數據,利用Spearman’s rank correlation coefficient和卡方檢驗表面分化、紋飾、顏色和玻璃類型之間的聯系,采用Logistic回歸鑒別未知文物,分析其所屬的類型,并分析了分類結果的靈敏度。通過分析可知,文章采用的分類方法,能較好地通過化學成分對玻璃進行分類。
【關鍵詞】 Spearman’s rank correlation coefficient;卡方檢驗;Logistic回歸
絲綢之路是古代亞歐互通有無的商貿大道。我國古代的玻璃雖然與西方的玻璃外觀類似,但其化學組成卻不盡相同,根據添加的不同助熔劑,人們將玻璃分為鉛鋇玻璃和鉀玻璃。我國古代的玻璃容易在溫度、濕度較高和不通風的環境下風化,文章就此對玻璃文物的成分進行了分析和分類。
一、問題分析
(一)模型假設
1. 本研究在分析時,使用的數據真實、可信;2. 玻璃未與外界發生化學反應,僅涉及風化、元素的交換;3. 玻璃成分在一定時間內不會發生改變;4. 獨立抽取采樣數據,具有統計學意義;5. 玻璃化學成分未有人為的故意改變;6. 假設各組成部分數據的讀取設備是同一臺。
(二)問題分析一
本文將玻璃文物的4個定類變量基本信息轉化為定量變量,使用MATLAB計算出4個指標之間的相關系數和每個相關系數的P值,然后進行假設檢驗。通過卡方檢驗,分析變量之間的差異性。
為了驗證不同類型的玻璃是否在風化條件下,本文對其化學成分進行了描述性統計;通過畫圖,直觀地展示了不同類型玻璃各個指標的平均值,分析玻璃的含量規律。
比較兩組數據化學成分的均值變化率,將各化學成分含量與變化率進行對比,預測出風化前的玻璃化學成分含量。
(三)問題分析二
基于表單數據,找出是否風化和各項化學成分含量之間的關系,確定玻璃種類后,再次建立Logistic回歸方程,結合亞分類細則對已知的種類玻璃進行亞分。
二、定類元素的相關性
(一)數據的預處理
數據主要以定性數據(紋飾、類型、顏色和表面是否風化)為主,為方便后續數據的處理,將各項指標進行編碼。如果部分顏色數據缺失,統一用數字0代入;如果數據未給出化學成分比例,空白區域為未檢測到該成分的區域,統一用0錄入。將各項成分累積的占比控制在85%—105%這一區間,視作本文分析解答的有效數據;而未在該區間的數據,已被刪去。
分析表面是否風化與已知的玻璃類型、紋飾和顏色間的關系,以及分析涉及的定類因素,使用Spearman’s rank correlation coefficient研究其關聯性,具有較好的準確性。
第一步,構建Mi為風化,Nij為類型、紋飾和顏色的兩組數據,其Spearman’s rank correlation coefficient等級為:
■
式中di為Mi和Nij兩組數據經過升序、排列后,賦予的位置之差。
第二步,將數據代入相關系數,進行統計、量化后,得到Spearman’s rank correlation coefficient,如表1所示。
第三步:利用MATLAB計算Spearman’s rank correlation coefficient對應的P值,如表2所示。
由表2可知,在99%的置信水平下,風化和類型的P值lt;0.01,顯著性明顯,即玻璃表面是否風化與類型存在較大的相關性;在90%的置信水平下,風化和顏色的P值lt;0.1,顯著性明顯,即風化與顏色存在一定的相關性。
(二)利用卡方檢驗法分析差異性
卡方檢驗主要用于衡量、分析兩個變量間的差異性,對此,可以比較兩個變量間的偏離程度X2,變量間的差異性與X2的大小呈現正相關,即X2越大,兩者的差異越明顯,如表3所示。
由表3可得,在90%的置信水平下,風化和紋飾的P值lt;0.1,顯著性明顯,風化與紋飾存在顯著的差異。這與前文Spearman's rank correlation coefficient(下稱SPSS)計算的對應的P值,得出的結論相符。
(三)化學成分的統計規律
通過描述性統計不同類型表單數據的風化情況,研究選取了部分具有特征性的數據,分析化學成分的統計規律。可以明顯地觀測出在含量占比上,二氧化硅在兩種類型的玻璃中,含量占比大,其余化學成分呈現遞減的趨勢。
對比后可知,在兩種類型的玻璃中,二氧化硅的含量與風化前后的含量呈相反的占比趨勢,高鉀玻璃的二氧化硅風化后含量高;鉛鋇玻璃的二氧化硅無風化的含量高。鉛鋇玻璃氧化鋇和氧化鉛的含量,無論是在風化前還是風化后,均明顯高于高鉀玻璃。
(四)預測風化前的含量
本研究根據風化前后兩組數據均值的變化率,比較化學成分均值的變化率,將各化學成分含量與變化率進行對比,預測出風化前的化學成分含量:
■
式中■和■分別為無風化和風化后的各項化學成分均值,■為第j種類型第i個化學成分的預測值。
由于數據中的部分采樣點為嚴重風化點,因此將變化率的平方代入預測方程中,以求得更加貼切真實數據的預測值。還有部分風化后玻璃的采樣點取自未風化處,因此數據即為風化前各成分的含量,無須再次進行計算,能容易得預測出風化前化學成分的含量。
三、玻璃類型的分類
(一)總分類
本文根據表單給出的是否風化和各項化學成分含量的數據,找出其中的關系,推測出未分類的各項玻璃的所屬種類,建立了一個Logistic回歸方程模型:
■
式中β為回歸系數,xj為對應的化學成分,使用SPSS對數據進行了多元回歸計算。
玻璃分類表如表4所示。表4表明:在49個鉛鋇樣本中,SPSS預測出49個鉛鋇,正確率為100%;在18個鉛鋇樣本中,SPSS預測出18個,正確率為100%,可見,此回歸模型的準確率高。
計算得到回歸系數,如表5所示。
在90%的置信水平下,風化、氧化鈉、氧化鉀、氧化鋁、氧化鉛和氧化鋇的P值lt;0.1,顯著性明顯,即,在回歸方程中,采用這6個指標進行擬合預測。
將所得的系數帶入式(3),得到完整的回歸方程:
■
(4)
代入數據后,通過計算分析,得到結果,如表6所示。
在表6中,根據前文數據的預處理,定義1為高鉀玻璃、0為鉛鋇玻璃,以0.5劃分兩者的種類。可以將A1、A6、A7和A8鑒別為高鉀玻璃,A2、A3、A4和A5鑒別為鉛鋇玻璃。
(二)亞分類
根據上文提到的處理方法,以高鉀玻璃為例,繼續對高鉀玻璃進行亞分類。通過SPSS計算,得到高鉀玻璃的亞分類系數,如表7所示。從而得到高鉀玻璃的亞分類回歸方程(3),代入的數據,如表8所示。
根據問題二的亞分類細則,4個高鉀玻璃又可以分為3類,即A1、A6和A7、A8。
(三)靈敏度分析
本研究通過隨機選取一個玻璃中的指標,在一定范圍內改變指標的大小,觀察其輸出值是否超過了分類的界限。
1. 玻璃大類分析
本文選擇了A3的氧化鉛指標,在0%~50%內改變了指標的大小,用MATLAB輸出了結果大小,可以看出,當指標減少量小于30%時,輸出的結果較穩定,保持在0左右;當指標減少量大于35%后,輸出的結果發生改變,并在減少到40%之后趨于穩定,成為另一種玻璃。可見,此Logistic回歸模型對分類結果具有較高的敏感性。
2. 亞類劃分分析
通過大類劃分相同的過程,本研究隨機選擇了A7的二氧化硅這一指標在±20%的范圍內的大小變化,同樣用MATLAB輸出結果。在+2%和-3.7%的范圍內,分類結果具有一定的穩定性,在超出這一范圍后,高價玻璃的亞分類種類將發生變化,可見,亞分類Logistic回歸具有一定的準確性。
(四)模型的評價、改進與推廣
1. 模型的優點
(1)Logistic回歸的結果便于理解和解釋。
(2)模型簡單,算法直觀,編程容易實現。
2. 模型的缺點
(1)受題中數據的約束,有小部分因素未能考慮。
(2)特征提取過多,有些變量互相有相關性。
3. 模型的改進
該模型是在對某些復雜問題簡單化的基礎上建立的,是一種理想狀態,對模型的進一步改進,可以從以下幾個方面考慮:
第一,在預測玻璃風化前的化學成分時,需要注意玻璃在不同環境中受濕度和溫度的影響;第二,在風化的過程中,發生的化學方程式是否特殊,能否刪除一些不重要的指標,直接利用影響因子較大的指標進行分析和成分判別。
參考文獻:
[1] 陳姝聿,侯志力. 淺析古代絲綢之路和中國古代玻璃[J]. 中國民族博覽,2019(05):87-88.
[2] 朱亞濤,陳方,李高華,等. 基于多學科參數化建模和靈敏度分析的飛行器分級優化設計方法[J]. 宇航學報,2011,32(04):721-726.
[3] 陳文佳,余至成,王婧. 基于邏輯回歸方法的日出氣象預報模式研究——以霞浦縣花竹村為例[J]. 海峽科學,2022(08):43-47.