999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據驅動的超導臨界溫度預測方法研究

2019-10-15 02:21:53李韜偉王龍趙宸立
軟件導刊 2019年8期

李韜偉 王龍 趙宸立

摘 要:超導體具有零電阻特性、完全抗磁性、通量量子化等優點,但受限于物理實驗環境與材料自身特性,其臨界溫度測試一直是超導實驗中的難點。對公開超導數據集進行研究分析,以期發現其臨界溫度與物理特性及化學元素組成之間的關系,進而構建能夠輔助預測超導體臨界溫度的模型,降低實測獲得臨界溫度的難度。結合數據挖掘領域的相關性分析與多元線性回歸分析等理論,分別基于超導臨界溫度實驗的物理屬性數據及元素構成數據構建預測模型,為通過數據驅動實驗獲取其它超導體臨界溫度提供了有益嘗試。通過對兩個模型進行對比,結果表明,基于元素的預測模型效果略優于基于屬性的預測模型。

關鍵詞:超導體數據集;數據驅動;相關性分析;多元線性擬合

DOI:10. 11907/rjdk. 182872 開放科學(資源服務)標識碼(OSID):

中圖分類號:TP301 文獻標識碼:A 文章編號:1672-7800(2019)008-0029-04

A Data-driven Research on Critical Temperature Prediction of Superconductors

LI Tao-wei1, WANG Long1, ZHAO Chen-li2

(1. National University of Defense Technology,Wuhan 450001,China;2. Unity of 32023 of PLA,Dalian 116000,China)

Abstract: The superconductor has the advantages of zero resistance, complete diamagnetism, flux quantization and the like. Because of the critical temperature test and the material's own characteristics, its critical temperature test has always been a difficult point in superconducting experiments. In this paper, we study and analyze the open superconductor dataset in CUI, and try to find the relationship between its critical temperature and its physical properties and chemical element composition. Then we can construct a model that can help predict the critical temperature of superconductors. Combining the correlation analysis and multiple linear regression analysis theory in the field of data mining, this paper separately predicts the model based on attribute data and element data, and provides a useful attempt for data-driven experiments to obtain the TC of superconductors. The results show that element-based model effect is better than the that of attribute-based model.

Key Words: superconductor data dataset; data-driven; correlation analysis; multiple linear regression analysis

基金項目:教育部聯合基金項目(6141A02011607)

作者簡介:李韜偉(1990-),男,國防科技大學信息通信學院助教,研究方向為數據挖掘、數據分析、虛擬現實。

0 引言

超導體(Superconductor)是指一種電阻在某一溫度下為零的導體,具有零電阻特性、完全抗磁性、通量量子化的特點。超導體的零電阻特性與外界環境的磁場及溫度緊密相關,很容易受到溫度場和磁場變化影響而被破壞;完全抗磁性則與材料本身屬性相關,是指在磁場中磁力線無法穿過導體的現象;通量量子化則是當兩個超導體之間的絕緣層薄至原子尺寸時,電子對可以穿過絕緣層產生隧道電流的現象。

超導體臨界溫度測量一直以來都是超導實驗中的難點[1]。游彪等[2]通過測量加熱過程中超導體電阻變化記錄其臨界溫度,需要考慮樣品與銅底座接觸率、恒溫器熱平衡狀態等,難度較大;趙林等[3]從不同體系鐵基超導體電子結構的角分辨率電子能譜角度,提出鐵基超導新理論,為解決高溫超導機理問題提供了依據;殷培環[4]研究了鋇元素摻雜用Pb對Bi位替代得到的超導體臨界溫度變化;吳平[5]也利用電阻—溫度特性測量釔鋇銅氧超導材料的臨界溫度。通過常用物理手段測量超導溫度,對精密測量儀器、實驗員經驗及實驗環境等要求非常嚴格,往往需要耗費大量人力、物力才能獲取近似測量值。

近年來,隨著大數據、人工智能等數據技術的發展,基于數據驅動的方法越來越廣泛地被應用于各個領域。楊麗潔[6]利用衛星采集數據與模擬水文及氣候,成功實現了洪水預報;聶虹等[7]通過分析地質、物探、化探、遙感等數據,構建礦產預測模型。數據驅動方法的特點為:①建模方法具有一般通用流程;②模型固定效果好,模型主要集中于幾個常用類別,如VM[8]、決策樹[9]、深度學習[10]等,適用于絕大多數應用場合;③數據預處理過程簡單,相比于傳統方法,需要領域專家介入的環節較少。

本文擬采用數據驅動方法,在已知數據集的前提下,抽取數據集屬性特征,通過機器學習方法訓練相應模型,得到一種基于數據的超導體臨界溫度預測方法,進而通過超導化合物的化學元素即能給出相應超導體臨界溫度。

1 數據集

2018年10月12日,UCI[11]數據庫更新了一份超導數據集。UCI數據庫是加州大學歐文分校(University of CaliforniaIrvine)提出的用于機器學習的數據庫,該數據庫的數據集一直在不斷增加。該機構是比較權威的數據發布機構,表1列出了常用數據集。

表1 UCI常用數據集

UCI提供的超導數據集(Superconductor Data Dataset)中詳細記錄了已知21 263種超導體的臨界溫度,其中train.csv列舉了從21 263種超導體中提取的81個特征及臨界溫度;unique_m.csv列出21 263種超導體的化學式及其臨界溫度,主要列出了每種超導體中包含的86種化學元素及摩爾質量。例如第一種超導體Ba0.2La1.8Cu1O4中包含4種化學元素,其摩爾質量分別為Ba 0.2、La 1.8、Cu 1、O 4。

將數據分成兩類,一類作為訓練集,用于學習預測超導體臨界溫度的模型參數,占數據量的70%,剩下的30%作為測試集,用于檢測模型效果。

2 超導數據集分析

目前對超導體臨界溫度的研究有針對其特有元素類型進行的相關測試研究,如對鐵系超導體技術的研究,還有針對元素組成的測試研究[3-5,13,14],以及針對η-配對超導體臨界溫度的研究等[15]。本文通過對數據集中超導體化學元素的分析,旨在找到其臨界溫度與化學式元素的關系,以此預測超導體臨界溫度。

2.1 超導體屬性數據分析

超導體特性中,除元素數量外,其它幾個特性相互之間影響較大,需要先進行相關性分析與主成分分析[16]。利用R語言分析屬性數據中每個特性下10個屬性的相關度,如圖1所示。

圖1 超導體每個特性屬性間相關性

如圖1所示,每種特性中,前4個屬性(mean, wtd_mean, gmean, wtd_gmean)相關性較高,5、6兩個屬性(entropy,wtd_entropy)相關性較高,最后兩個屬性(std_rang,wtd_std_rang)相關性較高。據此確定特性選擇方案,在每個特性中選擇mean、entropy和std_rang 3個屬性作為特征。

對特性數據集進行處理后,利用R語言采用多元線性回歸方式建立學習模型, 多元線性回歸相關理論可參考文獻[17-23],最后得到各元素回歸系數如表2所示。

表2中回歸系數代表超導體中該屬性大小對臨界溫度的作用,大于0表示起正向作用,屬性值越大,超導體臨界溫度越高;小于 0表示起負向作用,屬性值越大,超導體臨界溫度越低。

表2 基于屬性數據的多元線性模型回歸系數

將該模型與屬性數據測試集中結果進行對比,對比結果如表3、表4所示。

表3 屬性數據模型預測結果(部分)

表4 屬性數據模型測試結果統計

[溫度相差范圍\&超導體數量\&10華氏度以內\&2 380\&20華氏度以內\&1 768\&30華氏度以內\&751\&40華氏度以內\&283\&50華氏度以上\&130\&]

對于測試集中的6 379種超導體,對其臨界溫度預測效果較好(誤差在10華氏度以內)的只有2 380種,占比為37.3%,還需要對算法作進一步改進。

2.2 超導體元素數據分析

由化學元素組成的化合物,在穩定形態下各元素都有固定化學鍵,取正價的元素鍵之和必須等于取負價的元素鍵之和。因此,分析各元素之間的相關性是十分必要的。對數據集中86個元素組成化合物的相關性進行分析,結果如圖2所示。

圖2 元素相關性分析結果

由圖2可知,每個元素除與自身有強關聯性外,與其它元素的相關性不高。具體而言,相關系數高于0.5的元素對有7組,如表5所示。

表5 高相關性元素對

86種元素中,涉及元素相關性較高(大于0.5)的只有7對14種元素,而數據集的21 263種超導體材料中,除氧O和銅Cu等常見元素外,其它高相關性的超導體只有? ? ?3 189種,占總數量的15%。高相關性(大于0.8)元素對只有鐵元素Fe與砷元素As,同時包含鐵砷的化合物有1 374種,占比為6.5%。關于鐵砷元素的超導體研究方法可參考陳寧、劉洋等[13]的研究內容。

針對高關聯性元素占比較少的特點,對元素數據集同樣采用多元線性回歸方式建立學習模型,得到各元素回歸系數如表6所示。

表6中元素項對應的回歸系數代表超導體中該元素含量對臨界溫度的作用,大于0表示起正向作用,含有該元素越多,超導體臨界溫度越高;小于 0表示起負向作用,含有該元素越少,超導體臨界溫度越低;等于0表示不起作用,共有10種元素的回歸系數為0,分別是稀有氣體惰性元素氦He、氖Ne、氬Ar、氪Kr、氙Xe、氡Rn,以及稀土元素钷Pm,稀有元素釙Po和砹At,數據集中的超導體都不包含這些元素。例如,第3種化合物為Ba0.1La1.9 Cu1O4,臨界溫度為19,利用該模型預測的臨界溫度計算方式為:

[14.481 92+0.1×23.973 66+1.9×(-0.087 78)+1×0.463 187+4×(-0.362 83)=15.72]

預測結果與真實臨界溫度相差不超過4華氏度。

表6 基于元素數據的多元線性模型回歸系數

將該模型與測試集中數據進行對比,對比結果如表7、表8所示。

表7 元素數據模型預測結果(部分)

表8 元素數據模型測試結果統計

[溫度相差范圍\&超導體數量\&10華氏度以內\&2 632\&20華氏度以內\&1 926\&30華氏度以內\&1 006\&40華氏度以內\&473\&50華氏度以上\&274\&]

對于測試集中的6 379種超導體,對臨界溫度預測較準確(誤差在10華氏度以內)的只有2 632種,占比為41.3%,差距超過100華氏度的有14種。雖然結果相比屬性數據模型略優,但該模型仍需要作進一步改進。

3 結語

本文以超導體數據集為基礎研究影響其臨界溫度的屬性及元素組成,為條件嚴苛的物理實驗提供了數據驅動的分析視角。實驗結果表明,基于元素的模型預測結果略優于基于屬性的元素模型預測結果。在后續研究中將嘗試根據屬性取值與元素質量分段建立模型,研究相關性較強的部分超導體的特殊性,并分析臨界溫度與實測臨界溫度差距超過100華氏度的具體原因。

參考文獻:

[1] 胡殿才,段旭如,夏元良. 超導體臨界溫度的測量[J].大連理工大學學報,1988(3):113-116.

[2] 游彪,吳衛國,吳小山. 綜合研究性實驗試題:高溫超導體特性測量綜合實驗[J]. 物理實驗, 2018, 38(10):36-39.

[3] 趙林,劉國東,周興江. 鐵基高溫超導體電子結構的角分辨光電子能譜研究[J]. 物理學報,2018,67(20):246-271.

[4] 殷培環. Ba位摻雜對BaPb_(0.77)Bi_(0.23)O_(3-δ)超導電性的影響[D]. 南京:南京大學,2018.

[5] 吳平. 高T_c超導材料YBCO臨界溫度測量方法[J]. 大學物理實驗,2006(3):5-7.

[6] 楊麗潔. 數據驅動模型在洪水預報中的應用及其發展趨勢[J]. 電腦知識與技術,2018,14(17):275-277.

[7] 聶虹,朱月琴,常力恒,等. 數據驅動下的礦產預測模型構建方法研究[J]. 中國礦業,2018,27(9):82-87.

[8] CORTES C,VAPNIK V. Support-vector networks[J]. Machine Learning, 1995, 20(3):273-297.

[9] QUINLAN J R. Induction of decision trees[J]. Machine Learning, 1986 (1):81-106.

[10] HINTON G. A practical guide to training restricted Boltzmann machines[J]. Momentum, 2010, 9(1):926-947.

[11] UCI Machine Learning Repository. UCI數據集[EB/OL]. http://archive.ics.uci.edu/ml/index.php.

[12] 師瑞華. BP神經網絡在糧倉平均溫度預測中的應用[J]. 軟件導刊,2015,14 (8): 42-44.

[13] 陳寧,劉洋,賈亞魁,等. FeAs超導體臨界溫度的鍵長和半徑效應[J]. 中國科學,2009(9): 1295-1299.

[14] HAMIDIEH K. A data-driven statistical model for predicting the critical temperature of a superconductor[J]. Computational Materials Science, 2018, 154:346-354.

[15] 王志君,邱孝明,肖業高. η-配對超導體的臨界溫度[J].低溫物理學報, 1994(6):462-467.

[16] 趙薔.主成分分析方法綜述[J].軟件工程,2016,19(6):1-3.

[17] 紀欽洪,孫洋洲,于航,等. 基于多元線性回歸的碳配額價格預測模型研究[J].現代化工,2018,38(4):220-224.

[18] 陳崇雙,唐家銀,何平. 方差分析法的線性回歸建模重構[J]. 統計與決策,2018(7):71-75.

[19] 李金海. 多元回歸分析在預測中的應用[J]. 河北工業大學學報, 1996(3):57-61.

[20] 郭會利. 多元回歸分析的逐步回歸預測模型[J]. 考試周刊, 2009(26):92-93.

[21] 王惠文,孟潔. 多元線性回歸的預測建模方法[J]. 北京航空航天大學學報, 2007, 33(4):500-504.

[22] 胡澤文,武夷山. 科技產出影響因素分析與預測研究——基于多元回歸和BP神經網絡的途徑[J]. 科學學研究,2012,30(7):992-1004.

[23] 張洪祥,毛志忠. 基于提取綜合特征因素的投影尋蹤多元線性回歸分析[J]. 統計與決策,2010(24):31-34.

(責任編輯:黃 健)

主站蜘蛛池模板: 久久午夜夜伦鲁鲁片不卡| 少妇精品在线| 91 九色视频丝袜| 国产精品白浆在线播放| 欧美69视频在线| 亚洲国产综合精品一区| 97青草最新免费精品视频| 国产在线精品美女观看| 四虎综合网| 亚洲第一极品精品无码| 高h视频在线| 亚洲国产精品人久久电影| 波多野结衣二区| 亚洲va在线观看| 亚洲免费毛片| 亚洲天堂.com| 欧美国产三级| 国产福利一区二区在线观看| 视频一区视频二区中文精品| 亚洲最大福利网站| 亚洲综合狠狠| 91精品小视频| 啪啪啪亚洲无码| 美女裸体18禁网站| 色香蕉网站| a免费毛片在线播放| 国产免费黄| 久热精品免费| 亚洲欧洲日韩久久狠狠爱 | 国产精品一区二区在线播放| 手机在线看片不卡中文字幕| 极品尤物av美乳在线观看| 青青草原偷拍视频| 欧美在线伊人| 91久久国产热精品免费| 夜夜高潮夜夜爽国产伦精品| 国产一级毛片在线| 一级看片免费视频| 亚洲日韩久久综合中文字幕| 成年人视频一区二区| 日韩AV手机在线观看蜜芽| 欧美爱爱网| 亚洲精品大秀视频| 免费亚洲成人| 久久久久青草线综合超碰| 欧美日韩福利| 亚洲最大看欧美片网站地址| 中文天堂在线视频| 国产日韩精品一区在线不卡| 九九免费观看全部免费视频| 国产特级毛片| 三区在线视频| 亚洲一级毛片在线观播放| 国产无人区一区二区三区| 国产自产视频一区二区三区| 欧美成人A视频| 亚洲品质国产精品无码| 天天操天天噜| 国产老女人精品免费视频| 韩国自拍偷自拍亚洲精品| 波多野结衣中文字幕久久| 日韩福利在线观看| 免费 国产 无码久久久| 麻豆精品在线| 韩日免费小视频| 国产精品入口麻豆| 欧洲精品视频在线观看| 国产成人一区在线播放| 国产成人无码Av在线播放无广告| 特级精品毛片免费观看| 热99精品视频| 9丨情侣偷在线精品国产| 国内自拍久第一页| 2021国产精品自拍| 玖玖免费视频在线观看| 又黄又湿又爽的视频| 中文字幕中文字字幕码一二区| 一区二区三区在线不卡免费| 国内精品久久久久久久久久影视| 日韩精品无码免费一区二区三区 | 国产亚洲精品91| 无码久看视频|