吳超 胡占寧



摘 要:由于實驗環境存在偏差,某些物理實驗結果無法被再次驗證,從而導致一些科研成果遭到質疑。利用區塊鏈的去中心及分布式數據存儲特點,提出一種基于區塊鏈的物理實驗追溯方案,并進行安全性與可行性分析。測試結果表明,該方案可以有效追蹤物理實驗各個環節的實驗信息來源,以此提供物理實驗復證的基礎,使物理實驗變得更加透明,從而提高科研成果的公信力。在建立信任機制后,可以減少反復驗證實驗過程帶來的資源浪費。
關鍵詞:區塊鏈;物理實驗;實驗復證;區塊鏈追溯
DOI: 10. 11907/rjdk.191553
開放科學(資源服務)標識碼(OSID):
中圖分類號:TP399
文獻標識碼:A
文章編號:1672-7800(2020)001-0238-04
0 引言
在科研實驗中,由于實驗環境存在偏差,或實驗過程不嚴謹,導致某些實驗無法重復驗證的事件時常發生。例如國內的“韓春雨事件”,由于實驗結果無法復證,實驗過程與實驗結果并不完全相符,國內外研究人員對此爭議不斷,導致《Nature》雜志撤回韓春雨團隊發表的論文…。特別是在量子測量[2]物理實驗中,由于量子態是疊加態,測量時會導致量子不確定的態塌縮到一個確定的態,如果實驗只得到一種結果,該結果則可能會引發爭議。類似“薛定諤的貓”,一次測量結果,有人會出現“死貓”的結果,也有人得到“活貓”的結果,從而引起一些爭議。區塊鏈[3]( Block-chain)是去中心、分布式數據庫,每個節點都會同步所有區塊信息,讓信息變得公開透明。因此,將區塊鏈技術應用于科研實驗中,可能給實驗復證提供新的思路。科研人員可以先對機密數據保密,將實驗的每個環節步驟與每一階段成果信息記錄在區塊鏈上,并且不能篡改,使實驗變得公開透明,并能完整展示整個實驗過程。
區塊鏈從之前的1.0時代(比特幣)發展到現在的3.0時代[4],區塊鏈技術應用從之前的數字金融領域拓展到了醫療[5-6]、物流[7]、物聯網[8]、人工智能[9]、保險[10]、數字認證等領域。目前區塊鏈在供應鏈上的應用最為廣泛,例如食品安全追溯[11]、物流追溯以及醫療安全記錄溯源[12]等。全球最大的零售巨頭沃爾瑪利用區塊鏈進行豬肉溯源[13],支付寶的螞蟻區塊鏈追溯系統已應用于慈善事業中。2018年雙十一期間,天貓利用區塊鏈追溯技術實現海外商品的跨域溯源。本文提出一種基于區塊鏈的物理實驗追溯方案,對物理實驗各個環節信息進行追溯,使整個物理實驗更加透明,從而提供更好的實驗復證基礎,提高科研成果的公信力。與傳統物理實驗復證相比,本文提出的基于區塊鏈追溯的方法,可使物理實驗各個環節的信息來源更加可靠。
1 區塊鏈簡介
區塊鏈是去中心、分布式的數據存儲技術,網絡上的節點可以存儲與核實數據。第一次提出區塊鏈技術的是比特幣的發明人中本聰[14]。基于工作量證明的系統允許雙方在沒有第三方干預的前提下進行交易。區塊鏈技術是電子交易系統的核心,典型基于區塊鏈的加密貨幣有比特幣、以太幣等。
區塊鏈能提供各種應用服務架構,分布式網絡使用的安全技術有:哈希函數、數字簽名、非對稱加密等,典型技術有鏈表技術與共識機制[15]。
由于區塊鏈使用點對點(P2P)網絡,因此用戶之間的信任是一個重要問題。人們采用各種一致性算法解決信任問題,例如工作量證明(POW)、股權證明[16](POS)和實用拜占庭容錯算法[17](PBFT)。其中POW和POS應用于公有鏈中,而PBFT主要應用于私有鏈中[18]。
2 基于區塊鏈的物理實驗追溯方案
2.1 追溯方法選擇
溯源技術是指為了在科學研究中校核數據質量與追溯數據責任而產生的一種情報技術,目前主要的追蹤溯源方法有反向查詢法、標注法和工作流日志法等[19],這些方法都是數據引證的通用技術,但大部分缺乏安全性與保密性。由于區塊鏈技術本身就是加密型數據庫,因此可以很好地滿足實驗數據的保密需求,解決了研究者們擔心的數據泄漏問題。
2.2 基于區塊鏈的物理實驗追溯模型
在發表科研論文的同時,將已編號的物理實驗各階段實驗步驟和實驗成果(溯源信息)上傳到云端或集群的數據庫服務器上;經由監管部門相關專家審核通過后,再通過區塊鏈加密算法傳輸到數據區塊上,并且連接形成區塊鏈網絡,該過程是安全可靠的;接下來通過追溯技術查詢物理實驗各環節信息,包括實驗器材、實驗步驟、實驗成果等。
2.3 追溯流程
此前,具體的科研實驗環節信息只有科研方本地數據庫有記錄,某些科研實驗結果與實驗過程信息可能存在不對稱及不透明,以及偽造與修改等問題。引入區塊鏈技術后,可以實現實驗信息的去中心化,將主觀人為的信任機制變為通過算法實現的全網絡節點一致共識的信任機制,因此大大增強了科研成果的可信度。
區塊鏈技術的時間戳機制可以體現整個追溯過程的完整性。圖1為溯源流程,其中實驗信息是指實驗各環節每個階段的所有數據信息,便于監管方追究問責。
3 系統整體設計
3.1 方案設計思路
基于區塊鏈的物理實驗追溯系統總體設計思路如下:科研工作人員將實驗中各個環節信息(實驗步驟與實驗結果、保密機密數據)錄入區塊鏈追溯系統中,區塊鏈上各節點成員可以利用實驗編號,通過網絡查詢相應實驗信息,實現對實驗信息各個環節的追溯。
3.2 系統平臺
關于區塊鏈平臺選擇,現在流行的開源項目有Bitcoin、以太坊和Hyperledger,以太坊由于支持可編程的智能合約,應用較為廣泛,而且目前技術比較成熟。所以為了解決實驗數據存儲系統中的數據篡改威脅、數據真實性驗證以及結構化中心三大問題,本文選擇目前項目開源、SDK接口豐富,且技術較為成熟的區塊鏈平臺以太坊作為系統的區塊鏈平臺。
3.3 數據信息存儲結構
物理實驗存儲記錄數據包括:實驗材料、實驗流程、實驗條件以及產生的實驗結果等信息,這些信息可以圖片、視頻或文字說明等形式上傳。
物理實驗信息追溯的前提是有數據信息才能查詢,所以系統方案首先需要將物理實驗信息錄入到區塊鏈網絡中,實現對物理實驗信息的存儲。由于區塊鏈的數據存儲是單向的,是一種哈希處理,經過hash函數的運算后,無法找回原始數據,所以本文的實驗信息存儲可以分別錄入區塊鏈與傳統數據庫(如MySQL)中,以實現對實驗信息的追溯。工作人員將實驗過程中測量到的相關實驗信息打包并同時錄入到MySQL數據庫和區塊鏈中。之后將要查詢的實驗信息經過哈希處理后,與區塊鏈中返回的哈希值進行比較,以此驗證實驗信息的真實性。展示頁面利用網頁技術進行實驗信息的回顯。該過程可讓科研單位與科研資助方、出版方共同進行監管,達成共識后將區塊鏈上的數據同步到區塊鏈節點上。實驗數據存儲方案結構如圖2所示。
4 實驗模擬與分析
4.1 實驗信息存儲過程
科研工作人員通過相應算法將節點上的數據信息轉為信息摘要,然后通過各自擁有的區塊鏈節點將信息摘要發送到區塊鏈上,經過平等的共識過程,將信息摘要寫入區塊鏈的區塊上。如果信息寫入成功,系統會得到相應返回值,即區塊鏈中一條交易的返回哈希值,其是查找區塊鏈中數據的索引值,并將這條返回值存儲到MySQL數據庫中。具體存儲流程如下:首先進行以太坊區塊鏈的準備工作,安裝以太坊客服端geth,新建一個customC enesi.json文件,使用geth命令創立創始區塊;然后打開以太坊的geth客戶端,連接服務器節點,在geth控制臺輸入挖礦命令和解鎖賬號命令;工作人員將數據通過科研單位搭建的區塊鏈節點上傳,連接到以太坊客戶端geth( go-ethereum),則會自動激活RPC,RPC會默認訪問web3接口;科研單位工作人員通過建立的節點賬戶,通過挖礦命令mmer.start()獲取以太幣,再利用JavaScript調用web3中的sendTransation()方法,將sha3處理后的信息摘要以交易形式發送到區塊鏈的Block上;每條交易會返回一個hash值,將hash值存放到MySQL數據庫中,以便于溯源查詢使用。
4.2 系統總體架構設計與業務模塊功能
B/S架構[20]是目前比較主流的Web架構,使用十分方便,因此本文基于區塊鏈的物理實驗信息追溯方案即采用B/S架構。信息存儲結構采用SSM框架,且實驗過程中使用私有鏈建立網絡節點,可使實驗操作更加簡便。本文根據軟件分層的原則,將該實驗系統結構分為3層:數據層、業務邏輯層與表示層。
表示層:前端通過HTML或JSP頁面實現數據存儲、查詢、真實性驗證等數據處理工作,研究人員的實驗數據通過頁面寫入,之后出版商及科研管理方等可以從頁面讀取數據。
業務邏輯層:區塊鏈部分是利用JavaScript代碼實現的,調用web3.js實現與geth的交互,從而將數據存儲在以太坊區塊鏈上。后臺部分通過Java代碼進行數據庫連接與操作,實現交互、指定頁面跳轉、數據請求處理等功能。
數據訪問層:通過以太坊的區塊鏈與MySQL數據庫共同實現數據存儲。
4.3 系統功能及展示
以常見物理實驗(菲涅爾單縫衍射實驗)為例,實驗數據信息包括實驗員信息、實驗步驟與實驗結果。從需求角度來看,本系統功能包括3部分:
(1)數據錄入功能。物理實驗數據錄入包括兩部分:①利用JS技術將數據進行打包處理,生成信息摘要,然后將其通過交易形式存放到以太坊區塊鏈上,并將交易返回哈希值存放到MySQL數據庫中;②利用Java Web技術與SSM框架技術將JSP頁面填寫的實驗數據上傳到MySQL數據庫中。
(2)數據追溯即數據查詢功能,即將錄入數據加以展示。科研管理者或雜志出版審核人員只需輸入實驗編號(例如:輸入2018120802)即能得到實驗詳細信息,如圖3所示。
(3)實驗信息真實性驗證。通過頁面查詢到MySQL中的數據后,將數據經過SHA3()函數處理后得到的新哈希值,與查詢頁面得到的返回哈希值在經過getTransaction()函數處理后得到的input值(舊哈希值)進行對比,即可驗證信息是否篡改,如圖6所示。若查詢結果一致,即可保證實驗信息的真實性。
4.4 方案安全性分析
(1)安全性。根據區塊鏈數據存儲特點,存儲的數據信息都是根據密碼學非對稱加密技術實現的,所以存儲在區塊鏈上的數據是安全的,并且實驗信息存入區塊鏈后都會產生唯一的hash標識,從而使每一份實驗信息數據都是唯一的,有利于提升科研實驗信息的權威性。
(2)不可篡改性。基于區塊鏈技術的設計特點,存儲到區塊鏈上的每一份實驗數據信息都帶有時間戳,在區塊鏈上執行錄入與查詢操作時都能看到時間,并且能同步到各網絡節點上,每一步操作都是公開的。若想改變當前的哈希文件,必須保證網絡中51%以上的節點同意,這對于一個龐大的網絡體系而言是很難實現的。由于所有操作都能實時同步到區塊鏈網絡節點中,保證了方案數據的不可篡改性。
5 結語
為了解決一些物理實驗信息存在的真實性問題,或某些實驗結果難以復證的問題,本文設計了適用于聯盟鏈環境的基于區塊鏈的物理實驗信息追溯應用方案。本文提出使用區塊鏈與數據庫存儲物理實驗信息,使得錄入的信息無法篡改。若有人改動數據,通過區塊鏈溯源,對比區塊鏈上的錄入信息即能進行驗證,從而確保原始數據的真實性,使物理實驗更加透明。與傳統數據存儲方案相比,本文應用區塊鏈技術進行數據存儲,可保證存儲的實驗信息更加真實、透明,從而使科研成果更加具有公信力和權威性。在建立信任機制后,可以減少物理實驗的反復驗證過程,加快學術出版速度,推進科研創新發展。然而,受區塊鏈本身性能的限制,本文提出的方案只針對有價值的科研實驗,對一般性實驗后續有待進一步完善。
參考文獻:
[1]許潔,王嘉昀.基于區塊鏈技術的學術出版信任建設[J].出版科學,2017,25(6):19-24.
[2]
RONDE C D.Ouantum superpositions and the representation of physi-cal reality beyond measurement outcomes and mathematical structures[J]. Foundations of Science, 2018, 23(4):621-648.
[3]
NAKAMOTO S.Bitcoin:a peer-to-peer electronic cash system [J].Consulted, 2008(1):2645-2652.
[4] 宋奇.談區塊鏈發展:迅雷鏈克展示3.0時代技術優勢[J].計算機與網絡.2018(5):21-32.
[5]
CHEN Y, DINC S, XU Z. et al. Blockchain-based medical records se-cure storage and medical service framework [J]. Journal of MedicalSystems, 2018, 43(1):76-85.
[6] KUO T T, OHNO-MACHADO L.ModelChain: decentralized priva-cy-preserving healthcare predictive modeling framework on privateblockchain net,vorks[J].eprint arXiv: 1802.01746, 2018.
[7] 汪傳雷,萬一獲,秦琴,等.基于區塊鏈的供應鏈物流信息生態圈模型[J].情報理論與實踐,2017,40(7):115-121.
[8]
CHRISTIDIS K, DEVETSSIKIOTIS M. Blockchains and smart con-tracts for the internet of things[J]. IEEE Access, 2016,4:2292-2303.
[9] 呂乃基.區塊鏈4.O[J].系統科學學報,2019,27(1):65-70.
[10]楊立,左春,梁賡.基于區塊鏈的保險產品推薦模型[J].計算機系統應用,2019,28(1):61-68.
[11] 肖程琳,李姝萱,胡敏思,等.區塊鏈技術在食品信息溯源中的應用研究[J].物流工程與管理,2018,40(8):83-85.
[12]梅穎安全存儲醫療記錄的區塊鏈方法研究[J].江西師范大學學報:自然科學版,2017,41(5):484-489.
[13]
MOSER M. SOSKA K, HEILMAN E, et al. An empirical analysis oftraceability in the Monero blockchain[J].Proceedings on Privacy En-hancing Technologies, 2018, 2018(3):143-163.
[14]
CAMMON K.Experimenting with Blockchain: can one technologyboost both data integrity and patients' pocketbooks[J]. Nature Medi-cine. 2018. 24( 4): 378-381.
[15]
BECK R.Beyond hitcoin: the rise of blockchain ,vorld[J]. Comput-er. 2018. 51( 2):54-58.
[16]
BERNARDO D, PETER G,AGGELOS K, et al. Ourohoros Praos:an adaptively -secure, semi-synchronous proof-of-stake blockchain[C]. International Conference on the Theory and Applications ofCryptographic Techniques, 2018.
[17]
ALCHIERI E A P,BESSANI A, GREVE F,et al. Knowledge con-nectivity requirements for solving byzantine consensus with unknownparticipants [J]. IEEE Transactions on Dependable&Secure Com-puting, 2018, 15(2):246-259.
[18]
HUH J H, SEO K.Blockchain-hased mobile fingerprint verificationand automatic log-in platform for future computing [J]. Journal ofSupercomputing, 2019, 75: 3123-3139.
[19]劉耀宗,劉云恒.基于區塊鏈的RFID大數據安全溯源模型[J].計算機科學,2018,45( S2):367-368,381.
[20] 丁旭.基于B/S架構的軟件項目實訓JSP[M].北京:清華大學出版社.2011: 56-72.
(責任編輯:黃健)
作者簡介:吳超(1993-),男,天津工業大學物理科學與技術學院碩士研究生,研究方向為區塊鏈、物理實驗;胡占寧(1962-),男,博士,天津工業大學物理科學與技術學院教授,研究方向區塊鏈、量子通信。