


摘? 要:隨著電子信息化的普及,電子健康記錄管理過程涉及的個人隱私問題顯得格外突出。針對醫療領域存在的隱私保護問題和醫療信息記錄的存儲問題,分析了區塊鏈技術如何處理該問題的方法,對區塊鏈的結構和內部處理方式進行了研究,并給出了基于區塊鏈的電子健康記錄隱私保護設計方案。該方案具有較強的可實施性,對個人電子病例的隱私信息具有保護作用。
關鍵詞:電子健康記錄;區塊鏈;隱私保護;醫療信息
中圖分類號:TP311? 文獻標識碼:A 文章編號:2096-4706(2021)17-0169-04
Abstract: With the popularization of electronic informatization, the personal privacy involved in the process of electronic health record management is particularly prominent. Aiming at the problems of privacy protection and storage of medical information records in the medical field, this paper analyzes the methods of how blockchain technology deals with this problem, studies the structure and internal processing methods of blockchain, and gives the design scheme of privacy protection of electronic health records based on blockchain. The scheme has strong enforceability and can protect the privacy information of personal electronic cases.
Keywords: electronic health record; blockchain; privacy protection; medical information
0? 引? 言
醫療云數據泄露事件層出不窮,引發了醫療云存儲的信任危機,對醫療數據的保護造成了嚴重不利的影響。2018年5月22日《巴爾的摩太陽報(Baltimore Sun)》刊登的一則報道:美國醫療公司LifeBridge Health受到惡意軟件的攻擊,可能導致患者的私人信息暴露超過一年的時間。
區塊鏈技術由于具有去中心化永久記錄和便于審計等特點,可用于滿足隱私數據的完整性、可限制性以及可審計性等數據安全需求,因此可以作為隱私保護問題的有效解決方案[1]。
沒有健全完善的醫療隱私保護相關法律制度規范;患者未參與到電子健康檔案[2]的訪問控制策略中,不能實現個性化隱私保護;醫療健康數據去隱私化面臨廣泛多樣攻擊,無法對數字簽名電子健康檔案實現數據溯源;大數據知識挖掘存在預測和泄漏潛在隱私信息的風險。
云技術在電子醫療應用方面的高速發展給用戶帶來了巨大的便利。為有效管理和利用海量的電子病歷數據,醫療機構將耗費巨大的人力、物力以及財力。雖然云計算與云存儲的出現在一定程度上為醫療機構帶來了很大便利,但其仍然面臨著海量的數據存儲、數據隱私安全以及數據共享問題,因此設計一種安全高效的數據檢索方案[3]一直是國內外學者研究的熱點。
基于機器學習的數據挖掘和隱私發現等新型攻擊手段出現,也使得傳統的防御、檢測等安全控制措施暴露出嚴重不足[4,5]。區塊鏈技術作為比特幣的底層技術在金融和其他商業領域應用已日趨成熟,同時在醫療領域也具有較大的應用潛力,有助于推動醫療體系變革,醫療數據的安全共享和協作[6]。
信息記錄存儲的安全和隱私保護問題在醫療信息系統顯得格外突出,梅穎結合區塊鏈和云存儲技術,提出了一個醫療記錄安全存儲方案即健康鏈[7]。
針對區塊鏈保護隱私數據,祝等人[8]提出了分層保護區塊鏈中的隱私問題。在數據加密搜索上,PKES(Public Key Encryption with Keyword Search)[9-11]方案僅僅支持關鍵字密文的相等查詢。Park等人[12]提出了支持關鍵字邏輯與查詢的公鑰加密概念(Public Key Encryption with Conjunctive Keyword Search, PECK),并給出了相應的構造。Boneh和Waters[13]擴展了PKES的概念,提出了可搜索公鑰加密(Searchable Public Key Encryption)以支持關鍵字的邏輯與、子集、范圍比較等查詢。作為后續工作,Hwang等人[14]和Zhang等人[15]提出了更為高效的PECK方案。所有上述的方案都無法支持關鍵字的邏輯或查詢。Katz等人[16]提出了內積謂詞加密(Inner-Product Predicate Encryption, IPE)的概念,并注意到內積謂詞加密可以用來構造支持復雜邏輯表達的可搜索公鑰加密,也即支持任意可用單調布爾邏輯表達式(包含任意多個邏輯與和邏輯或)表示的查詢。但也很難解決在云計算環境下,可支持隱私保護、支持復雜邏輯表達的有效可搜索加密方案。
依托云服務器在電子醫療環境中對個人健康記錄的使用情況,提出一種基于屬性代理重加密技術與容錯機制相結合的多關鍵字檢索方案[17]。針對個人隱私保護問題,Swan等人[18]在應用領域方面,針對個人隱私問題的嚴重性,認為個人健康隱私數據不受侵犯的機制可以通過區塊鏈技術來保護,但是卻不能給出應用場景實現細節來解決對于個人隱私保護問題。而利用區塊鏈技術文獻[19,20]實現了保護個人隱私數據。Liang等人[21]在移動醫療應用程序中集成區塊鏈技術實現了數據共享和協作。
為了解決區塊鏈效率問題,一種采用輕量級的醫療區塊鏈架構,如LEILA ISMAIL[22]等人提出了通過將網絡參與者劃分成集群并為每個成員維護一份分類賬本來建立共享網絡。
1? 區塊鏈相關結構
1.1? 區塊鏈結構
由于區塊鏈具有防止篡改的特性,因而通過區塊鏈來存取敏感數據如醫療數據等。在區塊鏈中,數據以區塊的方式永久存儲,具體結構如圖1所示。
區塊鏈的時間戳解決了區塊的排序問題,新區塊生成時便記錄著上一個區塊通過哈希計算得到的哈希值,實現了區塊密碼學鏈接。所有的信息的創建過程都可以通過區塊來表達。區塊頭和區塊體組成了區塊,以比特幣為例,區塊頭部分記錄了版本號、前一個區塊的哈希值、默克爾樹的根值、時間戳、目標特征值和隨機數值;所有發生在區塊創建過程中進行的數據的交易信息并經過信息驗證構成了區塊體部分。區塊主標識符是它的加密哈希值,即一個通過SHA256算法對區塊進行兩次哈希計算得到的數字指紋,產生的32字節哈希值被稱為“頭哈希”。第二種識別區塊的方式是按照該區塊在區塊鏈中的位置,即“塊高度”,如第一個區塊,其塊高度為0。
1.2? 默克爾樹結構
默克爾樹的計算過程如圖2所示,交易按次序逐對計算,不足部分則自己和自己計算,最終結果稱為默克爾樹根(Merkle root)。其中sha256d( )指的是兩次調用sha256( )函數,即sha256(sha256())。Sha256會把任意長度的字符串變成32Byte(256bit)的哈希值。Block中第一個交易(TA)是挖礦獎勵,礦工給自己充值。
2? 基于區塊鏈的電子健康記錄隱私保護設計方案
電子健康記錄隱私保護方案,此方案基于區塊鏈技術來實現,具體設計過程如圖3所示。方案的設計過程包括四大部分:電子病例源的形成、電子健康記錄的分類提取、電子健康記錄的存儲和區塊鏈存儲保護電子健康記錄。
2.1? 電子病例源的形成
病人通過自己的手機授權網絡設備,此時傳感器設備采用感知的方式獲取病人的用戶認證信息或者直接授權電子設備識別獲取個人用戶認證信息;另外病人經過醫院各種包含CT、核磁共振、B超、化驗等檢查結果記錄,醫生診療的病例,住院記錄等形成的醫療信息。這些信息構成了醫療電子記錄的來源。
2.2? 電子健康記錄的分類提取
對各種途徑獲取的醫療電子記錄按照表征進行分類,提取其臨床表現、病原起因、常見病的基本特性等各類特征,然后采用分類器進行特征化并應用數值處理得到特征值,建立被分類樣本。
2.3? 電子健康記錄的存儲
下載開源庫(http://archive.ics.uci.edu/ml/datasets.php? format =&task=&att=&area =&numAtt = &numIns =&type = &sort = nameUp&view = table 網站和http:/ /people.Dbmi.columbia.edu/ ~friedma/Projects/DiseaseSymptomKB/index.html網站中的公開醫療數據集)集合的各類病例作為源樣本集,提取出有效的敏感信息或參數值作為特征值,對被分類樣本應用深度學習方式進行分類,存儲在深度學習服務器中,針對個人健康電子記錄中敏感信息進行特殊處理,并將其安全轉存到電子健康記錄服務器中。
2.4? 區塊鏈存儲保護電子健康記錄
對于存儲在電子健康記錄服務器中的病例,提取出時間戳、構造梅克爾樹、獲取病人ID等信息,構造成區塊。利用區塊鏈技術將區塊鏈接起來,對其去中心化處理,進而保護個人隱私。對于醫院不能輕易公開電子病例記錄相關數據和分享其數據給其他醫院和個人。因此,不會泄露病人的用戶信息,從而實現了電子健康病例的隱私保護。
病人所攜帶信息如圖4所示,包括用戶認證信息,健康狀態,既往疾病,生活行為表征,年齡,前期診斷信息。其中用戶認證信息為私有信息,包括用戶ID,姓名,照片、家庭住址、家屬等信息。分析醫療數據個人隱私存在的形式。雖然無用戶姓名、身份證號等具體敏感信息,但通常以用戶的特征以及相應特征概率的格式存在。例如:Id (包括passportId,cookies,IMEI等),gender:概率,age:概率,各種愛好(如電影:概率,看書:概率,運動:概率),住址(精確到小區):概率。
3? 結? 論
本文給出了區塊鏈的基本結構,分析了區塊鏈技術應用于電子健康記錄隱私保護方面的可行性,并給出了具體的設計方案。
目前,由于區塊鏈處理速度較慢、各大醫院的設備條件限制并缺乏相關專業技術人員,此方面的應用還有較大難度。因而,需要建立大型統一標準化的處理框架,提供給用戶可操作性強的友好界面,并加快處理速度提高體驗感,才能真正應用到醫療平臺上。
參考文獻:
[1] 章寧,鐘珊.基于區塊鏈的個人隱私保護機制 [J].計算機應用,2017,37(10):2787-2793.
[2] 黃永剛.基于區塊鏈技術的電子健康檔案安全建設 [J].中華醫學圖書情報雜志,2016,25(10):38-40+46.
[3] 劉新宇,李浪,肖斌斌.基于屬性代理重加密技術與可容錯機制相結合的數據檢索方案 [J].計算機科學,2018,45(7):162-166+196.
[4] 劉新宇,翁健,張悅,等.基于APK簽名信息反饋的Android惡意應用檢測 [J].通信學報,2017,38(5):190-198.
[5] 全國信息安全標準化技術委員會.大數據安全標準化白皮書 [R/OL].(2017-04-08)http://www.cac.gov.cn/wxb_pdf/5583944.pdf.
[6] 趙延紅,原寶華,梁軍.區塊鏈技術在醫療領域中的應用探討 [J].中國醫學教育技術,2018,32(1):1-7.
[7] 梅穎.安全存儲醫療記錄的區塊鏈方法研究 [J].江西師范大學學報(自然科學版),2017,41(5):484-490.
[8] 祝烈煌,高峰,沈蒙,等.區塊鏈隱私保護研究綜述 [J].計算機研究與發展,2017,54(10):2170-2186.
[9] BELLARE M,BOLDYREVA A,NEILL A O. Deterministic and efficiently searchable encryption [C]//CRYPTO 2007:Advances in Cryptology-CRYPTO 2007.Santa Barbara:Springer,2007:535-552.
[10] CRESCENZO G D,SARASWAT V. Public key encryption with searchable keywords based on jacobi symbols [C]//INDOCRYPT 2007:Progress in Cryptology-INDOCRYPT 2007.Chennai:Springer,2007:282-296.
[11] KHADER D. Public key encryption with keyword search based on k-resilient ibe [C]//ICCSA 2007:Computational Science and Its Applications-ICCSA 2007.Malaysia:Springer,2007:1086-1095.
[12] PARK D J,KIM K,LEE P J. Public key encryption with conjunctive field keyword search [C]//WISA 2004:Information Security Applications.Jeju Island:Springer,2004:73-86.
[13] BONEH D,WATERS B. Conjunctive,subset,and range queries on encrypted data. TCC 2007:Theory of Cryptography.Amsterdam:Springer,2007:535-554.
[14] HWANG Y H,LEE P J. Public key encryption with conjunctive keyword search and itsextension to a multi-user system [C]//Pairing 2007:Pairing-Based Cryptography-Pairing 2007.Tokyo:Springer,2007:2-22.
[15] DING M Z,GAO F,JIN Z P,et al. An efficient Public Key Encryption with Conjunctive Keyword Search scheme based on pairings [C]//2012 3rd IEEE International Conference on Network Infrastructure and Digital Content.Beijing:IEEE,2012:526-530.
[16] KATZ J,SAHAI A,WATERS B. Predicate encryption supporting disjunctions,polynomial equations,and inner products [J].Journal of Cryptology,2013,26:191-224.
[17] AU M H,TSANG P P,SUSILO W,et al. Dynamic universal accumulators for DDH groups and their application to attribute-based anonymous credential systems [C]//CT-RSA 2009:Topics in Cryptology-CT-RSA 2009.San Francisco:Springer,2009:295-308.
[18] SWANM M. Block chain thinking:the brain aside centralize dautonomous corporation [commentary] [J].IEEET echnology&Society Magazine,2015,34(4):41-52.
[19] ZYSKIND G,NATHAN O,PENTLAND A S. Decentralizing Privacy:Using Blockchain to Protect Personal Data [C]//Proceedings of the 2015 IEEE Security and Privacy Workshops.Washington DC:IEEE Computer Society,2015:180-184.
[20] MASLUK A,GOFMAN M. Protecting Personal Data with Blockchain Technology [J].Information Technology-New Generations,2018,738:119-125.
[21] LIANG X P,ZHAO J,SHETTY S,et al. Integrating blockchain for data sharing and collaboration in mobile healthcare applications [C]//2017 IEEE 28th Annual International Symposium on Personal,Indoor,and Mobile Radio Communications(PIMRC).Montreal:IEEE,2017:1-5.
[22] ISMAIL L,MATERWALA H,ZEADALLY S. Lightweight Blockchain for Healthcare [J].IEEE Access,2019,7:149935-149951.
作者簡介:劉新宇(1990—),男,漢族,湖南衡東人,助教,碩士,主要研究方向:區塊鏈應用與公鑰密碼學。