秦 順 邢文明
(湘潭大學公共管理學院 湖南湘潭 411105)
國際科技數據委員會(Committee on Data for Science and Technology,CODATA)指出,我國科學數據管理與共享工作的發展大致經歷了三個階段[1]:①探索與起步階段(2002—2005):進行試點項目建設,科技部(MOST)發布了科學數據共享計劃(SDSP)。②快速發展階段(2006—2010):涉及基礎設施建設和數據集成。科技部資助了18個以上的科學數據共享項目,包括資源與環境、農業、人口與健康、基礎與前沿科學、工程技術、區域發展等24個部門,并建立了數據共享環境,包括政策、標準、數據共享平臺、數據產品等;修訂《科學技術進步法》等法規,各領域有關部門制定了40余項數據共享規章制度;建立了中國科技資源共享網;建立了一個數據管理和共享服務系統,由四個層次結構的40個科學數據中心或網絡組成,涵蓋自然科學與環境、農業、人口與健康、基礎與前沿科學、工程技術等6個學科;建立了多學科科學數據目錄。③統一管理下的規范化發展階段(2010—):主要圍繞開放存取、評估與授權開展服務建設。林業、地球、人口與健康、農業、氣象、地震數據系統等被授權為國家科技基礎設施,每年進行服務評估。
大數據時代,科技創新越來越依賴于科學數據綜合分析[2]。我國雖緊隨歐美發達國家的步伐建立了大型科學數據庫(SDB)及其CAS應用環境,配備海量存儲系統和數據存儲服務,然而,科學數據管理與共享仍存在諸如基礎設施匱乏、法律制度薄弱等問題。為進一步加強和規范科學數據管理,保障科學數據安全,提高開放共享水平,更好支撐國家科技創新、經濟社會發展和國家安全,國務院辦公廳于2018年3月17日印發施行了我國首部針對科學數據管理與共享的法律規范——《科學數據管理辦法》(The Scientific Data Management Rules,以下簡稱《辦法》),這是自印發《促進大數據發展行動綱要》,確立大數據國家戰略以來國家層面出臺的首部科學數據領域的重要法規,對于科學數據管理與共享而言具有里程碑式的歷史意義和現實價值。文章擬對《辦法》的明確性信息進行簡略解讀,并探求其對促進科學數據管理與共享工作的啟示。
2.1.1 建立明確分級管理,分工負責的管理體制
《辦法》基本建立起“分級管理,分工負責”的科學數據管理體制,形成了宏觀、中觀和微觀三個層級的科學數據管理體制。科學數據管理是由國家統籌,各部門與各地區分工負責,基于科技創新和實現科學數據的最大化價值的目的,對科學數據進行規范化采集、匯交、保存,并推動科學數據共享與安全的系列活動的總稱。不同職能主體分別在各自管轄范圍內行使科學數據管理權限,國務院科學技術行政部門負責全國范圍的科學數據管理與協調工作,國務院相關部門、省級人民政府相關部門(以下統稱主管部門)負責本部門(本地區)的科學數據管理工作,有關科研院所、高等院校和企業等法人單位(以下統稱法人單位)負責本單位的科學數據管理工作,各級各類主體各司其職,在各自管轄范圍內開展科學數據管理工作。

圖1 《辦法》規范的各層級職能主體及其主要職責[3]
《辦法》第四條明確科學數據管理遵循的原則,即遵循“分級管理、安全可控、充分利用”的原則,同時于第二章中指明了各職能主體的具體職責(見圖1)。從職責體系而言,現階段我國科學數據管理依托各職能系統實行縱向管理,實質上實行“統一管理,安全共享”的運行機制。大體的分工及職責為:國務院科學技術行政部門牽頭制定政策和標準規范,協調推進全國科學數據管理工作;主管部門做好上傳下達,貫徹落實國家科學數據管理政策,并統籌規劃本部門(本地區)科學數據管理工作;法人單位為責任主體,負責對上級科學數據管理政策與制度的細致落實,具體開展科學數據采集、匯交與保存,共享與利用,保密與安全相關工作。各級部門職責分工明確,推進科學數據管理有條不紊進行。
2.1.2 建立以法人單位為主體的科學數據管理制度
科學數據管理工作遵循權責一致的原則。《辦法》強化了法人單位的主體責任,體現了“誰擁有、誰負責”“誰開放、誰受益”的原則[4]。《辦法》第九條規定:“法人單位是科學數據管理的責任主體。”這一規定明確了法人單位是科學數據產出的主要陣地,是科學數據管理的一線單位。法人單位被賦予充分的管理權限,也要承擔相應責任和義務。其一方面被授予相關管理制度制定權及具體管理實施權等權限,另一方面具有優化科學數據管理工作、接受社會評價與監督的責任。法人單位應建立的科學數據管理制度至少包括數據采集、匯交與保存的管理制度,數據管理和開放共享工作評價考核制度,涉及保密與安全的科學數據管理與使用制度,譬如安全保密審查制度、涉及國防領域的科學數據管理制度等。這些管理制度的建立,使科學數據管理權責更加明晰,運轉更加順暢,活力不斷增強,有助于改善以往我國科學數據管理薄弱的局面。
2.1.3 形成科學數據采集保存與匯交的工作規范
一是形成科學數據采集生產、加工整理和質量控制的標準規范。科學數據采集、匯交與保存工作是科學數據共享及服務開展的前提。《辦法》第十一條明確指出:“法人單位及科學數據生產者要按照相關標準規范組織開展科學數據生產和加工整理,法人單位應建立科學數據質量控制體系。”然而,我們要知道,我國在科學數據采集保存與匯交的工作規范建立方面仍未完善,相關國家標準、法人單位質量控制體系也無統一或詳細的規范。
二是建立科學數據匯交與保存政策及管理制度。《辦法》第十二條規定:“主管部門應建立科學數據匯交制度,在國家統一政務網絡和數據共享交換平臺的基礎上開展本部門(本地區)的科學數據匯交工作。”與此有關的規定還有“法人單位應建立科學數據保存制度,配備數據存儲、管理、服務和安全等必要設施,保障科學數據完整性和安全性(第十六條)”。另外,明確主管部門和法人單位應建立政府預算資金資助的各級科技計劃(專項、基金等)項目科學數據、國內外學術論文科學數據及社會資助形成的密級科學數據等匯交的管理制度,促進科學數據采集保存與匯交工作的標準化和規范化。
2.1.4 完善科學數據匯交與保存的保障與激勵措施
一是完善科學數據匯交與保存的保障措施。保障措施至少有如下兩個方面:其一,建立科學數據匯交與保存管理制度以保障科學數據匯交與保存。其二,建立科學數據匯交與保存安全制度,對部分科學數據匯交與保存進行嚴格的安全審核與管理。如對于利用政府預算資金資助形成的科學數據撰寫并在國外學術期刊發表論文時需對外提交相應科學數據的,論文作者應在發表前將科學數據上交至所在單位統一管理(第十四條);對于社會資金資助形成的涉及國家秘密、國家安全和社會利益的科學數據必須按照有關規定予以匯交(第十五條)。
二是完善科學數據匯交與保存的激勵措施。激勵措施主要包括強化科學數據中心建設及其服務條件的完善。科學數據中心作為科學數據開放共享的重要載體,由主管部門委托有條件的法人單位建立。在條件好、優勢明顯的科學數據中心基礎上,應優化整合形成國家科學數據中心(第十八條) 。《辦法》第九條第五款規定“法人單位負責科學數據管理所需的軟硬件設施等條件、資金和人員保障”。科學數據中心建設特別強調科學數據人才隊伍建設,于第十七條規定:“法人單位應加強科學數據人才隊伍建設,在崗位設置、績效收入、職稱評定等方面建立激勵機制。”科學數據中心建設由主管部門統籌法人單位建立,其軟硬件設施、資金及人員配備實質上還無特別明確的標準規范,現有的激勵措施對于科學數據管理工作服務效能的提升仍較為有限。
2.2.1 創新科學數據開放機制
隨著關聯數據等技術的發展,科學研究由數字化科研(E-Science)向關聯科學(Linked Science)轉變[5]。關聯科學方法是一種科學資源與數據的發布、共享和互聯機制,其核心是實現科學資源和數據的共享[6]。科學融合關聯要求科學數據開放常態化。《辦法》第十九條規定:“政府預算資金資助形成的科學數據應當按照開放為常態、不開放為例外的原則,由主管部門組織編制科學數據資源目錄,有關目錄和數據應及時接入國家數據共享交換平臺,面向社會和相關部門開放共享。”互聯網時代,編制科學數據資源目錄(即目錄管理制度),通過目錄、數據接入科學數據共享平臺是實現科學數據開放和有效共享的重要保障,我國政府及有關科研院所、高等院校、企業等已在科學數據共享平臺建設上展開了一定的探索。科技部、財政部先后在基礎科學、農業、林業、海洋、氣象、地震、地球系統科學、人口與健康8個領域支持建成了國家科技資源共享服務平臺[2];中國科學院建成開放服務的科學數據云,涵蓋“一主一備+12分中心”分布式、可擴展存儲系統[7];武漢大學圖書館主持建設了中國高等教育文獻保障系統(CALIS)項目下的一個預研類項目“高校科學數據共享平臺(China Academic Scientific Data Service,CASDS)”,基本建立了數據提交、數據組織、數據保存、數據共享、數據使用等規范[8]。此外,目錄管理制度是我國推動科學數據共享的一大創新舉措,值得持續深入探究。
2.2.2 完善科學數據共享機制
一是實行免費公開與增值開發相結合機制。《辦法》規定科學數據共享遵循“非營利原則”,對政府決策、公共安全、國防建設、環境保護、防震減災、公益性科學研究等領域的科學數據共享無償提供,同時鼓勵社會組織和企業等對科學數據進行分析挖掘以形成有價值的科學數據產品,開展市場化增值服務(第二十一條),對確需收費的科學數據,應制定合理的收費規定程序和確立合同制度在經營性活動中的管理作用,明確當事人雙方的權利和義務。這些規定明確了特定非營利性及增值開發科學數據的共享與利用,應體現“公益化與市場化”協同推進的要求,對科學數據共享工作作出合理把控。
二是通過科學數據的出版與引用進行共享。主管部門和法人單位應積極推動科學數據出版和傳播工作(第二十二條),確立科學數據共享的公開出版模式,支持和推動科學數據利用到更廣泛的科學研究領域。此外,《辦法》第二十三條規定:“科學數據使用者應遵守知識產權相關規定,在論文發表、專利申請、專著出版等工作中注明所使用和參考引用的科學數據。”為構建有序的科學數據利用環境,2017年12月29日,國家質量監督檢驗檢疫總局、國家標準化管理委員會發布了《GB/T 35294—2017信息技術 科學數據引用》[9]的國家標準,規定應使用符合“通用科學數據引用格式”和“基于OID的科學數據引用方式”的科學數據引用格式,力圖逐步統一引用元素和引用格式。
2.2.3 優化共享安全機制
確保科學數據的安全可控是實現共享和利用的前提,科學數據管理的開放性要求各層級部門在規范化管理和保證科學數據安全的前提下推動科學數據開放共享、開展國際交流和合作。《辦法》強調應建立科學數據分級分類制度,確保安全共享。科學數據共享具有重大的科學價值、經濟價值和社會價值[10],也會產生相應的安全問題。因此,界定科學數據共享法定許可與例外的范圍,明確科學數據的密級和保密期限、開放條件、開放對象和審核程序等尤為重要。《辦法》中科學數據公開共享與公開例外的界限非常清晰,主要將科學數據劃分為公開、限制公開和依法不公開三類(見表1),參仿《GB/T 7156—2003 文獻保密等級代碼與標識》[11]中公開級、限制級、秘密級等劃分方法,規定涉及國家秘密、國家安全、社會公共利益、商業秘密和個人隱私的科學數據依法依規不予公開。《辦法》規定應對不同公開性質的科學數據制定適用性不同的保密與安全管理制度。

表1 《辦法》中公開共享與公開例外的科學數據劃分[3]
2.3.1 建立健全科學數據管理與使用的安全制度
除了強制限定非公開數據的控制范圍之外,《辦法》明確提出需通過密級審查嚴格限制公開數據的知悉范圍,《辦法》第二十六條對于限制公開、非公開科學數據的管理和使用提出了建立安全制度。一是主管部門和法人單位應建立健全涉及國家機密的科學數據管理與使用制度,對制作、審核、登記、拷貝、傳輸、銷毀等環節進行嚴格管理。二是對外交往與合作中涉及國家秘密科學數據使用的審批制度,法人單位應明確數據類別、范圍及用途,按保密管理規定上報主管部門審批,并于審批批準后辦理相關手續、簽訂保密協議,確保科學數據安全可控。
2.3.2 完善科學數據安全保護措施
保障科學數據的安全性是共享的前提和基礎。《辦法》第二十七條規定“主管部門和法人單位應加強科學數據全生命周期安全管理,制定科學數據安全保護措施”。具體措施包括:加強數據下載的認證、授權等防護管理,防止數據被惡意使用;對于需對外公布的科學數據開放目錄或需對外提供的科學數據,建立相應的安全保密審查制度;按照國家網絡安全管理規定,建立網絡安全保障體系,采用安全可靠的產品和服務,完善數據管控、屬性管理、身份識別、行為追溯、黑名單等管理措施,健全防篡改、防泄露、防攻擊、防病毒等安全防護體系。需建立科學數據開放的安全審查機制,明確科學數據的開放度,并運用相關技術以確保科學數據安全。譬如我國在政務數據共享領域制定的《政務信息系統整合共享實施方案》,要求在2018年6月底前對整合后的政務信息系統和數據資源按必要程序審核或評測審批后,統一接入國家數據共享交換平臺,實現重點領域數據和各部門政務數據基于全國政務信息共享網站的共享服務[12]。
2.3.3 優化應急管理和容災備份機制
《辦法》第二十九條明確規定:“科學數據中心應建立應急管理和容災備份機制,按要求建立應急管理系統,對重要的科學數據進行異地備份。”傳統的應急管理與容災備份機制為“一對一”模式,即每個科學數據中心建立一個容災數據中心或應急管理系統,進行科學數據實時備份。云計算時代,云端分布式共享容災系統能有效降低容災成本,提高容災備份效率[13]。美國國家標準與技術研究院(National Institute of Standards and Technology,NIST)指出云計算有三種服務模型[14],包括軟件即服務(SaaS)、平臺即服務(PaaS)和基礎設施即服務(IaaS)。基于IaaS可建立多個地理分布式容災數據中心,可降低用于備份的服務器數量,大大降低容災成本,有效實現科學數據應急管理和異地容災備份、共享。
《辦法》對我國科學數據管理與共享的規范化、標準化和安全化起到了重要的引導作用,但作為一種實體法規,其條文規定不可能詳盡無遺,我們需要對其引申信息作出解讀,各主管部門、法人單位和數據中心還應探討制定具體實施細則和管理制度,積極推動《辦法》的有效實施。
科學數據管理與共享配套實施規則應包括政策法規和管理制度兩個方面。
3.1.1 繼續完善配套政策法規的制定
《辦法》推動了我國科學數據管理與共享法律制度建設的進程,為我國科學數據管理與共享提供了管理規范。但是,整體而言我國科學數據管理與共享的政策法規仍較匱乏。《辦法》作為由國務院辦公廳通過的法規,具有宏觀指導性,需要國務院科學技術行政部門、主管部門、法人單位根據《辦法》規定,制定相銜接的條例、規范、實施辦法以及方針、政策、指南等實施細則,形成更豐富的法規體系。譬如國家宏觀層面統一制定國家科學數據服務標準《科學數據服務規范》,各部門(地區)因地制宜制定部門(地區)科學數據管理政策和標準規范。目前,科技部、財政部支持建成了8個科技資源共享服務平臺,并于2018年2月3日印發《國家科技資源共享服務平臺管理辦法》,用于規范管理國家科技資源共享服務平臺,推進科技資源向社會開放共享,提高資源利用效率,促進創新創業[15]。科技資源共享服務平臺大多制定了相關政策和標準規范(見表2),值得各法人單位、科學數據中心借鑒學習,制定針對性更強的指導方針和政策。

表2 科技資源共享服務平臺相關政策和標準規范
3.1.2 積極開展科學數據管理制度探索
《辦法》規定各法人單位應按主管單位要求完善規章制度,建立健全本單位科學數據管理制度(第九條第一款),涉及國防領域的科學數據管理制度由有關部門另行規定(第三十二條)。另行提出的相關科學數據管理制度前文已詳盡列出,法人單位需在貫徹落實上級科學數據管理政策的基礎上,建立健全本單位科學數據相關管理制度。
《辦法》的有效實施是發揮科學數據最大價值的基本前提,要求積極參照《辦法》制定具體實施細則。
3.2.1 重視全生命周期科學數據管理與共享
應重視全生命周期科學數據管理與共享,推動科學數據管理與共享工作全面展開。就科學研究而言,其持久價值在于對初始研究數據的使用與再利用,整個信息生命周期的科學數據,即初始數據、中間數據、最終數據[16]都具有重大價值。國內外依宏觀、中觀、微觀構造科學數據管理與共享政策法規體系是較普遍的做法,但仍不可忽視科學數據生產全流程的管理,各級科技計劃(專項、基金等)項目全流程所產生的科學數據皆應予以匯交并統一管理。主管部門應加強科學數據生產開始前、進行中、結束后全過程的科學數據管理,制定相應政策、開發配套的科學數據管理工具以促進科學數據的充分利用,提供相應的一體化共享服務。
3.2.2 加強科學數據中心建設
我國科學數據管理與共享工作發展的一大掣肘是缺乏與科技強國地位相適應的、具有重要影響力的科學數據中心。要推動科學數據管理與共享工作進一步發展,需要統籌科學數據中心布局,大力建設基層科學數據中心。此外,還需推動科學數據中心軟硬件設施、資金及人員配備規范化,并使科學數據中心的充足經費投入成為常態化機制,以保障科學數據軟硬件設施建設和人員配置的優化。在科學數據人才隊伍建設方面,應在崗位設置、績效收入、職稱評定等方面建立激勵機制(第十七條),即需要明確崗位職責以及建立相應的績效評價、審計監督機制。同時,需要建立統一評價指標體系,建立科學數據管理與共享工作評價與行政問責、部門職能、建設經費、運維經費約束聯動的管理機制,使科學數據管理與共享相關工作更富活力。
3.2.3 處理好科學數據利用的市場化與公益化關系
科學數據是為了用的,科學數據開發應遵循公益性與市場化相結合原則(即非營利原則)。公益性數據的免費開放早已是國際社會的普遍共識和通行實踐[17]。而對于商業化有償性科學數據利用服務,相關管理部門及科研人員應在市場化經營性活動中制定并遵守規定程序,通過協議、協商約定,簽訂明確雙方權利與義務的有償服務合同,依法合理收費,對社會公開,并接受社會公眾監督。
3.2.4 制定科學數據共享與安全實施細則
2017年5月,全國科技名詞委(China National Committee for Terms in Sciences and Technologies,CNCTST)發布“大數據十大新名詞”[18],開放數據、數據安全在列。《辦法》指出保障科學數據安全、提高開放共享水平是科學數據管理與共享工作的基本使命和目標,科學數據共享不僅是一種理念,應落實為可操作的細則。因此,應加強科學數據開放政策與安全政策的協同研究,保障相關權利主體的基本權利。加強不同科學數據的開放共享并制定安全政策制度,各科學數據服務部門可基于《辦法》中對于科學數據共享與例外的界定,細化開放共享的科學資源,實施數據開放的目錄管理制度。譬如可參照國家發改委和中央網信辦發布的《政務信息資源目錄編制指南(試行)》[19],該指南從政務信息資源的分類、目錄編制要求、政務信息資源元數據等方面對政務信息資源目錄編制進行了規范。又如科技部發布的多個科技資源共享服務平臺的科技資源開放共享目錄也屬于細化政策措施,其中《氣象科學數據共享平臺科技資源開放共享目錄》[20]中對地面氣象資料、高空氣象資料、海洋氣象資料、氣象輻射資料和數值分析預報產品等科學數據通過名稱、關鍵詞、資源簡介、共享級別、空間分布率、數據起止時間和更新頻率等進行描述,依法依規詳細界定了開放共享的科學數據。除了建立科學數據共享平臺,積極推進科學數據管理與開放,還需推動建立地理分布式容災數據中心,保障數據安全;加強宣傳工作,使更多科學數據生產、使用者能深入到科學數據管理與共享工作中來。
3.2.5 推動數據期刊建設與科學數據出版
大數據時代,科學數據為科學研究帶來了新的方法論,科學數據已然成為科技成果的一大組成部分。科學數據出版主要有三種模式:包括獨立的數據出版、作為論文附件的數據出版和數據論文出版[21]。數據論文(Data Paper)遵循一定發表協議(如Creative Commons Attribution 4.0 International License,CC BY 4.0協議),可實現數據價值,規范科學數據引用。國際頂級期刊Nature于2014年發布了Scientific Data專刊,我國亦于2016年問世了多學科科學數據出版學術期刊——《中國科學數據》(China Scientific Data)。科學數據出版成為新的浪潮,通過數據加工、整理、發布和評價等關鍵環節,促進科學數據可發現、可訪問、可理解和可重用,可基于Datacite、OID、UUID、EZID等科學數據引用工具在科研論文發表、專利申請、專著出版等過程中實現科學數據的標識與引用。我國數據期刊建設、科學數據出版和傳播工作仍處于起步階段,仍需在統一標準化協議建設、推動各學科數據期刊建設與科學數據出版方面積極探索。
科學數據管理與共享工作的規范化是一個從基本理念到法律制度,再到法律實現的過程。《辦法》的通過和實施為我國科學數據管理與共享工作的發展提供了強有力的保障,各層級部門與科研工作者應做到“系統學習、全面領會、忠實貫徹和靈活運用”[22],即在積極學習《辦法》內容的基礎上,切實落實各項規定,推動《辦法》的全面實施,促進我國科學數據管理與共享工作的可持續健康發展。
(來稿時間:2018年11月)