楊哲睿,段凱凱,藏京京,2,李翔,高娜 ,劉梁
1.中國科學院紫金山天文臺,江蘇 南京 210008 2.臨沂大學,山東 臨沂 276000
依據《中國科學院“十三五”信息化發展規劃》,中國科學院在“科研信息化應用工程”設立了一類面向研究所“一三五”規劃的科研信息化應用示范的課題,通過對前沿計算方法、信息化工具等研究引領學科快速發展,著力解決研究所重大突破科研活動中關鍵問題,力爭取得有國際影響力的應用成果。
暗物質粒子探測衛星(以下簡稱DAMPE)在軌運行與科學研究就是面向研究所重大突破的科研信息化應用示范支持的一項研究內容,基于暗物質粒子探測衛星的觀測數據,應用信息化手段,深入解決該重大突破中的關鍵性問題——伽馬射線數據的科學研究,提升核心競爭力,研制行業共享的應用軟件系統、分析系統等,完成科學數據順利發布和及時分析,完善地面科研信息系統的建設,為開展暗物質、宇宙線等前沿領域的研究提供信息化支撐。
暗物質粒子探測衛星(DAMPE)是中國科學院戰略先導專項——空間科學專項的首發星,衛星旨在通過高分辨、寬波段的觀測宇宙線粒子來間接探測暗物質粒子[1]。DAMPE 于2015年12月17日由酒泉衛星發射基地成功發射,目前已在軌運行千余天,獲取了數十億個高能宇宙線粒子。DAMPE 衛星設計壽命3年,從衛星平臺與載荷的各項性能指標來分析,衛星壽命延壽超過2年。科學應用系統的各項指標均依據衛星3年壽命進行設計,面對2年以上的延壽,需要對科學應用系統進行相應優化。同時,倘若DAMPE 發布科學數據,科學應用系統同樣需要進行升級以滿足數據發布的需要。
衛星在軌運行由北京空間中心的地面支撐系統和南京紫金山天文臺的科學應用系統及相關衛星測控單位共同完成。經過一年多的運行,相關的運控機制已經非常成熟。當前,衛星最重要的任務是對獲取的科學數據進行研究,以期獲得高質量的物理成果,完成衛星的科學目標。而衛星探測數據中,伽馬射線數據有其特殊性,其占總數據的比重特別低,數據量極少;伽馬射線不帶電,傳播過程中不會受到銀河系中磁場影響,方向不發生變化,到達地球時依然攜帶了源的方向信息;伽馬天體物理對象具有高度各向異性、穩定源與變源并存、源距離亮度尺度跨度大、變源光變時標跨度大、復雜的天體物理起源等特征。其特殊性也需要具有精確的定點曝光計算,精確的多參數儀器響應計算,針對性的低統計量數據統計分析方法的應用。
因為天體物理過程很難產生伽馬射線線譜,所以伽馬射線線譜信號是暗物質間接探測中的重要特征信號[2]。前人曾利用Fermi-LAT 數據進行伽馬射線線譜搜尋的工作,但沒有發現明顯的信號[3]。DAMPE 優異的能量分辨率對于伽馬射線線譜的搜尋具有獨特的優勢,對暗物質間接探測具有重要的意義。
按照國際慣例衛星將發布伽馬射線光子的數據,需要相應的伽馬射線數據發布平臺,同時需要開發一套面向外界伽馬射線光子高級數據產品的軟件(DAMPE Science Tools,以下簡稱DmpST),以確保用戶能夠正確地使用和分析DAMPE 的伽馬數據。
在國際上,美國國家航空和航天局(NASA)發射的費米衛星已建設穩定運行的科學支持中心(FSSC),費米衛星科學支持中心提供數據獲取、數據分析、科學新聞發布等功能,建立伽馬射線數據發布平臺并開發伽馬射線數據分析軟件。暗物質粒子探測衛星是我國第一顆空間天文衛星,DAMPE科研信息化應用系統是我國在伽馬射線領域第一個數據共享、分析的科研數據發布平臺,并集成了科研資源審批的功能,對科研團隊提供全面的信息化支撐。
基于暗物質粒子探測衛星的科學數據,針對衛星超過2年的延壽和數據發布的需求,對地面科學應用系統進行升級完善,開發科學數據發布系統和伽馬射線分析軟件,為暗物質粒子探測衛星提供的科學研究提供專業的信息化支撐,為暗物質粒子探測衛星科學目標的實現提供強有力的數據管理和分析方向的幫助。
為了給DAMPE 的科學研究提供更加專業的支撐,系統建設的核心任務包括:
(1)建立暗物質衛星伽馬數據庫和暗物質衛星科研信息化服務平臺,發布科研動態,實現數據精確檢索,形成數據從入庫、發布到獲取的高速標準化流程。
(2)建設科研成果提交、查看、審核的電子化處理流程和統一管理的框架。
(3)針對DAMPE 伽馬射線數據,開發伽馬射線數據分析軟件(以下簡稱DmpST),使全世界科學家能夠方便快捷地利用衛星數據對感興趣的伽馬射線源進行科學分析。
預期效果可以概述為:為科學家用戶提供數據服務平臺和DmpST 軟件,使科學家用戶能夠方便、正確、高效地理解和使用衛星伽馬數據,為科學家用戶的科學分析提供強有力的保障。
通過該項目將建設暗物質衛星科研信息化應用系統,完善暗物質衛星信息處理系統,進一步管理科研資源,提升數據分析能力,提高并規范化數據的共享,提升科研效率。
建立基于Web 的數據統一訪問接口,通過Web方式可以對科學數據進行高速的檢索,而且可以免去客戶端軟件的各種問題,比如兼容性問題,維護問題。
開發專門的伽馬射線數據分析軟件(DmpST),使得廣大科研工作者在不直接接觸復雜的原始數據的情況下,能夠方便快捷地利用DAMPE 衛星的伽馬射線數據對感興趣的伽馬射線源進行科學分析,并進一步研究其物理性質。
建立明確的科研資源的統一匯聚管理、統一運行服務,明確科研資源在不同角色的責權利、工作流及其電子操作規范。對衛星數據資源加強整合與集成應用,對科研成果建立規范化的審批流程,形成暗物質科學數據整合、科研管理、公共服務和持續發展的協調機制和自動流程。
結合暗物質衛星科研資源特征,制定衛星信息系統資源整合建設方案,支撐數據的有序處理和統一管理。明確數據處理技術部署實現的工作計劃與進度要求,通過整合服務平臺建設,實現暗物質衛星多級科研數據資源的有效集成和應用,將暗物質衛星數據資源體系和質量控制標準規范統一化,推進數據匯聚和整編,通過技術整合和運行支撐,為暗物質衛星數據持續科學分析、公共服務和重要應用提供統一技術支撐。
加強暗物質衛星信息支撐系統運行服務建設,對衛星至少兩年的延壽,升級存儲備份。在全面保障已有暗物質衛星科學系統的正常服務情況下,對新增數據內容、服務功能應在項目實施過程中動態發布,及時運行服務。依托數據云服務環境,不斷提升暗物質衛星伽馬數據應用與分析效果,推動暗物質衛星的科學研究和公共服務。
采用LAMP 架構搭建科研信息化應用Web 系統,應用Linux 操作系統、Apache 服務器、MySQL數據庫、PHP 語言。通過php 將數據讀取入庫。通過MySQL 數據庫對數據屬性、文件索引的存儲和php 對數據庫接口的執行實現對科學資源的檢索、管理。應用python 的astropy[4]工具包實現對衛星數據的封裝和格式轉換。面向大規模衛星觀測數據的檢索和實時獲取數據產品的需求,系統在Web 框架下融合php 的動態交互和python 的天文數據處理,系統在數據檢索中通過php 接口從mysql 數據表中搜尋符合參數需求的百萬至千萬量級數據紀錄并拼接成為初級數據文件,同時php 直接調用python 的天文封裝接口將初級數據文件轉化成為符合用戶標準的天文數據產品。整套海量數據搜尋、拼接、封裝的大量計算和復雜流程均在用戶在線一鍵操作中直接完成,首次實現了DAMPE 伽馬射線數據在標準數據表的存儲模式下一鍵提供精確定制化的整合式數據產品。
在伽馬射線數據分析中,使用fits 格式紀錄光子信息、衛星運行狀態、儀器響應函數,使用YAML 標記語言格式記錄模型文件,利用Python 豐富的科學軟件包,可以方便的操作fits 和YAML 格式文件。同時Python 數據分析包如NumPy,SciPy,AstroPy 等,為數據分析提供了基礎工具,基于此可以實現較為復雜的數據分析算法。
針對不同觸發類型、不同能量、不同角度入射到探測器的伽馬射線進行大量模擬,利用模擬數據經過與在軌數據相同的事例重建和光子挑選過程,得到不同觸發類型、不同能量、不同入射角度的伽馬射線詳細的儀器響應函數,包括有效面積、點擴散函數、能量彌散函數。
由于衛星運行到不同的地理維度時,數據獲取系統對原始數據進行了不同倍率的分頻,以及衛星可能處于不同的工作模式而影響伽馬射線的觀測,需要根據衛星的運行狀態,統計得到衛星從各個角度對于不同天區的觀測時間。對不同天區進行并行化處理,提高伽馬射線數據分析的運算速度。
針對伽馬射線點源和彌散源的分析需要,提供了對于多種投影方式的支持,從在軌數據中挑選出的伽馬射線數據出發,結合DAMPE 衛星對于伽馬射線的儀器響應函數,和對于不同天區的曝光情況,用極大似然估計方法分析伽馬射線源的流量、能譜、空間分布、光變等性質及相應的置信度。
課題通過對多樣化科研資源的匯集和統一部署,建設形成支撐暗物質衛星伽馬射線的科學研究的統一應用服務平臺——暗物質衛星科研信息化應用系統。系統提供科學數據發布的平臺,包括用戶界面、數據庫、數據下載、工具集成的功能。提供一體化的科研管理平臺和美觀便捷的訪問頁面,收集大規模暗物質衛星觀測數據的科學數據庫和對數據精確檢索的數據接口,實現衛星數據從接收、處理、入庫、發布到下載的安全可靠的自動化處理流程。集成原始處理、數據封裝、數據分析等科研工具,建立具有標準訪問接口的數據共享機制,為科研人員提供一套完整的科研成果提交、查看、審核的智能化處理流程和統一的管理準則。為公眾及學科愛好者提供良好的衛星動態、科普資源。圖1 為暗物質衛星科研信息化應用系統的主頁(http://159.226.71.25/dampe/),通過頁面導航可以進入系統的數據發布、數據分析、公眾科普等各項功能區域。

圖1 暗物質衛星科研信息化應用系統首頁Fig.1 Home page of DAMPE e-science application system
如圖2 的系統架構圖所示,暗物質衛星科研信息化應用系統具有3 個主體模塊:數據發布平臺(詳見第4 節伽馬數據發布平臺)、數據分析軟件(詳見第6 節伽馬射線數據分析軟件)、科研成果審批管理(詳見第5 節科研成果審批系統)??蒲杏脩魧祿l布平臺發送數據需求,發布平臺返回數據產品給用戶,用戶將數據產品作為數據分析軟件的輸入,軟件計算得到物理結果反饋給用戶??蒲谐晒麑徟K可以對用戶的文章、項目報告、工具等科研資源進行一個統一的匯聚和管理。系統還包含科研動態、公眾科普、數據工具等輔助應用模塊。

圖2 暗物質衛星科研信息化應用系統架構Fig.2 Architecture of DAMPE e-science application system
系統建設了具備便捷web 界面的伽馬數據發布平臺,實現了具有高效訪問接口的數據共享機制,提供對暗物質衛星共享數據的精確檢索,建立了暗物質衛星伽馬數據庫。建立從暗物質衛星數據初步處理到入庫發布、在線封裝的一套安全可靠的處理流程,并形成科學數據的精確自檢、異地同步的智能一體化生命周期。圖3 即為平臺的數據檢索界面之一,以供用戶在線發送檢索需求。
如圖4,最終的數據發布系統包含兩個數據發布節點,紫金山天文臺發布節點和國家空間科學中心發布節點,每個發布節點都包含完整的數據共享功能。系統還將提供一個原始數據備份節點,達到異地的多點多級數據備份。未來將實現節點之間的自動同步。每個發布節點的完整數據共享系統介紹如下。
暗物質衛星伽馬數據庫包含了3 種數據:伽馬射線光子數據、設備觀測狀態數據、飛船數據(觀測設備的各種參數),其中光子數據為關鍵數據。初始數據為文件形式,通過初步處理和數據校檢后,入庫模塊會將文件中的數據記錄提取出來,導入到關系型數據庫中,完成數據入庫。用戶要使用數據的時候,在檢索窗口中可以根據方向坐標、范圍、坐標系、時間、能量等不同參數發送個性化的檢索請求給數據庫,檢索模塊根據用戶的需求將相應范圍的數據精確提取出來并生成數據文件,標準封裝模塊將數據文件封裝轉化為標準天文格式的數據產品,提供給用戶下載。如單次檢索數據很大,希望提高檢索速度,用戶可以選擇文件型檢索方式,系統通過索引方式將檢索范圍內的全部單日數據文件找出并將多個文件拼接和封裝為標準格式的數據產品。整個檢索和封裝過程高度集成化,僅在一次操作內完成。

圖3 數據發布平臺檢索窗口Fig.3 Data publishing platform retrieval window

圖4 伽馬數據發布系統體系結構Fig.4 Architecture of gamma data release system
龐大的DAMPE 科研團隊中有很多科研材料、工具、文獻等資源需要進行一些內部審核與討論,而零散的對接和管理帶來很多不便。為研究推進形成暗物質衛星科學研究的智能一體化科研管理,形成科研資源的統一匯聚管理、統一運行服務,明確科研資源在不同角色的責權利、工作流及其操作規范,課題建設了科研成果提交、查看、審核的電子化處理流程和統一管理的框架。該科研成果審批系統分成兩個模塊——科研資源匯聚系統和文章審稿系統,分別對暗物質衛星科研團隊內多樣的應用資源和最重要的研究成果進行電子化的高效管理,使科學家免除了大量繁瑣的關于科研對象的零碎一對一對接過程,提升科研效率。
課題建立科研資源的統一管控和共享,完善科研管理體系、質量控制標準、用戶交互窗口,實現科研資源的多級審批電子化管理流程和統一匯聚系統。
資源匯聚系統為科研團隊中各種文檔、工具等普通科研資源提供一個電子化的管理。該系統界面友好、功能劃分明晰,分成進行共享應用的前臺和用于管理的后臺??茖W家用戶在系統前臺將自己的各種文檔、工具等進行在線提交或直接在線撰寫編輯,系統可自動通知管理員。管理員(項目組長、首席等)登陸系統后臺對提交的材料進行檢查和審批。根據不同類型資源的重要性區別可以對資源區分欄目,并為不同欄目定制相應的多級審批工作流,審批工作流的審批級數和各級審批的管理員組都可以自由設定。每級審批退稿之后普通用戶需要進行修改和再提交,再提交后重新經歷審批工作流。通過審批的資源進入欄目展示,欄目的展現具有直接列舉和直接檢索的方式,并且可以自動推薦熱度更高的資源。用戶可以對資源進行不同權限的查閱、評論、收藏等,并具備個人資源中心。管理員可以在后臺對欄目內容、用戶進行權限控制、排序、組別設置等精細化管理。

圖5 科研資源匯聚系統體系結構Fig.5 Architecture of research resource aggregation system
課題形成了重要科學文章的定向審閱機制,建立根據研究方向進行即時性審稿流指派和智能提醒的統一運行管理,實現動態選擇性審稿機制及其自動化交互平臺。
文章是最重要的科研成果,暗物質衛星科研合作組的文章在正式投稿前都需要在組內進行細致的審核,不同于普通資源的審批流程提前確定,文章的審稿人需要根據文章內容進行單獨設置,且對修改意見需要進行定點反饋。系統專門對科研團隊中最重要的文章進行動態的組內審閱和共享。系統具備即時設定審核角色、跟蹤反饋的精確審核流程和對稿件完善過程的清晰呈現。

圖6 文章審稿系統Fig.6 Article review system

圖7 文章審稿系統體系結構Fig.7 Architecture of article review system
系統包含共享窗口和用戶中心,用戶中心匯集用戶個人的文獻和權限管理范圍,集成在線的提交、審稿模塊。圖6 為成功登陸后的共享窗口,提供對文章的多樣化檢索和用戶中心的入口。系統用戶中設置了最高管理權限的編審組。審稿流程如圖7所示,科學家用戶在用戶中心提交模塊中將文章進行提交,編審在審稿模塊能看到新投稿件,并根據文章內容(研究方向等)在團隊中實時分配適合該文的不固定數量的審稿人組。審稿人在審核模塊決定通過或退修,如文章被退修則暫時不可再被審,需作者對修改意見進行反饋更新后才可再被審稿。當所有審稿人都完成審批通過后,文章標記為已審稿狀態。而編審可在文章初提交、在審和已審稿的任何狀態對文章提出退修或決定其最終過審。團隊成員在全流程可以在共享窗口精確檢索、下載和評論文章。文章全生命周期的修改意見和反饋紀錄可完整呈現,且審稿流程中實現全步驟智能提醒。一體化實現動態形成審稿角色的科研團隊統一內審流程。
DAMPE 衛星的原始數據與探測器的設計、參數直接相關,具有高度的復雜性,直接分析原始數據的要求比較高,需要用戶對探測器的性能和運行狀態有深入的理解,不適合DAMPE 項目組之外的科學家直接使用分析。目前并沒有相應軟件供DAMPE 項目組之外的科學家使用。為了解決這個問題,使得廣大科研工作者在不直接接觸復雜的原始數據的情況下,能夠方便快捷地利用DAMPE 衛星的伽馬射線數據對感興趣的伽馬射線源進行科學分析,并進一步研究其物理性質,課題開發了一套專門的伽馬射線數據分析軟件(DmpST)。
其主要任務是:
(1)建立高度提煉的伽馬高級數據產品。
(2)提煉且準確反映衛星和探測器工作狀態。
(3)得到探測器的精確儀器響應函數。
(4)利用一些針對性的統計分析方法,結合衛星和探測器的工作狀態及探測器的儀器響應函數,對伽馬高級數據產品進行基于源的分析。
最終目標是使得科學家用戶在不接觸到探測器底層復雜的原始數據的情況下,能夠正確而高效地對DAMPE 的伽馬射線數據進行分析[5],保證伽馬射線相關的科學尤其是暗物質間接探測相關的科學的順利產出。
如圖8 的概括性數據流程所示,數據分析軟件利用對于伽馬射線的儀器響應函數對光子數據產品進行分析,進而得到伽馬射線源的物理結果。光子數據產品是由DAMPE 衛星收集的在軌數據中經過光子挑選得到,儀器響應函數也是用模擬數據經過相同的光子挑選算法得到的。儀器響應函數是利用大量的伽馬射線模擬數據建立的,包括有效面積、點擴散函數和能量彌散函數。

圖8 伽馬射線研究分析的數據流Fig.8 Data stream of Gamma-ray studies and analysis
根據不同的科學需求需要探索不同的光子挑選算法和儀器響應函數。課題針對伽馬射線點源分析的需求,開發了高效的光子挑選算法,生產光子數據產品,為后續的科學分析提供了基礎保障[6],并建立儀器響應函數,其分析目標是探測不同的物理對象。課題也進一步主要針對伽馬射線線譜搜尋的科學需求,研究、生產、建立相應的光子挑選算法、光子數據產品、儀器響應函數,其目標是間接探測暗物質粒子。

圖9 伽馬射線分析軟件(DmpST)的組織結構Fig.9 Architecture of DmpST
如圖9 所示,伽馬射線分析軟件DmpST 的輸入數據有四部分,分別是飛船文件、光子文件、儀器響應文件、模型文件。光子文件由在軌數據經過光子挑選程序而得到,記錄光子信息,包括到達時間、重建能量、重建方向、觸發模式、事例分類等信息。同時記錄所選光子對應的衛星運行時間信息。飛船文件從衛星工程數據庫中獲取,記錄衛星運行狀態,飛行過程中詳細的時間、衛星位置、衛星指向、衛星工作狀態、有效工作時間等信息。儀器響應文件由模擬數據分析得到,記錄衛星的儀器響應函數,其中有效面積以數據表的形式給出,點擴散函數和能量彌散函數存儲經過參數化后的參數。模型文件記錄伽馬射線源的能譜和空間分布函數形式及參數信息,包括參數名稱、是否參與模型擬合、參數取值和誤差等。
軟件分析流程為:由有效時間和儀器響應函數計算得到衛星對天空各個方向的曝光,再結合由空間模型和能譜模型組成的源模型,計算衛星預計觀測天圖,與由光子事例得到的天圖構造似然函數形式,進行極大似然分析,得到能譜模型中參數的值和誤差,進一步分析得到源的流量、能譜、光變等各種物理性質,還可以由衛星對天空的曝光和源模型進行觀測模擬。
通過充分整合暗物質粒子探測衛星科學研究資源,提供精確標準的伽馬數據產品,支持伽馬數據的分析處理,建設形成支撐科研活動的統一應用服務平臺——DAMPE 科研信息化應用系統,為紫金山天文臺“十三五”發展規劃的重點突破方向之一暗物質粒子探測衛星在軌運行與科學研究提供全面的信息化支撐和保障,為其科技創新和持續發展奠定重要的信息化支撐。在該系統的匯聚資源和分析軟件的支持下,DAMPE 科學團隊利用DAMPE 三年觀測的伽馬射線數據,搜尋到143 個顯著性高于4個標準差的明亮點源,與Fermi-LAT 第四期伽馬射線源表[7]做對應,初步確定了源的類型,其中包括100 個活動星系核,27 個脈沖星,9 個超新星遺跡或脈沖星風云,2 個伽馬射線雙星,1 個球狀星團,另外4 個沒有其他波段對應體,初步建立了伽馬射線亮源表,多種類型的伽馬射線源對于研究伽馬射線輻射機制具有重要意義[8]。團隊利用光子數據產品對幾顆亮脈沖星做了重點分析,根據脈沖星的星歷信息折疊得到脈沖相位分布,并分析得到了脈沖星的流量和能譜信息[9];還利用DAMPE 伽馬射線數據進行伽馬射線線譜搜尋從而進行暗物質間接探測,得益于DAMPE 優異的能量分辨,利用DAMPE3年觀測的數據得到的暗物質湮滅到伽馬射線的截面限制與利用Fermi-LAT 5.8年數據得到的限制相當[10]。另外團隊還對伽馬射線數據分析發現了5 例活動星系核的爆發現象,在天文學家電報上進行了報道[11-15]。
針對紫金山天文臺“十三五”發展規劃的重點突破方向之一暗物質粒子探測衛星在軌運行與科學研究對科研信息化應用需求,完成建設一體化的科研信息化應用系統,提供多功能、便捷的用戶訪問界面,集成數據庫、檢索中心、分析工具、科學軟件,匯聚科學資源、提供科研用戶服務、實現多樣化成果審批、提升數據發布、完善分析方法、提升科研管理。為科學家用戶的科研創新提供了強有力的信息化支撐,使科學家用戶能夠脫離底層的原始數據,方便高效地對DAMPE 的伽馬射線數據進行分析,保證了伽馬射線相關的科學尤其是暗物質間接探測相關的科學的順利產出。未來將持續進行DAMPE伽馬射線數據的更新和檢索算法的升級,并將開放范圍擴大到全世界科學界,在面向更多科學需求的情況下進行數據分析軟件的性能優化,拓展伽馬射線科研資源的科學應用,為下一代伽馬射線望遠鏡做技術積累,進一步推動高能天體物理的發展。
致謝
感謝中國科學院計算機網絡信息中心科研信息化應用工程項目組老師給予的大力支持和耐心指導。
利益沖突聲明所有作者聲明不存在利益沖突關系。