王傳軍, 王德清, 肖 健, 尹樹成, 王 鋒,范玉峰, 和壽圣, 丁 旭
(1.中國科學院云南天文臺,云南昆明 650216;2.中國科學院天體結構與演化重點實驗室,云南昆明 650216;3.中國科學院大學,北京 100049;4.天津大學智能與計算學部,天津 300350;5.廣州大學天體物理中心/物理與電子工程學院,廣東廣州 510006)
天文學從肉眼觀星到通過望遠鏡觀星,從全波段天文學到多信使天文學,人類認識宇宙的手段逐漸豐富。2017年10月16日,全球多國科學家同步舉行新聞發布會,宣布人類第1次直接探測到來自雙中子星合并的引力波,并同時“看到”這一壯觀宇宙事件發出的電磁信號①http://news.ifeng.com/a/20171016/52663786_0.shtml。引力波提供了一種與以往觀測方式完全不同的手段,天文學研究已進入大數據、多信使時代[1]。
在觀測手段豐富的同時,大型望遠鏡的觀測數據量也越來越大[2],這些海量天文數據對存儲、計算、網絡、軟件、算法乃至工作模式等提出了新的需求[3]。天文學家需要將龐大的數據進行標準化的存儲及傳輸,FITS(Flexible Image Transport System)文件格式已成為天文數據的通用標準[3-4]。FITS文件包括文件頭和數據矩陣兩部分,可以擴展,但文件大小必須是2 880字節的整數倍。在對觀測數據進行入庫管理時,將FITS頭關鍵詞的值也進行入庫歸檔,從而便于后續的檢索訪問[5]。雖然在觀測數據的FITS頭中,已經記錄了大部分信息,但是這些FITS頭信息的內容卻由于來自不同的終端而千差萬別,而且有些終端觀測數據的FITS頭中包含的信息不完整,商品化終端設備的FITS頭內容更是無法進行修改和補充。……