張 茜,張健楠,趙永恒
(1. 中國科學院國家天文臺,北京 100101;2. 中國科學院大學,北京 100049;3. 中國科學院光學天文重點實驗室 (國家天文臺),北京 100101)
星系光譜分類對于研究星系的形成與演化具有重要意義。傳統星系分類方法包括:基于形態學的哈勃分類法,根據星系外形將星系分為橢圓星系、旋渦星系、棒旋星系和不規則星系;基于顏色的分類法,文[1]分析斯隆數字巡天(Sloan Digital Sky Survey, SDSS)數據時發現顏色星等圖服從雙峰分布,藍色星系和紅色星系各有峰值,雙峰之間為綠谷;基于光譜的BPT診斷圖[2]的分類方法,經過多年的改進形成了基于線強比診斷圖的分類方法,目前常用的經驗分割線有文[3]提出的用于識別純恒星形成星系(Star-Forming, SF)的分割線,文[4]提出的用于識別純活動星系核星系的分割線[4],以及文[5]和文[6]分別提出的用于區分低電離核發射線區(Low-Ionization Nuclear Emission-Line Region, LINER)星系和Seyfert2星系的分割線。
大型巡天項目的實施為天文領域提供了海量光譜數據,例如2dF, 6dF, RAVE, SDSS, LAMOST, GAIA等,其中LAMOST DR5發布的星系光譜多達15萬余條,必須研究光譜自動分類技術用于大規模光譜數據的分類研究。傳統的基于譜線檢測或BPT圖的星系光譜分類方法需要進行星族成分合成,由于此過程復雜且耗時,不適用于海量光譜數據的處理,無法直接用于光譜自動分類。相比之下,基于機器學習的光譜自動分類方法更適用于海量天文數據的分析研究。目前有許多機器學習方法成功應用于天體分類,包括監督型和無監督型分類方法。無監督型分類方……