王 瑞,萬定生
(河海大學計算機與信息學院,南京 211100)
中小河流的水文數據有時序特點和復雜性特點,水文時間序列預測前提是需要提取符合時序數據的特征,要能夠學習中小河流復雜的數據特征。為了確保水文時間序列預測結果更為準確,水文時間序列特征提取成為預測工作的關鍵步驟。支持向量機[1](support vector machine,SVM)在結構風險最小化理論保證了其具備良好的推廣能力。近年來,支持向量機模型與其他方法相結合逐漸成為研究熱點[2]。
時間序列的特征提取方法有4種,分別是基于統計特征的分類特征提取、基于構建模型的分類特征提取、基于變換的分類特征提取以及基于分形理論的特征提取。基于統計量的特征提取方法是最直接的特征提取方法,提取時間序列數據在統計學上的特征構成特征向量,統計特征有兩種:時間域與頻率域。時間域特征包括均值、峰值、方差、均方根和峰值因子等[3];基于構建模型的分類特征提取方法是將提取時間序列特征等價于提取模型因子,首先分析數據特點,并根據已完成分析的不同的數據特點構建不同的模型[4],如針對相對穩定的時間序列數據,可以通過自回歸滑動平均模型提取特征,針對相對不穩定的時間序列可以對數據進行神經網絡建模,利用神經網絡模型演化求解代表時間序列數據變化的特征;基于變換的分類特征提取方法,將時間序列特征數據在不同域中映射變換,時域和頻域的變換是比較常見的域變換,使得顯著特征在特定維度凸顯,典型的域變換有傅里葉變換和小波變換[5];……