








摘" 要: 水質(zhì)預(yù)測是水資源生態(tài)管理的重要組成部分。水質(zhì)數(shù)據(jù)易受環(huán)境影響,隨著時間、隨機事件、自然條件變化等因素呈現(xiàn)出非平穩(wěn)性和非線性的特性,使得水質(zhì)時序依賴較為復(fù)雜,其規(guī)律難以捕捉。為更準確地提取水質(zhì)時序規(guī)律,并使其具備一定的泛化性,提出一種基于改進iTransformer的多維特征水質(zhì)預(yù)測模型——GF?iTransformer。針對水質(zhì)數(shù)據(jù)中的復(fù)雜噪聲問題,引入一維高斯?拉普拉斯濾波器對水質(zhì)時序數(shù)據(jù)進行降噪。為更好地挖掘水質(zhì)數(shù)據(jù)中隱含的頻域信息,加入頻率增強通道注意力機制,利用基于離散余弦變換(DCT)的頻率信息提取方法,從本質(zhì)上避免了基于傅里葉變換(FT)造成的吉布斯現(xiàn)象,并相對減少了計算量,得到了更好的預(yù)測性能。在3個不同的公共數(shù)據(jù)集(ETTh1、ETTh2、ETTm2)和兩個河流數(shù)據(jù)集(yihe、luohe)上進行驗證,結(jié)果表明,相較于TimesNet、ETSformer、DLinear等6個現(xiàn)有主流時序預(yù)測模型,文中所提GF?iTransformer模型都展現(xiàn)出了較好的預(yù)測精度,證明了該模型的有效性。
關(guān)鍵詞: 水質(zhì)預(yù)測; 多維特征; iTransformer模型; 高斯?拉普拉斯濾波器; 注意力機制; 離散余弦變換
中圖分類號: TN713?34; TV213.4; X522" " " " " " "文獻標識碼: A" " " " " " " " 文章編號: 1004?373X(2025)08?0179?08
Method of multi?dimensional feature river water quality prediction based on
improved iTransformer
FAN Lizhen, DONG Jiangang, LI Junjun
(School of Software Engineering, Xinjiang University, Urumqi 830091, China)
Abstract: Water quality prediction is an important part of water resources ecological management. Water quality data is easily affected by the environment, and presents non?stationarity and nonlinear characteristics with the change of time, random events, natural conditions and other factors, which makes the time series dependence of water quality more complicated and its rules difficult to capture. In order to extract the water quality time series law more accurately and make it have a certain generalization, a multi?dimensional feature water quality prediction model based on improved iTransformer, GF?iTransformer, is proposed. In allusion to the complex noise problem in water quality data, a one?dimensional Gauss?Laplace filter is introduced to reduce the noise of water quality time series data. In order to better mine the hidden frequency domain information in water quality data, a frequency?enhanced channel attention mechanism is added, and the frequency information extraction method based on discrete cosine transform (DCT) is used to essentially avoid the Gibbs phenomenon caused by Fourier transform (FT), and reduce the calculation amount, resulting in better prediction performance. The experimental verification is performed on three different public data sets (ETTh1, ETTh2, ETTm2) and two river data sets (yihe, luohe). The results show that in comparison with six existing mainstream time series prediction models such as TimesNet, ETSformer, and DLinear, the proposed GF?iTransformer can model show better prediction accuracy, which proves the effectiveness of GF?iTransformer.
Keywords: water quality prediction; multi?dimensional feature; iTransformer model; Gaussian?Laplace filter; attention mechanism; discrete cosine transform
0" 引" 言
隨著城市化和工業(yè)化的快速推進,水資源環(huán)境正面臨日益嚴重的威脅。推進生態(tài)環(huán)境大數(shù)據(jù)建設(shè)與預(yù)警預(yù)報應(yīng)用的規(guī)劃[1]下,水資源生態(tài)監(jiān)測和預(yù)測水質(zhì)的變化是一項重要的研究課題。目前主要的研究采用生態(tài)系統(tǒng)趨勢性變化監(jiān)測、監(jiān)管和風(fēng)險預(yù)警體系等分析水資源狀態(tài),導(dǎo)致水資源生態(tài)質(zhì)量變化的因素有水質(zhì)污染和水面污染。水質(zhì)污染可通過對水質(zhì)數(shù)據(jù),如水溫、pH、溶解氧、高錳酸鹽指數(shù)、氨氮、總磷等特征[2]組成的監(jiān)測和趨勢性預(yù)測,了解和分析水質(zhì)污染狀況。
近年來,國內(nèi)外學(xué)者采用不同機器學(xué)習(xí)方法對水質(zhì)時序預(yù)測進行了大量研究。文獻[3]提出一種改進循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的預(yù)測模型,用于實現(xiàn)對水質(zhì)的初步預(yù)測。因為RNN缺乏專門的門控機制,因此在處理具有長期依賴性的水質(zhì)時序數(shù)據(jù)時表現(xiàn)不佳。文獻[4]采用自回歸移動平均模型(ARIMA)對青衣江龜都府段的諸多水質(zhì)進行預(yù)測。文獻[5]采用ARIMA、季節(jié)性ARIMA (SARIMA)、Prophet這三種廣泛使用的基于序列的模型實現(xiàn)了印度恒河水質(zhì)預(yù)測,但ARIMA對于非平穩(wěn)的水質(zhì)時序數(shù)據(jù)預(yù)測局限性大,預(yù)測精度不高。文獻[6]使用向量自回歸(VAR)和長短期記憶(LSTM)網(wǎng)絡(luò)對拉瓦爾大壩區(qū)域的水質(zhì)情況進行預(yù)測。文獻[7]使用LSTM結(jié)合基于高斯函數(shù)的果蠅算法對水質(zhì)溶解氧濃度進行預(yù)測。文獻[8]提出了一種基于多時間尺度雙向LSTM網(wǎng)絡(luò)的水質(zhì)預(yù)測方法,應(yīng)用于北侖河口水質(zhì)預(yù)測研究。文獻[9]提出了一種基于圖卷積網(wǎng)絡(luò)(GCN)和LSTM網(wǎng)絡(luò)的水質(zhì)預(yù)測模型,對錢塘江南源水質(zhì)進行預(yù)測,但LSTM在處理多維時間序列數(shù)據(jù)時存在模型夾雜過多冗余信息、預(yù)測效果并不理想的問題。
Transformer架構(gòu)在人工智能領(lǐng)域的成功應(yīng)用,也推動了時序預(yù)測領(lǐng)域的快速發(fā)展。該架構(gòu)以注意力機制為核心,更好地捕捉了時序數(shù)據(jù)中蘊藏的信息[10]。文獻[11]提出了一種將Savitzky?Golay(SG)濾波與Transformer優(yōu)化網(wǎng)絡(luò)相結(jié)合的流域多步水質(zhì)預(yù)測模型,但由于Transformer在處理時序信息中變量標記(token)結(jié)構(gòu)不當(dāng),使得預(yù)測精度有待提升。文獻[12]提出了一種iTransformer模型,倒置了注意力機制和前饋網(wǎng)絡(luò)的職責(zé),單個序列的時間點被嵌入到變量標記中,由注意力機制利用這些變量標記來捕獲多變量相關(guān)性,同時,前饋網(wǎng)絡(luò)被應(yīng)用于每個變量標記來學(xué)習(xí)非線性表示。
真實世界中的水質(zhì)數(shù)據(jù)存在大量噪聲,且呈現(xiàn)非平穩(wěn)性與非線性等特性,限制了傳統(tǒng)預(yù)測模型的可靠性與準確性,需要對水質(zhì)時序數(shù)據(jù)的降噪處理。iTransformer架構(gòu)在一般時序預(yù)測領(lǐng)域表現(xiàn)出較好的準確性,但在預(yù)測水質(zhì)數(shù)據(jù)時極易受高頻噪聲的影響,不能做到對水質(zhì)數(shù)據(jù)更全面的挖掘。
本文針對水質(zhì)時序數(shù)據(jù)中存在噪聲造成非平穩(wěn)性與非線性的問題[13],在iTransformer架構(gòu)中引入一維高斯?拉普拉斯濾波器對數(shù)據(jù)進行降噪處理;之后在iTransformer中引入頻率增強通道注意力機制,以更好地挖掘水質(zhì)時序數(shù)據(jù)中隱藏的頻域信息,避免了傅里葉變換中吉布斯現(xiàn)象帶來的振蕩問題,同時解決了在進行逆變換時計算成本增加的問題。
流經(jīng)河南省洛陽市的伊河和洛河是黃河的重要支流,本文以伊河和洛河為研究對象。伊河全長265 km,流域面積6 041 km2,洛河全長446.9 km,流域面積[14]18 881 km2,它們是洛陽市的重要水源,為當(dāng)?shù)鼐用瘛⑥r(nóng)業(yè)和工業(yè)提供生活用水、灌溉和工業(yè)用水。同時,伊河和洛河的水質(zhì)情況受到城市化、工業(yè)化和農(nóng)業(yè)活動等因素的影響,水質(zhì)污染問題日益嚴重,本文分別選取伊河龍門大橋斷面和洛河洛寧長水?dāng)嗝娴乃|(zhì)數(shù)據(jù)進行研究。斷面位置如圖1所示。
1" 模" 型
1.1" iTransformer
Transformer模型在預(yù)測過程中是對temporal token中的全局依賴性進行建模,每個temporal token是由同一個時間戳中的多個指標組成。隨著歷史窗口長度的增加,預(yù)測較大移動窗口時會導(dǎo)致性能下降和計算量爆炸,從而降低預(yù)測精度。此外,由于同一時間步的不同數(shù)據(jù)代表了完全不同的物理含義,這些數(shù)據(jù)被嵌入到同一個temporal token中,會影響到多變量之間的相關(guān)性。并且,由單個時間步形成的temporal token也可能會面臨一些問題,由于感受野過度局限,難以捕捉到涉及更廣泛時間范圍內(nèi)的模式和關(guān)聯(lián)。因此,在同一時間步中,具有不同物理意義的數(shù)據(jù)點尺度差異可能較大。強制性地將temporal token進行統(tǒng)一編碼,可能使得多變量之間的相關(guān)性被消除。此外,將物理含義不同的數(shù)據(jù)以及具有不同時間戳的數(shù)據(jù)點嵌入到同一個temporal token中,會限制Transformer對復(fù)雜時間序列關(guān)系的預(yù)測能力。
iTransformer將時間序列中的每個特征獨立地嵌入到一個variate token中,以擴大局部感受野并能夠更好地利用注意力機制進行時序數(shù)據(jù)中的多特征關(guān)聯(lián),并采用前饋神經(jīng)網(wǎng)絡(luò)進行序列編碼。iTransformer的變量嵌入示意圖如圖2所示。
相較于傳統(tǒng)的Transformer時序預(yù)測模型采用Encoder?Decoder結(jié)構(gòu),iTransformer只采用Encoder結(jié)構(gòu),其中包含嵌入層(Embedding)、M個可堆疊的TrmBlock模塊和投影層(Projector)。iTransformer的Encoder結(jié)構(gòu)圖如圖3所示。
對于一個時間長度為T、特征數(shù)為N的歷史觀測多維時間序列[X=X1,X2,…,XT∈RT×N],這組數(shù)據(jù)包含了過去T個時間步的觀測值,形成了一個[T×N]的矩陣。對于預(yù)測未來S個時間步的觀測值,即[Y=XT+1,XT+2,…,XT+S∈RS×N],這個[S×N]的矩陣包含了模型預(yù)測的未來觀測值。使用Xt,:表示相同時間點的所有特征變量,X:,n表示由索引為n的變量組成的整個時間序列。因為X:,n相較于Xt,:有相同的物理意義和更為突出的語義信息。與傳統(tǒng)對Xt,:進行特征的嵌入方法不同,iTransformer模型的特征映射方式是使用嵌入層對每個X:,n獨立地進行特征嵌入,得到N個變量的特征表示為[H=h1,h2,…,hN∈RN×D],D表示嵌入維度。其中[hi∈RD(i=1,2,…,N)]蘊含了變量在歷史時間中的時序變化,這些特征嵌入標記是通過嵌入層和投影層獲得的。綜上所述,采用iTransformer模型進行時序預(yù)測的過程可以公式化為:
嵌入層中[RT→RD]和投影層[RD→RS]都是由多層感知器(Multilayer Perceptron, MLP)神經(jīng)網(wǎng)絡(luò)實現(xiàn)的,嵌入層將時間序列中的每個時間步轉(zhuǎn)換為[RD]維的嵌入標記,而投影層將這些嵌入標記映射到[RS]維度。嵌入標記通過自注意力機制進行相互交互,這表示每個嵌入標記都可以關(guān)注其他嵌入標記,而這種關(guān)注的程度是通過注意力權(quán)重來確定的,這使得模型能夠更好地捕捉輸入序列中不同部分之間的關(guān)系。在每個TrmBlock中,獲得的變量標記通過共享的前饋網(wǎng)絡(luò)進行獨立處理,其中前饋網(wǎng)絡(luò)中的神經(jīng)元排列隱式地存儲了序列的順序。
1.2" 一維高斯?拉普拉斯濾波器降噪
在圖像處理中,高斯?拉普拉斯(LoG)濾波器常用于檢測圖像中的邊緣[15]。同樣,在水質(zhì)時序數(shù)據(jù)中,存在人為活動、儀器誤差、數(shù)據(jù)采集和傳輸問題等帶來的噪聲,需要濾波器檢測出時序數(shù)據(jù)中的邊緣。為了更好地提取出水質(zhì)數(shù)據(jù)的趨勢信息,本文使用一維高斯?拉普拉斯濾波器進行降噪。首先根據(jù)高斯函數(shù)構(gòu)建一維高斯核,通過使用卷積操作應(yīng)用于水質(zhì)時序數(shù)據(jù),得到平滑后的水質(zhì)時序數(shù)據(jù)[Sx];然后創(chuàng)建一維拉普拉斯核用于檢測水質(zhì)時序數(shù)據(jù)中的邊緣和快速變化,通過使用卷積操作應(yīng)用于[Sx],得到拉普拉斯算子[Lsx];最終通過[Sx]加上[α]倍的[Lsx]得到降噪后的水質(zhì)時序數(shù)據(jù)[Dx]。其中,加上拉普拉斯算子的運算結(jié)果是為了平滑數(shù)據(jù)的同時保留關(guān)鍵動態(tài)特征,提高對水質(zhì)時序數(shù)據(jù)的整體信號質(zhì)量,描述公式如下:
式中:[σ]代表高斯函數(shù)的標準差;[I]代表輸入的一維水質(zhì)時序數(shù)據(jù);“[*]”代表進行卷積操作;[α]代表調(diào)整拉普拉斯算子對降噪影響的參數(shù),為了使得在降噪的同時盡可能保留細節(jié),實驗將[α]設(shè)置為0.1。
1.3" 頻率增強通道注意力機制
盡管iTransformer能很好地捕捉到時序數(shù)據(jù)中隱藏的趨勢信息,但缺少對時序數(shù)據(jù)頻域信息的挖掘。大多數(shù)提取頻域信息的方法都是基于傅里葉變換(Fourier Transform, FT),但FT將時域的時間序列數(shù)據(jù)轉(zhuǎn)換為頻域表示,會引起吉布斯現(xiàn)象。所謂吉布斯現(xiàn)象是指在進行傅里葉變換時,當(dāng)信號中存在突變或者不連續(xù)的部分時,傅里葉變換的結(jié)果會在這些不連續(xù)點附近產(chǎn)生振蕩,這種振蕩在頻域中表現(xiàn)為高頻成分。此現(xiàn)象會導(dǎo)致在頻譜圖上出現(xiàn)額外的波峰,使得變換結(jié)果在不連續(xù)點附近呈現(xiàn)出較大的誤差,從而導(dǎo)致預(yù)測精度的降低。此外,進行傅里葉逆變換會導(dǎo)致計算成本增加。
為了解決以上問題,本文在iTransformer的基礎(chǔ)上引入了頻率增強通道注意力[16],通過離散余弦變換(Discrete Cosine Transform, DCT)自適應(yīng)地建模通道之間的頻率相互關(guān)系。實際上,離散余弦變換可以看作是對一個真實存在的偶函數(shù)進行離散傅里葉變換(DFT)的結(jié)果,這是因為離散余弦變換使用對稱擴展來構(gòu)造其周期性擴展。離散傅里葉變換和離散余弦變換擴展對比圖如圖4所示。設(shè)定義在實數(shù)集合上的周期函數(shù)[f:R→R],假設(shè)其在某一點[x0]處是分段可導(dǎo)的,而且在整個定義域上是周期性的,其周期為Lgt;0,在[x0]處的左極限為[fx-0],右極限為[fx+0],則有:
吉布斯現(xiàn)象出現(xiàn)的必要條件為存在跳躍間斷點,由式(9)可得通過DCT可避免吉布斯現(xiàn)象,設(shè)對于每個正整數(shù)N,[SNfx]表示函數(shù)[fx]的第N階部分傅里葉級數(shù),則[SNfx]可表示為:
正如上面的推導(dǎo)過程所示:函數(shù)f在任意[x0]點處的極限收斂,沒有顯示出振蕩,因此,從根本上消除了吉布斯現(xiàn)象,由于傅里葉變換與逆傅里葉變換(IFT)在數(shù)學(xué)性質(zhì)上是一致的,對于離散傅里葉變換的逆變換也是如此。此外,在離散傅里葉變換的情況下,周期性延拓引入了不連續(xù)性,而由于離散余弦變換具有對稱延拓性,會消除這種含有大量高頻人為的不連續(xù)性,使得離散余弦變換比離散傅里葉變換更有效率。
在本文的水質(zhì)時序預(yù)測模型中,引入離散余弦變換可以從特征圖中捕獲更多水質(zhì)時間序列數(shù)據(jù)信息中的頻率分量,這些頻率分量反映了水質(zhì)參數(shù)的變化模式,比如某些物質(zhì)濃度的周期性波動。由于DCT權(quán)值為常數(shù),只需預(yù)先計算一次并保存,而且計算結(jié)果為實數(shù),不需要訓(xùn)練逆變換和網(wǎng)絡(luò)參數(shù)。首先,沿著通道維度將輸入的特征圖分割成n個子組,表示為[(V0,V1,V2,…,Vn-1)],其中[Vi=R1×L,i∈0,1,2,…,n-1,n=Nv]。對任意子組從低頻到高頻的相應(yīng)DCT分量進行處理,每個單獨通道都會由相同的頻率分量進行處理。由此得出:
式中:i的取值范圍為[(0,1,2,…,Nv-1)],表示在子組中的索引;j的取值范圍為[(0,1,2,…,Ls-1)],表示與[Vi]對應(yīng)的頻率分量的一維索引;[Freqi]是一個L維度的向量,表示經(jīng)過離散余弦變換后的結(jié)果。整個頻率通道向量可以通過堆疊操作(Stack Operation)獲得:
式中[Freq]是一個用于關(guān)注輸入特征圖V的向量,維度為[RC×L]。當(dāng)有了[Freq],注意力權(quán)重就可以通過SE模塊來進行學(xué)習(xí)。頻率增強通道注意力機制結(jié)構(gòu)圖見圖5。
式中:[σ]和[δ]為兩個激活函數(shù);[DCTV]表示對輸入V進行離散余弦變換;W1和W2代表權(quán)重矩陣。
通過這樣的處理,每個通道的特征與每個頻率分量進行交互,全面獲取來自頻域的重要時序信息,從而鼓勵網(wǎng)絡(luò)增強提取特征的多樣性。
1.4" GF?iTransformer預(yù)測算法流程
GF?iTransformer預(yù)測算法偽代碼如下所示。
算法 基于GF?iTransformer的時序預(yù)測算法
輸入:水質(zhì)時序輸入數(shù)據(jù)Xi
輸出:預(yù)測結(jié)果[Yi]
1.//步驟1:根據(jù)式(4)~式(8),進行一維高斯?拉普拉斯濾波器降噪
2.Xi_filtered ← GaussianLaplacianFilter(Xi)
3.//步驟2:數(shù)據(jù)嵌入
4.Xi_embedded ← EmbeddingLayer(Xi_filtered)
5.//步驟3:編碼器堆疊
6.Z←Xi_embedded
7.For i from 1 to M do
8.//多頭注意力機制
9.Q,K,V←Z,Z,Z
10.AttentionScores←softmax((QK)/sqrt(d_k))
11.//殘差連接
12.Z←Z+AttentionOutput
13.//根據(jù)式(19)~式(21),經(jīng)過頻率增強通道注意力機制
14.DCT_output←DiscreteCosineTransform(Z)
15.//層歸一化
16.Z←LayerNorm(DCT_output)
17.//前饋網(wǎng)絡(luò)
18.FFN_output←Activation(W1Z+b1)
19.FFN_output←dropout(W2 FFN_output+b2)
20.//殘差連接
21.Z←Z+FFN_output
22.Z←LayerNorm(Z)
23.End for
24.//步驟4:投影層
25.[Yi]_logits ← ProjectionLayer(Z)
26.//步驟5:輸出預(yù)測
27.[Yi]← softmax([Yi]_logits)
28.Return [Yi]
2" 實驗研究
2.1" 數(shù)據(jù)集選取
為了檢驗所提出模型在預(yù)測中的準確性和魯棒性,本文選用公開的ETTh1、ETTh2和ETTm2數(shù)據(jù)集,以及從中國環(huán)境檢測總站[17]提供的自2018年4月—2023年10月流經(jīng)河南省洛陽市境內(nèi)伊河(yihe)和洛河(luohe)的水質(zhì)時序數(shù)據(jù),樣本中包含高錳酸鉀指數(shù)、氨氮指數(shù)等能反映水質(zhì)情況的9種特征。水質(zhì)數(shù)據(jù)具體內(nèi)容見表1。
本文選用的5種數(shù)據(jù)集參數(shù)信息如表2所示。將所有數(shù)據(jù)集按7∶2∶1的比例分別劃分為訓(xùn)練集、測試集和驗證集。
2.2" 實驗細節(jié)設(shè)置
實驗環(huán)境:實驗設(shè)備操作系統(tǒng)為Windows 10,GPU為單張NVIDIA RTX 4060,GF?iTransformer模型代碼使用PyTorch 2.1.0+CU121版本,在Python 3.9.18環(huán)境下進行實驗。對照模型:本實驗除本文所采用的iTransformer作為基準模型外,還與現(xiàn)有時間序列預(yù)測主流模型TimesNet、ETSformer、Dlinear、FEDformer和Autoformer進行對照實驗。
2.3" 實驗評價指標
為了有效評價本文提出模型的預(yù)測性能,實驗使用均方誤差(MSE)和平均絕對誤差(MAE)來度量預(yù)測結(jié)果的準確性,計算公式如下:
式中:n為預(yù)測值的總數(shù);[Yi]是第i個數(shù)據(jù)的實際值;[Yi]是第i個數(shù)據(jù)的模型預(yù)測值。這兩個評價指標都為數(shù)值越小,表示模型對預(yù)測值的泛化程度越好。
2.4" 實驗設(shè)計
本實驗所使用的TimesNet、ETSformer、Dlinear、FEDformer和Autoformer模型在ETTh1、ETTh2和ETTm2數(shù)據(jù)集上的實驗結(jié)果均引自文獻[18];在yihe和luohe數(shù)據(jù)集上分別對上述5個模型進行了實驗,以獲得對比實驗結(jié)果。在GF?iTransformer和iTransformer模型上分別進行了ETTh1、ETTh2、ETTm2、luohe和yihe數(shù)據(jù)集的實驗,以驗證所提模型的預(yù)測效果。
2.5" 實驗結(jié)果
表3是GF?iTransformer模型在5個數(shù)據(jù)集上的實驗預(yù)測結(jié)果。其中yihe和luohe數(shù)據(jù)集的預(yù)測長度設(shè)置為[12,36,84],用于預(yù)測這兩個河流時序數(shù)據(jù)未來一段時間所有指標的水質(zhì)數(shù)據(jù),分別對應(yīng)未來48 h、144 h和336 h。從表3可以得出,本文提出的GF?iTransformer模型在5種不同數(shù)據(jù)集上的實驗效果都表現(xiàn)出較好的統(tǒng)計特征。與基準模型iTransformer對比,在上述數(shù)據(jù)集中MSE平均降低了2.09%~10.90%,MAE平均降低了1.49%~4.69%。綜上所述,本文提出的GF?iTransformer的預(yù)測精度效果更好。
2.6" 消融實驗
本次實驗選擇在luohe和yihe數(shù)據(jù)集中進行,預(yù)測長度為12,其指標評價結(jié)果如表4所示。從表4中可以看到,無論是MSE還是MAE,GF?iTransformer模型的性能都更加優(yōu)異。這主要是由于對水質(zhì)數(shù)據(jù)進行降噪,更容易得到數(shù)據(jù)中的趨勢性信息,同時頻率增強通道注意力機制更好地挖掘了數(shù)據(jù)中的頻域信息,使得模型學(xué)習(xí)到更多的數(shù)據(jù)特征。
3" 結(jié)" 語
為了提高河流水質(zhì)時序數(shù)據(jù)預(yù)測準確性,本文提出了一種基于改進iTransformer的多維特征水質(zhì)預(yù)測方法——GF?iTransformer模型。通過一維高斯?拉普拉斯濾波器對水質(zhì)數(shù)據(jù)進行降噪,消除有效數(shù)據(jù)的干擾因素,幫助更好地挖掘出數(shù)據(jù)中的變化趨勢。通過引入頻率增強通道注意力機制,利用離散余弦變換提取數(shù)據(jù)中的頻域信息,避免了傳統(tǒng)的基于傅里葉變換所帶來的吉布斯現(xiàn)象問題,從而得到更加準確的預(yù)測精度。實驗結(jié)果證明,該模型在3個公開數(shù)據(jù)集和2個河流數(shù)據(jù)集上的預(yù)測效果均表現(xiàn)出較好的精度。
本文提出的模型是以河流水質(zhì)時序數(shù)據(jù)為對象進行預(yù)測。事實上,該模型也可以為空氣質(zhì)量、土壤狀態(tài)、食品生產(chǎn)環(huán)境衛(wèi)生等環(huán)境時序數(shù)據(jù)監(jiān)控和預(yù)測提供支持,拓展為其他環(huán)境狀況預(yù)測的通用模型。
注:本文通訊作者為董建剛。
參考文獻
[1] 生態(tài)環(huán)境部,發(fā)展改革委,自然資源部,水利部.黃河流域生態(tài)環(huán)境保護規(guī)劃[EB/OL].[2022?06?11].https://www.mee.gov.cn/ywgz/zcghtjdd/ghxx/202206/W020220628597264429830.pdf.
[2] ENER E, ENER E, DAVRAZ A. Evaluation of water quality using water quality index (WQI) method and GIS in Aksu River (SW?Turkey) [J]. Science of the total environment, 2017, 584: 131?144.
[3] LI L, JIANG P, XU H, et al. Water quality prediction based on recurrent neural network and improved evidence theory: a case study of Qiantang River, China [J]. Environmental science and pollution research, 2019, 26: 19879?19896.
[4] HU Y, Lü L, WANG N, et al. Application of machine learning model optimized by improved sparrow search algorithm in water quality index time series prediction [J]. Multimedia tools and applications, 2023, 83(6): 1?24.
[5] KOGEKAR A P, NAYAK R, PATI U C. Forecasting of water quality for the river ganga using univariate time?series models [C]// 2021 8th International Conference on Smart Computing and Communications (ICSCC). [S.l.]: IEEE, 2021: 52?57.
[6] ZUBAIR H, MUMTAZ R, ALI H K, et al. Time?series analysis and prediction of water quality through multisource data [M]// AHMAD M. Empowering sustainable industrial 4.0 systems with machine intelligence. [S.l.]: IGI Global, 2022: 1?24.
[7] 郭利進,許瑞偉.基于改進果蠅算法的LSTM在水質(zhì)預(yù)測中的應(yīng)用[J].長江科學(xué)院院報,2023,40(8):57?63.
[8] ZOU Q, XIONG Q, LI Q, et al. A water quality prediction method based on the multi?time scale bidirectional long short?term memory network [J]. Environmental science and pollution research, 2020, 27: 16853?16864.
[9] 李余隆,張?zhí)m,李立.基于GCN?LSTM的錢塘江南源水質(zhì)預(yù)測研究[J].人民黃河,2023,45(12):83?87.
[10] VASWANI A, SHAZEER N, PARMAR N, et al. Attention is all you need [C]// Proceedings of the 31st International Conference on Neural Information Processing Systems. Long Beach, California, USA: ACM, 2017: 6000?6010.
[11] WANG R, QI Y, ZHANG Q, et al. A multi?step water quality prediction model based on the Savitzky?Golay filter and Transformer optimized network [J]. Environmental science and pollution research, 2023, 30(50): 109299?109314.
[12] LIU Y, HU T G, ZHANG H R, et al. iTransformer: inverted transformers are effective for time series forecasting [C]// The Twelfth International Conference on Learning Representations. Vienna, Austria: ACM, 2024: 102.
[13] MOHD Z H J, AZIZ N A, ALELYANI S, et al. Improving water quality index prediction using regression learning models [J]. International journal of environmental research and public health, 2022, 19(20): 13702.
[14] 劉松韜,張東,李玉紅,等.伊洛河流域河水來源及水化學(xué)組成控制因素[J].環(huán)境科學(xué),2020,41(3):1184?1196.
[15] 李揚,王向明,谷霄龍,等.基于增強CT影像組學(xué)預(yù)測食管鱗癌淋巴血管侵犯狀態(tài)的價值[J].放射學(xué)實踐,2024,39(2):239?246.
[16] JIANG M, ZENG P, WANG K, et al. FECAM: frequency enhanced channel attention mechanism for time series forecasting [J]. Advanced engineering informatics, 2023, 58: 102158.
[17] 環(huán)境檢測總站.國家地表水水質(zhì)自動監(jiān)測實時數(shù)據(jù)發(fā)布系統(tǒng)[EB/OL].[2023?11?16].https://szzdjc. cnemc.cn:8070/GJZ/Business/Publish/Main.html.
[18] WU H, HU T, LIU Y, et al. TimesNET: temporal 2D?variation modeling for general time series analysis [EB/OL]. [2024?01?22]. https://zhuanlan.zhihu.com/p/661058340.
作者簡介:樊力震(1999—),男,河南新鄉(xiāng)人,碩士研究生,主要研究方向為時間序列預(yù)測、水資源保護。
董建剛(1974—),男,新疆伊犁人,碩士研究生,高級工程師,碩士生導(dǎo)師,主要研究方向為軟件工程、云計算、數(shù)據(jù)安全。
李俊俊(1999—),男,河南駐馬店人,碩士研究生,主要研究方向為時間序列預(yù)測、云計算。
收稿日期:2024?06?17" " " " " "修回日期:2024?08?01