

關鍵詞:投資項目;監測;LSTM網絡;經濟預測
0 引言
甘肅省實現了投資項目在線審批監管,累計在線審批投資項目18.4萬個,辦理項目事項20.1萬件,有力支撐了全省經濟社會全面發展。但隨著“放管服”改革和優化營商環境工作進入縱深,既有投資項目監控預測能力日益無法適應高質量發展的要求,亟須構建一套能夠準確監測投資現狀,有效預測未來走勢的智能監測預測系統。
人工智能和大數據技術的發展為解決這一問題提供了新的思路,深度學習作為人工智能領域的重要分支,在處理復雜非線性問題和時間序列預測上展現出了顯著的優勢。徐映梅等人[1]對傳統統計計量方法和深度學習方法的對比表明,針對結構復雜的非線性多變量數據,神經網絡預測效果更為理想。長短期記憶網絡(Long Short-Term Memory,LSTM) 是一種特殊的循環神經網絡,因其獨特的門控機制,能夠在保持長期依賴關系的同時,有效避免梯度消失和梯度爆炸問題,從而在處理時序數據時展現出卓越的性能。朱青等人[2]通過實驗結果發現,LSTM模型能較準確地反映GDP增長的變化規律,在宏觀經濟預測中具有較高的應用價值。王國金[3]對LSTM模型的初始權重及閾值進行了優化,提升了LSTM網絡模型的經濟預測效果。但運用深度學習進行投資項目預測的相關研究和實踐還比較欠缺。
本文旨在設計并實現融合LSTM神經網絡的投資項目監測預測系統,充分利用LSTM在網絡建模與預測方面的特性,通過對投資項目的歷史數據進行深度挖掘和學習,實現對投資項目數量的精確預測,為投資主管部門投資形勢研判、經濟調控和政策制定提供支撐,實現用數據說話、用數據管理、用數據決策。
1 相關理論與技術
1.1 Django 框架
Django是Python的主流Web框架之一,它通過減少重復的代碼,使開發人員能夠專注于開發中的關鍵事務,專注于編寫應用程序[4]。Django提供了大量的開箱即用工具,使開發過程更加簡單和高效,用來快速構建復雜和高性能的Web應用程序。Django采用MTV(Model-Template-View) 的架構設計,是MVC 模式的一種變體,強調模板在Web應用程序中的重要性模型負責數據處理和數據庫交互,通過定義一系列的數據模型類來與數據庫進行映射。視圖負責業務邏輯處理,視圖函數或類接收HTTP請求,處理數據并決定返回給用戶的響應內容。模板提供友好的方式來定義HTML和其他格式輸出,通過變量和模板標簽動態渲染視圖提供的數據。在典型的Django應用中,用戶請求被Django的URL映射機制傳遞給相應的視圖,視圖處理數據操作等業務邏輯將數據傳遞給模板,模板生成HTML頁面并響應返回給請求者。
Django的高效安全和可擴展kapRFsGsmDBHo+/kT8YkBQ==性源于其獨特的內部機制,對象關系映射(ORM) 使開發者不必直接編寫SQL語句而以Python對象的方式操作數據,URL分發機制通過URLconf文件簡潔地映射URL到相應的視圖函數,插件式中間件(Middleware) 允許在請求響應周期的不同階段插入自定義功能,表單驗證和生成機制簡化了網頁表單的處理過程,多級別緩存機制大幅提高應用性能,Django同時提供跨站腳本攻擊(XSS) 和跨站請求偽造(CSRF) 等安全防護機制。
1.2 LSTM 神經網絡
長短期記憶網絡(Long Short-Term Memory,LSTM) 是一種特殊的循環神經網絡(RNN) 結構,它能夠有效克服RNN中存在的梯度消失問題,尤其在長距離依賴的任務中的表現遠優于RNN,梯度反向傳播過程中不會再受到梯度消失問題的困擾,可以對存在短期或者長期依賴的數據進行精確的建模[5]。
LSTM核心在于其內部的細胞狀態和門控機制,這些機制賦予LSTM對長期依賴關系的強大建模能力。細胞狀態使LSTM能對序列連續地存儲和傳遞信息,從而使長期依賴關系得以有效地保留和累積。門控機制通過輸入門、遺忘門和輸出門靈活地控制信息的讀取、更新和輸出,確保模型能夠在捕獲短期動態變化的同時,充分理解和利用長期的歷史信息。細胞狀態(C) 是一個持續傳遞的信息通道,負責在時間步之間保持和傳遞信息,細胞狀態能夠保留長期依賴,不受輸入門、遺忘門和輸出門的直接影響。門控機制的遺忘門、輸入門和輸出門基于前一時刻的隱藏狀態和當前時間步的輸入。遺忘門決定細胞狀態中哪些信息應當被丟棄,1表示完全保留信息,0表示完全遺忘信息。輸入門的計算結果表示哪些新信息應被加入細胞狀態中。輸出門決定如何從當前細胞狀態中提取有用信息用于生成當前時間步的隱藏狀態,該隱藏狀態將用于后續的計算或作為模型的輸出。遺忘門與輸入門結合形成了更新后的細胞狀態。輸出門與細胞狀態相乘(經過tanh激活函數),將結果作為當前時間步的隱藏狀態,隱藏狀態不僅影響下一個時間步的LSTM單元,也是模型對外部世界的輸出。LSTM 通過門控機制實現了對信息的精確控制,允許模型在處理序列數據時選擇性地保留、更新和讀取信息,適于需要考慮序列數據中長距離依賴關系的任務。
2 系統設計
2.1 系統架構設計
系統基于Django框架,采用三層架構設計,從上而下依次為應用層、業務層和數據層。應用層負責與用戶直接交互,承擔著界面展示、功能調用以及請求處理等關鍵任務,確保系統的可用性和易用性。業務層是整個系統邏輯處理的中樞,涵蓋了業務規則定義、業務流程控制以及服務接口封裝等多項重要職能。在業務層系統將復雜的業務邏輯進行了模塊化、組件化的精細劃分與實現,從而有效保證了業務處理的穩定性和可維護性。處于底層的數據層包括數據訪問與操作、數據持久化等一系列與數據相關的處理工作,通過與上層業務邏輯緊密配合,數據層不僅提供了可靠的數據支撐,同時也確保了數據的安全性和一致性。
2.2 功能模塊設計
1) 總量數據監測。對項目審批和事項辦理數據進行分類、統計、排序,對疑似異常項目回溯到基本數據后進行人工處理,監測范圍主要是一般投資項目、專項庫和審批事項。投資項目監測交叉分析項目審核備類型、審批地區和機構、賦碼日期、審核備日期、國標行業分類、發改部門行業分類、項目目錄、開竣工日期等屬性,黃河戰略、生態產業、外貸、民間資本推介等專項庫標識,值域為項目數量和投資額。分析結果以表格、熱圖等形式展示,便于快速計算和提取信息。審批事項監測交叉分析項目審批級別、審批機關、地區、事項名稱、事項狀態,申報、接件、受理和辦結日期等屬性,值域為事項辦件量,分析結果以表格、熱圖等形式展示。
2) 專項庫監測。主要是儲備項目、黃河戰略項目、重點投資項目和重大前期項目等專項項目的監測。儲備項目監測分析儲備項目類型、屬性、屬地、行業、投資、前期工作情況、建設性質、輔助標識等屬性。黃河戰略項目監測分析黃河戰略項目類型、屬地、行業、投資、開復工情況、責任人、包抓領導、輔助標識等屬性。重點投資項目監測分析重點投資項目擬開竣工日期、類型、屬性、屬地、行業、投資、前期工作情況、開復工情況、責任人、包抓領導、輔助標識等屬性。重大前期項目監測分析重大前期項目前期工作情況、類型、屬性、行業、投資責任人、包抓領導、輔助標識等屬性。
3) 投資項目預測。為了實現投資項目未來趨勢的精準預測與高效自動化處理,構建基于LSTM網絡的投資項目預測模型。該模型以2015年10月份以來的投資項目審批數據為基礎,充分考慮訓練集與測試集的時間序列特性以及樣本長度的影響,將其作為關鍵參數加入模型構建過程中。在模型的具體實現上,優化了損失函數的選擇與設定,旨在確保模型在學習歷史數據規律的同時,能夠準確捕捉到投資項目各維度指標間的復雜動態關系,并有效防止過擬合或欠擬合現象的發生,使得模型具備較強的泛化能力,對未來投資項目趨勢進行科學合理的預測。將模型處理過程函數化,開發用戶接口界面,實現投資項目預測自動化。
2.3 LSTM 預測模型構建
1) 數據預處理。本系統數據來源于甘肅省投資項目在線審批監管平臺分析數據庫,在項目審批過程中實現數據實時更新。截至2024年3月,在庫項目18.4萬個,基于項目數量平穩和月度預測業務需求等考慮,本系統將日數據轉換為月數據,從2015年10月至2024年3月共102個月。按90%比例劃分訓練集和測試集,訓練集91個月,測試集11個月。數據特征與預測目標均為投資項目數量。
2) 模型實現。本文基于Keras的深度學習框架搭建LSTM模型。Keras是模型層面的深度學習接口庫,主要負責模型的構建、訓練及預測等核心功能。Keras具有卓越的封裝特性,能夠便捷高效地搭建各類實驗所需的網絡模型,極大地提升實驗效率。對于深度學習底層涉及的復雜張量運算,Keras 依賴于Theano或Tensorflow這樣的后端引擎提供計算支持,自身并不直接處理。
3) 模型評價方法。采用時間序列常用的均方根誤差(RMSE) 和平均絕對百分比誤差(MAPE) 評估模型效果。RMSE通過計算預測值與實際值之間差異的平方,取平均后再開平方根得到評估模型的表現。其公式如下:
MAPE有效消除了數據規模的影響,使得不同規模或波動特性的數據集之間可以進行準確的預測性能評估,適合評估和比較具有顯著差異性尺度或者波動幅度的數據集預測精確度。
3 實證分析與結果討論
3.1 投資項目監測
通過系統監測近5年甘肅省投資項目數據可以看出,2019年至2023年甘肅省投資項目總體上呈增長趨勢,如圖1所示。分季度看,從一季度到二季度是投資項目的快速增長期;三、四季度是項目的實施期,新報項目較前兩季度有所下降。但2023年一至四季度投資項目數量持續增長,展現出了較強的投資動力。
項目審批事項情況與投資項目數量分季度趨勢基本一致。但2020年和2021年項目審批事項較2019 年有明顯下降,主要原因是這一階段項目立項階段事項辦理后實施階段審批數量較少,也就是說有大量項目未落地實施。2022年至2023年情況有明顯好轉,項目審批事項數量顯著增加。
從監測結果來看,2023年1—12月,甘肅省投資項目數量和投資額均保持高位運行,1季度項目數量和投資額均呈現明顯的增長趨勢;2、3季度保持平緩;3季度又有一輪顯著的增長。
3.2 投資項目預測
采用本文模型對甘肅省2023年11月—2024年3 月投資項目數量進行預測,實際值與預測值見表1。
該模型預測投資項目數量的均方根誤差(RMSE) 為937.012 4,平均絕對百分比誤差(MAPE) 為0.254 6。
4 結束語
本文設計實現了融合LSTM神經網絡的投資項目監測預測系統。本文立足現有投資項目信息化成果,通過業務流程梳理、系統整合、匯聚、集成,實現信息資源統一匯聚、分析應用和深度服務。采用大數據分析方法,實現投資項目數量和投資額的實時監測,針對不同年度、行業領域以及地域的投資分布情況,進行深度數據挖掘與精細化對比分析,為投資策略優化和資源配置提供了強有力的數據支持。構建LSTM網絡投資項目數量預測模型,通過對2023 年11 月—2024年3月投資項目數量預測,達到了較好的效果,為投資發展趨勢預測和促投資穩增長提供了有效的數據和方法支撐。系統有效實現了甘肅省投資項目的實時監測和智能預測,在政府投資決策和調控領域有重要的應用價值。同時,系統預測的準確率等方面還需要進一步研究提升。