胡濱
【摘要】 針對國內證券行業數據信息分散、系統功能單一的情況,設計了基于數據挖掘技術的證券投資分析系統。在Microsoft.NET的框架上,利用SQL SeNer技術、ADO.NET技術進行數據庫搭建、智能數據采集、轉換及分析處理,快速地從大量數據中得到即時的有效信息并做出決策。
【關鍵詞】 數據挖掘 蟻群分析 證券 投資決策
一、數據挖掘與證券的關系
1989年8月,第十一屆國際聯合人工智能學術會議在美國Detroit市召開,在這次會議上,數據挖掘第一次形成了一個正式的概念。此后,每年會舉辦一屆KDD國際會議來推進對數據挖掘和知識發現的研究進程。
在商業領域中,數據挖掘給企業的商業信息處理帶來了一個全新的思維方式。證券行業是一個交易量巨大的行業,我國的證券交易系統具有成熟的事物處理系統,多年的運營中,交易數據庫中累積了巨量的數據。利用數據挖掘工具來發掘其中有價值的知識和信息,將會為證券投資的正確決策帶來不可估量的作用。如何對交易數據進行挖掘成為了證券投資研究的重中之重。
在證券投資領域,較為新穎的是蟻群算法,它具有很高的計算效率,而且不需設定最終簇的數量。在今年來不斷的發展改進中,蟻群算法在某些方面的問題中表現出了更接近實際的效果。
本文將使用這種新的算法工具來對證券投資決策過程進行分析,對股票的行業因素、公司因素、收益和成長因素等加以考慮,建立全面的評價體系,并通過聚類分析方法來決策投資過程。
二、開發平臺
該數據挖掘系統是在MicrosofLNet的框架基礎上設計的。.NET框架是一種高度分布式的應用程序開發平臺。該平臺含有內部網絡和外部網絡快捷開發的多項技術,可以進行敏捷軟件開發、快速應用開發,支持多種語言,通用性、可移植性強、開發成本低、數據庫使用便捷。
ADO.NET是.NET環境中最常用到的數據接口,提供數據訪問服務。ADO.NET使用了多層次的資料處理架構,將中斷連接方式應用到程序設計中,提高了程序的延展性。
三、系統結構功能設計與設計
3.1 數據庫連接配置
對數據庫進行操作的過程要保證安全性,在ADO.NET中實現這一功能時,需要請求連接,并對相關信息進行認證,認證成功后便可以通過客戶端對數據庫進行操作。為了實現數據檢索功能,定義了一系列基本方法,設置不同的鏈接字符串,用于對數據庫進行動態鏈接,以滿足業務查詢的需求。
3.2 數據采集
數據采集系統不但要對數據進行定時采集、壓縮和傳送,還要保證接收和加載等過程。為了使采集程序有更強的適應性,數據采集系統采用了兩級分工的工作模式:客戶端采集傳送,由服務端負責接收和加載,這樣可以大大提高在廣域網中可能出現的傳輸性能不佳情況下的傳輸效率。為了對不同采集條件、不同的數據源進行智能采集,客戶端采用了多模塊的工作方式,以實現不同的采集功能。
3.3 數據轉換
證券、銀行等系統進行系統切換時,需要進行數據遷移。數據遷移技術能夠將離線存儲和在線存儲進行融合,常常應用于系統升級、數據更新等工作中。數據遷移對于新系統的成功切換是至關重要的,它的質量影響著系統上線和之后運行的穩定。由于證券市場的特點,股票交易等信息變化迅速,必須要一種數據轉換系統來應對不斷動態變化的數據信息,及時地更新股票信息。
數據轉換系統使用了.NET平臺技術進行開發,在源數據庫和目的數據庫之間進行直接轉換。
3.4 數據挖掘分析
經過連接數據庫,采集數據,數據轉換后得到的信息將被用于數據挖掘分析,采用蟻群算法對數據進行挖掘分析,主要步驟如下:(1)建立股票綜合評價指標體系;(2)選定蟻群分析范圍;(3)收集股票樣本指標數據;(4)求行業指標均值;(5)數據標準化處理;(6)運行蟻群分析;(7)生成類譜圖;(8)分析聚類結果,尋找具有投資價值的股票,進行決策。
四、總結
證券行業形勢復雜多變,對大量的數據進行簡單的存儲記錄對開展業務、投資分析、推斷決策助力甚微。將數據挖掘技術應用于證券分析投資中,可以降低數據的冗余度。本文搭建基于.NET及SQL Sever平臺的證券分析系統,對數據進行提取、轉化,根據一定模式進行處理,克服證券行業信息系統智能化水平低、數據簡單堆積的缺點,提高了數據的利用效率。