邵 波 1 李書涵 2 倪晨晨 1 吳旭婷 1
(1.浙江外國語學院 浙江 杭州 310023;2.杭州第二中學錢江學校 浙江 杭州 311000)
近些年,由于信息和互聯網行業的逐步發展,大數據掀起熱潮,數據可視化成為熱門話題之一。人們對海量數據的挖掘、運用和分析,為新一波盈利浪潮起到預告作用,也為物理、生物等領域和金融、通訊、軍事等行業發展帶來新的啟發。
數據可視化借助于圖形化手段,將稀疏又復雜的數據直觀性地顯現出來,在一定程度上可以弱化部分數據困局。但是對于挖掘收集到的各類數據,如何解釋數據,將復雜數據簡單化并以直觀的效果呈現,是研究人員的一個重要任務。可視化技術與信息表達有密切、直接的聯系,是詮釋復雜數據的重要方法和手段。這種方式在升級發展的過程中面臨的主要問題便是信息超載。人們在面對 “信息爆炸”和 “數據過剩”局面表現出茫然無措的同時,也明顯感受到“信息貧乏”和“數據被關在牢籠中”的約束。
在互聯網與金融并行繁榮發展階段,計算器的使用和操作也更加便捷。行業研究人員為促進行業發展,不斷創新研究方法,深入研究數據信息中內涵的價值,從而使學習和應用計算機高級語言也成為了一種趨勢。計算機語言的普及以及使用率也因此得到大大提高,其主要可以分為以下三類:機器語言、匯編語言、高級語言。
1.概要
Python是提供簡單高效的高級數據結構的一門計算機解釋性高級動態編程語言,具有跨平臺、開源、免費三大特點。它的動態類型和語法,使這門本質為解釋型語言的編程語言在平臺運用和開發應用方面,得到快速發展。
2.Python中數據可視化的工具使用
一圖勝千言。數據可視化可以通過Python的可視化工具包中的通用軟件工具和特定軟件工具實現。通用軟件工具是指集成開發環境(IDE),即同一軟件包內包含所有生產工具的應用程序,尤其是Enthought中的Canopy 和Continuum Analytics中的Anaconda都是操作便捷的工具;而特定軟件工具是指Python 繪圖庫,如:Bokeh、iPython、Matplotlib、Numpy以及 Seaborn等等。
眾所周知,Python的一大特點在于擁有豐富的第三方庫。但實際上,Python同時擁有標準庫和第三方庫兩類。標準庫在下載Python安裝包時即同時配備完成,方便用戶隨時調用;而第三方庫需要另外新安裝才可運用。
數據可視化旨在借助圖形化手段,將數據信息進行有效清晰地傳達與展示。實際上,數據可視化技術在廣義上包含四種概念:數據空間、數據開發、數據分析、數據可視化。本文從狹義上研究數據可視化技術,即將大量離散數據集通過圖像、圖形等形式進行直觀表現,并利用相關數據分析工具發現和挖掘潛在信息。
數據可視化的應用可以分為三類:報表類、BI分析工具、數據可視化工具(國內)。其中,報表類似JReport、Excel、FineReport思邁特軟件(Smartbi)報表為代表;BI分析工具以Style Intelligence、BO等為代表;國內的數據可視化工具則以BDP商業數據平臺、FineBI商業智能軟件等為代表。
數據可視化的起源可以追溯到20世紀50年代時計算機領域圖形學的早期,首批圖形圖表便是人們利用計算機創建的。數據可視化的發展可具體分為三個階段:科學可視化、信息可視化、數據可視化。科學可視化起源于1987年,由布魯斯·麥考梅克、托馬斯·德房蒂和瑪克辛·布朗三人共同編寫的美國國家科學基金會報告《Visualization in Scientific Computing》。這份報告極大地刺激并促進了數據可視化領域的發展,并強調了基于計算機的可視化技術方法需要創新的必要性。
數據可視化在國外先行發展。1990年,IEEE舉辦了首屆IEEE Visualization Conference,匯集物理、生物醫學、圖形學、計算機等領域或交叉學科領域的研究人員作為學術群體,鼓勵其參與并從事可視化研究。近年來,國內外各行業研究人員對可視化研究愈發重視,不斷突破領域瓶頸,將可視化技術之發展至更多行業(地理學、天文學、氣象學等)和社會群體(政府、企業等)。事實上,很多互聯網公司在可視化領域也開拓了很多實踐,如2013年,由微軟開放的3D數據可視化工具—一“GeoFlow”,通過二維數據表或三維垂直圖的方式呈現,支持Excel Data Model和PowerPivot數據模型和多種可視化類型。
1. Politic(政治)分析
數據可視化是當前政府發布數據的重要方式,因其具有直觀、易懂等特點,便于向不熟悉具體情況的普通大眾解釋數據。同時,圖文并茂的形式更容易引起人們的關注和興趣,利于數據普及宣傳。當前,國家正推進傳統數據形式向數據可視化方向發展,以進一步完善數據領域的全方面均衡發展,利用數據可視化在分析和科普宣傳方面的獨特優勢,將數據可視化解讀運用到各行各業中去,推動各行業的數據發展,促進當前統籌規劃格局的進一步提升。
2. Economic(經濟)分析
數據可視化在金融分析領域有良好的現實應用基礎和巨大的發展前景。數據的可視化處理便于研究人員掌握當前經濟領域政策變動和相關數據情況,還可以在數據之間建立相關聯系,便于進一步分析總結,以便在已有數據的基礎上對某一行業或領域做出未來遠景展望和相關規劃。數據可視化在當前經濟領域已經有了較為廣泛的應用,但仍有較大進步空間。
3.Society(社會)分析

圖1 貨幣供應量當月對比圖
數據可視化技術的應用能夠較好地對社會經濟研究提供分析參考,通過直觀的視覺表現,能夠將復雜的數據經過處理后,以圖文形式展現出來,表明當前社會、行業或某領域的發展狀況或趨勢。這對于研究社會現象、預測發展趨勢、制定未來計劃等方面,具有重要的利用價值和研究意義。
4.Technology(技術)分析
當前,數據處理主要借助計算機手段,運用軟件對所搜集到的信息進行處理,擁有多種方式方法,經過特定條件篩選和選擇的數據匯集,為人們想要得到的數據信息,相關人員以此對過往情況加以判斷,并通過其中的蛛絲馬跡對未來預期作出合理猜想。
在數據可視化這一環節,目前已有相關軟件如:BIEE、Microstrategy、Yonghong的Z-Suite等,能夠幫助專業技術人員對數據進行具體分析和可視化呈現。在當前大數據時代,數據可視化技術的發展和進步是一個大趨勢。未來,隨著數據可視化方法和工具的迭代更新,數據可視化技術必將擁有更廣闊的應用前景和發展舞臺。
銀行未來發展的關鍵是強調效率、精準營銷。為提高銀行對業務的掌握和運用,國內領先的數據智能踐行者根據杭州銀行的現狀,為其定制了數據可視化平臺,并將銀行現有的不同業務板塊間數據融合、統一展示,實現實時數據對接,增強銀行對其各項業務運行的掌控和對用戶畫像分析的能力。

圖2 2020年7月21日銀行金融數據大盤效果圖(數據來源:知乎)
1.量化投資策略
量化投資策略是指利用量化的方法,進行金融市場的分析、判斷和交易的策略、算法的總稱。其策略可應用于量化選股、量化擇時、算法交易股指期貨套利、商品期貨套利、統計套利,風險控制,資產配置等。
在大數據時代,量化投資通過數量化方式及計算機程序化發出買賣指令,從而獲得穩定收益,獲國內外眾多投資者的青睞。由于其投資業績穩定,市場規模和份額不斷擴大,投資者對于這種投資模式愈發認可。事實上,互聯網的發展使得新概念在世界范圍的傳播速度非常快。作為一個概念,量化投資并不算新,國內投資者早有耳聞。但是,真正的量化基金在國內還比較罕見。同時,機器學習的發展也對量化投資起了促進作用。
2.指標選擇
初入股市,投資者最先學習的便是觀察和了解K線圖和日均線,從而進一步接觸到移動平均線(MA)理論。這是股市最常見的一種技術分析方法,對交易有較好的指導作用。
投資者能夠較好地運用移動平均線理論,不僅能判斷行情的真正趨勢,還能獲取可觀利潤。但移動平均線理論仍存局限性:其為股價定型后產生的圖形、反應較慢,且不能反應股價在當日的變化及成交量的大小。本文將選取5日均線和20日均線控制全倉買賣個股比亞迪(002594),量化交易股票進行分析。
3.代碼運行及實證分析

圖3 Python量化投資部分代碼
選定個股為比亞迪(002594),設置該策略回測區間為2020年1月1日-2021年5月22日 ,初始資金為10萬元,回測頻率為日級。回測結果如下:

圖4 基于量化策略的比亞迪(002594)回測結果
由圖4顯然得知,在2020年1月-2021年5月期間,該策略收益為262.55%,策略年化收益162.24%,超額收益為正,表現遠超滬深300指數。可見,數據可視化對于證券投資的操作指導意義十分明顯,直觀清晰地判斷了股票走勢及買賣交易點設置。結合Python在機器學習中算法領域的突出表現,挖掘數據內在的價值指日可待。但是市場仍存在風險,如何把控風險成為數據可視化的新難題。
數據可視化近20年的開源運動,挖掘了眾多基于數據信息的重要資源,直接有力提高了信息技術的發展速度,并快速帶領世界進入大數據時代。Python在對金融數據進行可視化處理之后,能夠有據可查地制定更加科學嚴謹的執行策略,更精準地把握投資者和投資機構的投資行為、特征以及金融風險,有助于為投資者帶來更加優質的投資指導。