文/高潔琳,廈門大學
伴隨科學技術的日新月異,尤其是網絡技術的快速發展,社會中的數據積累越來越多,造成了大量的數據信息,我們稱之為“大數據”。如今,數據存在于各行各業的每一個領域中,是生活生產的一個重要因素。針對大數據的使用和發掘,也昭示著又一輪的生產力增長和消費富余潮流的到來。
總結目前已有的宏觀經濟的預測分析的理論、方法和使用現狀,宏觀經濟預測模式主要有兩種:由理論來驅動的構造形態和由數據來驅動的時序形態。
由理論來驅動的構造模式,是以宏觀經濟的理論為基礎來組建數理去分析的模型。之后“系統化”,構成經濟計量的形態,使用統計的數據來進行參考數據的估計,用來解析宏觀經濟之間變化的數量關系,并對其變量進行預測,而其中就包括布魯金斯模型、可計算一般均衡模型、極限邊界分析模型、隨機動態一般均衡模型等等。這些模型的計算過程比較復雜多樣,但解析和預測范圍較廣,擁有較好的經濟了解性。
以布魯金斯模型為例,該模型是反映美國經濟的大型經濟計量模型。是由布魯金斯研究所在60年代初所研制的。其模型不僅包括了176個內生變量,89個外生變量。它主要是在經濟增長的結構以及經濟增長結構的解析和政策評價中應用。模型是以1949-1960年季節調整的季度資料預估的,其資料大約含有60個觀測值。就是利用這種小型的樣本來預估大的樣本模式的方式,憑靠分塊的遞歸結構來進行,也就是把模型分解成相互有影響的幾個板塊,對主要板塊的每個方程式進行估計,然后對整個模型重新預估時,再衡量各個板塊之間的相互影響。龐大的模型包含了勞動、社會經濟、就業、失業、生產、薪資等各個領域。
由數據來驅動的時序形態指的是不依靠其它經濟理論,而單純的去依靠各種數據的規律去進行建造模型。包含自回歸移動平均模型、擴散指數法、灰色預測法、指數平滑法、結構向量自回歸模型、移動平均法、自回歸條件異方差模型全球向量自回歸模型等。這種模型并不強調內有經濟理論的邏輯方式,其更多的是注意變量自身的轉變特點和在時間上的延展性,并且利用這樣的數據內有變化來預測未來。以擴散指數法為例,擴散指數法是根據一批領先經濟指標的升降變化,計算出上升指標的擴散指數,以擴散指數為依據來判斷未來的經濟景氣情況的預測方法。利用一組經濟指標進行綜合考察,避免僅依靠個別領先指標作出判斷預測的弊端。進而建立一套能夠全面、及時、準確地反映監測預警對象發展變化整體狀態的指標體系。例如:利用擴散指數法測算郵政業務的發展,統計時間序列因素,來分析預測郵政業務的經濟發展的波動變化。
傳統宏觀的經濟預測方式,歷經發展、改革和創新,已經達到相對完備,無論是數據驅動模式還是理論驅動模式,在宏觀的經濟預測發展范圍內都發揮著至關重要的作用。而也正是因此,這兩種模式都還在依靠經濟系統內在規律的延展性。目前宏觀經濟的預測模式使用有效性是經由歷史的數據去發現經濟的運行規律,通過歷史的數據規律去預測經濟未來的發展情況。
經濟的運行規律在短暫時間內產生變化的可能很小,但隨著時間的增長,與原來的經濟運行發展規律產生變化的可能性會越來越大。所以,已有的宏觀經濟預測模型的效用更依賴于使用的數據是不是足夠準確。而這也是宏觀經濟是否會產生誤差的重要原因,是傳統宏觀經濟預測中的根本問題。
傳統數據中主要有以下幾個方面的問題。
1.2.1 獲取數據的成本較高
以往的數據在收集的過程中是比較繁瑣的,它需要投入大量的時間、經歷、耗費人力、物力,獲取數據的成本相對來說是比較高的。
1.2.2 不及時
一般來講,由于宏觀統計在獲取過程中較復雜,而且要在經濟的運行發生之后,再經過各個部門的收納匯總,才會形成,因此宏觀統計的數據需要的時間比較長,一般都會延后一個季度的數據,更甚至會延后一年,因此很不及時。
1.2.3 統計會出現誤差
由于數據是人為的搜集、獲取和匯總,時間較長,人為參與度較大,其過程也比較繁復,因此,很難保證在整個數據的形成中會完全精準。而這也正是導致預測出現誤差的一個不可缺少的原因。
1.2.4 抽樣式調查
由于統計樣本較多,所以統計的難度和成本也會增加,因此,會使統計樣本與統計成本達到一個平衡。例如:居民消費能力的統計,采用的就是抽樣調查的方式,依據“定區域、定時、定人”的原則,直接去抽查采集最原始的數據。
1.2.5 微觀不精
目前已有的宏觀經濟指標都是整體性的指標,例如:消費者物價指數,包含了衣、食、住、行、醫療、教育、娛樂、服務等各個方面,幾百個分類的商品和價格,但是,這種整體性數據指標,卻很難分類到具體行業指標。例如:想要了解長白山煙草的價格指標,就無法得知。
也正是因為傳統的數據存在的問題,致使宏觀經濟在預測過程中很難達到有時效性,是目前傳統數據分析中一直存在的問題。
在經濟領域中使用“大數據”,需要確定其概念和特征,清晰其與傳統宏觀經濟的差別,這樣才能精確的掌握分析方向。雖然大數據的具體概念仍然沒有構成一致的觀點,但卻可以從專家以及學者的定義中找到其規律。
2011年,DougLaney提出了“3V”模型,并在此基礎上,提出了新的特性,整體構成了“4 V”特征,認為大數據是具有規模性、高速性、多樣性、價值性的。而國內的部分學者也對其有所定義。李國杰等人論述了大數據現有的狀態以及其意義。闡明了大數據目前所面對的難題和挑戰,聚焦大數據查閱、分析的技術,對大數據的定義進行解析以及其所需的幾個重要特點。
綜上對“大數據”的闡述和定義,能被稱為“大數據”的具有以下特點:
2.1.1 數據量很大
以往的數據量大多在KB、MB,而大數據信息量則在GB以上,甚至是TB、PB、EB。
2.1.2 以往的計算機無法分析處理大量的工作。
傳統的計算力有限,面臨大量的數據,無法承受分析處理大量的計算工作。
2.1.3 數據信息多、廣
大數據的信息涉及較多、較廣,包含了音頻、視頻、文字、圖片、網絡搜集等等。
2.1.4 可用價值低
由于數據龐雜,因此也會有一些無用、無幫助的數據,它是不能被稱為“大數據”的,有價值的“大數據”是指能夠提供精準的數據。但是因為數據量較大,個體能夠被提供的數據價值就會被降低,所以只能從海量數據中提取有價值的完整的信息。
在當今時代,大數據以互聯網為依托,顯示出了它獨有的優勢。
2.2.1 時效性
由于互聯網累計的數據會直接存儲至網絡中,所有交易、價格等發生時,都會在網絡中留下痕跡,通過一定的技術可以被提取出來,用作分析和處理相關問題,因此解決了傳統數據提取中的滯后性問題。
2.2.2 精確性。
網絡數據直接存留,沒有人為的參與和加工處理,而更加精準。
2.2.3 成本相對較低
網絡數據產生時,會自動保存記錄下來,不需要大量的人力搜集,使用技術可直接提取整理,大大的減少了成本的投入和人力的輸出。
2.2.4 樣本量大
大數據通過互聯網可以獲取80%—100%的樣本信息,而不需要通過抽取樣本的方法來獲取信息,推斷總體數據信息。這樣一來,可用的樣本量是巨大的,并且能無限接近樣本總體,能夠獲得更精準、更全面的信息。
目前,國內外部分學者在根據大數據優勢突破傳統經濟的宏觀預測問題方面做了很多嘗試。例如:研究社會消費問題的數據,它是用來測算美國個人的消費指標,經過比對傳統的數據為標準和含有Google Insights指標測算美國個人消費的增長,加入大數據模式后能夠提高到二十個百分比的精確率。Penna and Huang 也通過用Google搜索方式,對眾多的語句進行,來組建美國的消費者個人的SBI,這款數據反應及時,同樣可以預測常用消費者的信心指數,SBI明顯比常用消費者的信心指數更有優勢,它能夠提供更加穩健、更加獨立的信息。
本文通過對當今社會宏觀經濟預測解析的現實狀況,在確定“大數據”概念特征的前提下,通過宏觀經濟預測中對比“大數據”與傳統統計數據的優勢,指出了其在理論和使用過程中呈現的問題和缺陷,包含數據樣本來源少、不精確、數據海量、人力不足、成本較大等方面的問題,也點出了“大數據”在傳統基礎上,突破局限,各方面逐漸完善的優勢,彰顯了五大優勢:成本低、及時、準確、細化到顆粒和樣本量巨大。目前,“大數據”已經被專家和學者們廣泛地用到了宏觀的經濟預測分析中,但還需繼續進行拓展,而這也是“大數據”在未來宏觀經濟預測中發展的重要方向。