據說IBM公司早期生產的打孔機曾經在20世紀三、四十年代用在許多國家的人口統計工作中,一臺打孔卡,每天竟可完成45萬人的資料分析。就在同期,中國政府也進行過一次全國人口普查,由于當時社會動蕩不安,大片國土又淪陷日本侵略軍之手,要做這件事非常困難,而且也沒有打孔機這樣的先進設備。除了把統計表格盡可能地層層分發到各地,對無法發表格統計的地區,統計部門則根據該地區食鹽用量的多少,來推算人口數,因為一個人每天的用鹽量是可以估計的。這樣經過逐級統計核算,終于完成了全國的戶口統計,確定那時中國人口數為四億五千萬,這個數字一直延用到全國解放。
新中國成立60余年,國家進行了6次人口普查,2011年4月28日,國家統計局發布了第六次全國人口普查的公報,全國總人口達到1370536875人。從四億五千萬到1370536875,這不僅是統計制度完善的表現,更是統計手段不斷提升的結果。
在信息社會全面到來的今天,統計工作不但關系到健全國民經濟核算體系,而且對于掌握國情國力有著密切關系。因此,近年來統計數據采集、審核、處理、上報、存儲、共享和發布的信息化建設步伐越來越快。
信息化創造統計新機遇
據了解,從1986年國家統計局計算中心成立開始,統計信息化系統相繼承擔了多次大型普查數據處理工作任務。從最初提倡的“微機起步”、以小帶大 ,之后經過聯網直報的發展,逐漸發展到了現在構建統一的核心業務平臺。
2010年3月,國家統計局局長馬建堂在浙江調研時曾強調,統計工作現代化的根本是實現工作的規范化和統計數據生產過程的信息化。馬建堂表示,加快統計信息化建設,關鍵要抓好報表布置、數據采集、數據處理上報、數據存儲共享四個環節的工作。確保各項統計調查工作的標準化、規范化,從而獲得真實的原始統計數據,消除中間環節對統計數據的干擾,實現各級統計機構在線共享原始數據,以提高數據的應用效能。
國家統計局數據管理中心許劍毅向記者表示,目前統計信息化面臨兩個最主要的問題:一是處理信息量大,各項國情、國力調查,社會信息發展信息調查都是海量數據;二是數據處理時效性很強,有些數據往往要在短時期內算出結果來,因此帶來了數據的高并發特點。
為了解決上述兩大問題,許劍毅介紹說:“國家統計局正在建設統一的核心業務系統,對國家統計局的資源進行整合,在這個系統架構里面采用了IBM Power系統服務器。這套系統架構從登錄系統到數據報送完畢整個業務過程中,沒有一個單一故障點,能夠解決上報數據的安全問題。”
許劍毅表示,依托這套核心業務系統,國家統計局要打造一個“統計云”。“統計系統從上到下是一個龐大的系統,從國家到省、地、縣、鄉,一直到村有六級系統。各級的統計工作有些是全國統一的,有些是不統一的。以至于各級應用散亂,大家都在建設自己相應的IT系統,這就造成了一種浪費。通過這樣一個統一的核心業務系統,我們要為六級系統提供一個‘統計云’,統一各級的應用服務。”
統計云整合上下資源
雖然“統計云”只有三個字,但是實現起來還是有相當困難和風險的。許劍毅坦言:“提出搞統計云,我們一開始也是有風險的,因為沒有別人成功實施的案例可以參考,我們也是在摸著石頭過河。最初我們對系統的并發處理能力并不滿意,但是最后經過調優以后,IBM Power系統的性能發揮出來后,大家的觀念才有所改變。其實我們對這個系統還是有信心的,因為我們對整個方案進行了充分的準備和論證,前后花了近一年半的時間。”
國家統計局數據管理中心王洪琛處長表示,國家統計局在構建“統計云”的時候,也面臨著如何實現大集中核心資源整合的問題。“為此我們就想到了虛擬化和資源池的建設,實際上在PC服務器這個層面我們已經采用虛擬化的技術實現了服務器整合,并且效果還是不錯的。目前,我們規劃有四個系統資源池,分別是Web服務器資源池、應用服務器資源池、數據庫資源池、存儲資源池。”
王洪琛介紹說,在數據庫資源池中一共有兩臺IBM Power595和四臺IBM Power780構成,通過IBM虛擬化技術,整個資源池可以在滿足現有應用橫向擴展需求的同時,將對整個系統硬件資源分配進行調整,在不影響人口普查與企業聯網直報兩大業務的前提下,配置部分資源用于新增的其他業務。
據許劍毅介紹,雖然全部建設還未完成,但是“統計云”已經在第六次人口普查中得到了應用,整個系統的協調、運算的能力得到了驗證。許劍毅相信,隨著系統不斷完善,“統計云”能夠真正實現對資源的整合,統一全國的統計業務。“我們的目標就是,今后任何一個企業無論在什么地方,登錄這樣一個平臺以后,就可以完成數據的報送任務。同時從國家到村每一級的統計人員,當他登錄這個平臺以后,就可以看到自己所管轄范圍內的業務的報送情況,并且在自己的權限內,可以對這些數據進行業務范圍內的處理。”許劍毅說。