◎王忠
3月29日,奧巴馬政府在白宮網(wǎng)站發(fā)布了《大數(shù)據(jù)研究和發(fā)展倡議》(Big Data Research and Development Initiative),旨在提升利用大量復(fù)雜數(shù)據(jù)集合獲取知識和洞見的能力,并將為此投入兩億美元以上資金。近年來,大數(shù)據(jù)對社會經(jīng)濟發(fā)展的預(yù)測能力已經(jīng)嶄露頭角。例如,利用谷歌住房搜索查詢量變化對住房市場發(fā)展趨勢進行預(yù)測,明顯比不動產(chǎn)經(jīng)濟學(xué)家的預(yù)測更準確。因此,奧巴馬政府發(fā)布研發(fā)倡議,并公布了相關(guān)部門的在研項目。我國應(yīng)充分意識到大數(shù)據(jù)技術(shù)的重要戰(zhàn)略價值,盡快開展戰(zhàn)略性研究,加大研發(fā)支持力度,加快推進應(yīng)用以及加強基礎(chǔ)大數(shù)據(jù)集建設(shè)。
2011年,總統(tǒng)科學(xué)技術(shù)顧問委員會(President’s Council of Advisors on Science and Technology)曾提出一份建議,認為大數(shù)據(jù)相關(guān)技術(shù)具有重要戰(zhàn)略價值,而聯(lián)邦政府對其研發(fā)投資不足。作為建議的反饋,白宮科技政策辦公室發(fā)布了《大數(shù)據(jù)研究和發(fā)展倡議》,并組織了大數(shù)據(jù)高級監(jiān)督小組(Senior Steering Group on Big Data)協(xié)調(diào)和拓展政府在這一重要領(lǐng)域的投資。
《大數(shù)據(jù)研究和發(fā)展倡議》提出,將提升美國利用收集的龐大而復(fù)雜的數(shù)字資料提煉真知灼見的能力,協(xié)助加速科學(xué)、工程領(lǐng)域創(chuàng)新步伐,強化美國國土安全,轉(zhuǎn)變教育和學(xué)習(xí)模式。《大數(shù)據(jù)研究和發(fā)展倡議》還承諾將在科學(xué)研究、環(huán)境保護、生物醫(yī)藥研究、教育以及國家安全等領(lǐng)域利用大數(shù)據(jù)技術(shù)進行突破。
在白宮科技政策辦公室(OSTP)發(fā)布大數(shù)據(jù)研發(fā)倡議時,美國國家科學(xué)基金會(NSF)、國家衛(wèi)生研究院(NIH)、國防部(DOD)、能源部(DOE)、國防部高級研究局(DARPA)、地質(zhì)勘探局(USGS)等六個聯(lián)邦部門和機構(gòu)承諾,將投入超過2億美元資金用于研發(fā)“從海量數(shù)據(jù)信息中獲取知識所必需的工具和技能”,并披露了多項正在進行中的聯(lián)邦政府計劃,主要內(nèi)容如下:美國國家科學(xué)基金和美國國家衛(wèi)生研究院主要推進大數(shù)據(jù)科學(xué)和工程的核心方法及技術(shù)研究,項目包括管理、分析、可視化、以及從大量的多樣化數(shù)據(jù)集中提取有用信息的核心科學(xué)技術(shù);國防部高級研究局項目主要推進大數(shù)據(jù)輔助決策,集中在情報、偵查、網(wǎng)絡(luò)間諜等方面,匯集傳感器、感知能力和決策支持建立真正的自治系統(tǒng),實現(xiàn)操作和決策的自動化;美國能源部試圖通過先進的計算進行科學(xué)發(fā)現(xiàn),提供2500萬美元基金來建立可擴展的數(shù)據(jù)管理、分析和可視化研究所;美國地質(zhì)勘探局通過給科學(xué)家提供深入分析的場所和時間、最高水平的計算能力和理解大數(shù)據(jù)集的協(xié)作工具,催化在地理系統(tǒng)科學(xué)的創(chuàng)新思維。
隨著大數(shù)據(jù)技術(shù)研究和應(yīng)用的迅速發(fā)展,奧巴馬政府意識到大數(shù)據(jù)技術(shù)的重要性,將其視為“未來的新石油”,作為戰(zhàn)略性技術(shù)大力推動其發(fā)展。為了動員其他的利益相關(guān)者,《大數(shù)據(jù)研究和發(fā)展倡議》提出聯(lián)邦政府希望與行業(yè)、科研院校和非盈利機構(gòu)一起,共同迎接大數(shù)據(jù)所創(chuàng)造的機遇和挑戰(zhàn)。某種程度上,大數(shù)據(jù)技術(shù)在美國已經(jīng)形成了全體動員的格局。
一是政府部門資助大數(shù)據(jù)技術(shù)研發(fā)和應(yīng)用。研發(fā)方面,除了《大數(shù)據(jù)研究和發(fā)展倡議》中提及的六個部門,還有多項正在進行中的聯(lián)邦政府計劃,以應(yīng)對大數(shù)據(jù)時代以及大數(shù)據(jù)革命帶來的機遇和挑戰(zhàn)。這些披露的計劃涉及面廣,研發(fā)種類很多。例如,國土安全部項目主要推進可視化數(shù)據(jù)分析,應(yīng)用領(lǐng)域主要為自然災(zāi)害、恐怖事件、邊境安全、網(wǎng)絡(luò)威脅等。應(yīng)用方面,美國也開始啟動相關(guān)項目。例如,3月30日美國國家衛(wèi)生研究院宣布世界最大的遺傳變異研究數(shù)據(jù)集——國際千人基因組項目(截至目前為止數(shù)據(jù)已經(jīng)達到大約200T B),由亞馬遜網(wǎng)站免費云服務(wù)(AWS)提供相關(guān)支持。此外,美國科學(xué)與技術(shù)政策辦公室(OSTP)正計劃支持新建一個論壇,致力于促進公共組織和私營部門大數(shù)據(jù)方面的伙伴關(guān)系。
二是非營利機構(gòu)提供公共服務(wù)。
行業(yè)協(xié)會組織積極提供公共服務(wù),例如“數(shù)據(jù)無邊界(Data Without Borders)”通過無償?shù)臄?shù)據(jù)收集、分析,以及可視化為非營利性組織提供幫助。高等院校開始培育相關(guān)人才。有些大學(xué)也已經(jīng)開始創(chuàng)建大數(shù)據(jù)相關(guān)的新課程,這些全部課程的學(xué)習(xí),將培養(yǎng)出下一代的“大數(shù)據(jù)科學(xué)家”。
三是企業(yè)加緊開展市場布局。大數(shù)據(jù)最先被互聯(lián)網(wǎng)企業(yè)所重視,如網(wǎng)飛(Netflix)和Facebook等大型科技公司巧妙地利用用戶遺留在網(wǎng)絡(luò)上的數(shù)字痕跡(digital traces),通過算法分析用戶需求,然后向用戶推薦觀看電影或者與某人聯(lián)系的建議。現(xiàn)在,美國一些大型公司已經(jīng)開始贊助大數(shù)據(jù)相關(guān)的競賽,并且在為高等院校的大數(shù)據(jù)研究提供資金。EMC、惠普(微博)、IBM、微軟(微博)在內(nèi)的IT巨頭紛紛通過收購“大數(shù)據(jù)”相關(guān)企業(yè)來實現(xiàn)技術(shù)整合。
隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,數(shù)據(jù)將像能源、材料一樣,成為戰(zhàn)略性資源。如何利用數(shù)據(jù)資源發(fā)掘知識、提升效益、促進創(chuàng)新,使其為國家治理、企業(yè)決策乃至個人生活服務(wù),是大數(shù)據(jù)技術(shù)的追求目標。隨著技術(shù)不斷成熟,大數(shù)據(jù)技術(shù)將成為國家治理的重要工具。例如,聯(lián)合國已經(jīng)推出了名為“全球脈動”(Global Pulse)的新項目,希望利用“大數(shù)據(jù)”預(yù)測某些地區(qū)的失業(yè)率、支出削減或是疾病爆發(fā)等現(xiàn)象,其目標在于利用數(shù)字化的早期預(yù)警信號來提前指導(dǎo)援助項目。在大數(shù)據(jù)領(lǐng)域的落后,意味著國家安全將在數(shù)字空間出現(xiàn)漏洞,國家創(chuàng)新能力將在未來國際競爭中落后于人。因此,我國應(yīng)加快推進大數(shù)據(jù)技術(shù)研發(fā)與應(yīng)用。
一是充分重視大數(shù)據(jù)的戰(zhàn)略價值,盡快開展戰(zhàn)略性研究。組織各方力量,對先發(fā)國家大數(shù)據(jù)技術(shù)研發(fā)進展進行跟蹤研究,深入分析大數(shù)據(jù)國內(nèi)外發(fā)展現(xiàn)狀和趨勢,明確大數(shù)據(jù)關(guān)鍵技術(shù),制定技術(shù)發(fā)展路線圖。
二是加大研發(fā)支持力度。在明確關(guān)鍵技術(shù)的基礎(chǔ)上,確定重點支持領(lǐng)域,加大研發(fā)支持力度。整合核高基、電子發(fā)展基金、云計算專項、物聯(lián)網(wǎng)專項等項目,支持大數(shù)據(jù)技術(shù)的開發(fā)、研究和應(yīng)用示范,引導(dǎo)企業(yè)加大研發(fā)力度,實現(xiàn)關(guān)鍵技術(shù)突破。
三是加快推進應(yīng)用。在政府部門和公用事業(yè)的信息化應(yīng)用中采購大數(shù)據(jù)技術(shù),以政府采購引導(dǎo)國內(nèi)大數(shù)據(jù)發(fā)展。結(jié)合當前的云計算、物聯(lián)網(wǎng)等試點工程,積極開展大數(shù)據(jù)技術(shù)應(yīng)用,充分發(fā)揮示范效應(yīng),帶動社會其他領(lǐng)域的大數(shù)據(jù)應(yīng)用。根據(jù)國外應(yīng)用經(jīng)驗,可以確定一些重點應(yīng)用領(lǐng)域,例如電子政務(wù)、醫(yī)療、教育、能源、交通等,以點帶面加速大數(shù)據(jù)技術(shù)的應(yīng)用,并總結(jié)示范經(jīng)驗予以推廣。
四是加強基礎(chǔ)大數(shù)據(jù)集建設(shè)。一方面,完善數(shù)據(jù)采集體系。大數(shù)據(jù)需要有大量的數(shù)據(jù)源。應(yīng)建立特定主題的數(shù)據(jù)監(jiān)測系統(tǒng),如交通、能源、醫(yī)療、自然災(zāi)害等專題建立基礎(chǔ)數(shù)據(jù)庫,持續(xù)不斷收集相關(guān)數(shù)據(jù),為大數(shù)據(jù)發(fā)展提供基礎(chǔ)。另一方面,推動國家基礎(chǔ)數(shù)據(jù)開放共享。美國十分重視政府信息資源的共享和利用,將“共享第一”作為美國聯(lián)邦I(lǐng)T共享服務(wù)戰(zhàn)略的基礎(chǔ)范式,力推政府開放平臺(Open Government Platform)。我國應(yīng)加快推進政府信息資源共享,尤其推進數(shù)據(jù)資源共建共享,給大數(shù)據(jù)技術(shù)發(fā)展提供原材料,促進大數(shù)據(jù)成果廣泛應(yīng)用。