馬文強
(中共云南省委黨校 信息技術部,云南 昆明 650111)
大數據是信息化發展的高級階段,是信息價值的載體,是巨量數據資料的集合。作為現代信息社會最重要的一種戰略資源,大數據正在對社會發展進步產生深刻影響,對人類歷史進程譜寫著新的華麗篇章。科學認知大數據,重視大數據建設,運用好大數據,對我們的社會、工作、生活等各個方面都具有重大而深遠的意義。
大數據是一種能保護環境、取之不盡、用之不竭、成本低廉、可實現共享并循環利用的戰略資源,須要建立科學、全面、系統、長遠、開放、協作、共享的大數據意識,不斷地思考、運用、創新、拓展、擴散,這是一個與時俱進的辯證的動態過程,所以,在看待大數據時需要全新的視閾。
1.容量的大。不僅要看到大數據物理量的大,也要看到大數據互連互通、拓展量的大;既要看到互聯后物理量大,更應看到技術處理后虛擬增值量的大小。
2.效應的大。不僅僅要看到大數據在物理屬性方面的“大”,更要看到大數據在創造社會價值、變革行為方式等方面社會效應的“大”。
3.作用的大。不應只看到大數據在政府社會治理、推進社會進步等社會效果的“大”,更強調政府對社會治理、推進社會進步等方面發揮的重要作用和影響的“大”。
1.技術創新價值。要注重大數據在開發、應用、推廣、擴散等技術應用中創造的價值,更應看到技術創新的增量價值。
2.社會效應價值。2015年9月,我國政府公布了《促進大數據發展行動綱要》,標志著我國大數據時代的到來。《綱要》指出大數據在社會治理、經濟運行、智惠民生、創新驅動、產業發展等方面具有重要作用和效果,為我國穩增長、促改革、調結構、惠民生及推動政府治理能力現代化提供了新思路、新方向、新動能。在看待大數據開發、應用、推廣、擴散等技術價值時,更應注重其社會效應。
3.社會進步價值。大數據成為加速社會進步、促進經濟發展、加快創新步伐和提升國家競爭力的新引擎,引起社會結構的重大變革。既要關注其社會擴散效果,又要關注其推進社會進步的價值。
1.獨創思維。注重意識、理念、方式的更新,更注重思維模式、內容創新和技術革新,強調前無古人、后無來者的獨創思維。
2.廣泛思維。大數據鼓勵自覺思維、善于思維、勇于思維等多態思維;也鼓勵單向思維、平面思維、立體思維、棱形思維等多度思維;更鼓勵聯想思維、關聯思維、想象思維等廣泛思維模式。
3.科學思維。大數據主張互聯、開放、共享、協作等為核心價值的思維理念,更重視活躍思維、細膩思維、獨創思維、縝密思維、多維度思維、事實和證據思維等,沒有科學思維,就沒有智慧思維。
大數據不僅指數據量大,而且涉及關于數據的技術、方法、相關軟件和設備等內容的巨量資料,所以,大數據是一個用常規思維方式根本無法理解的復雜的綜合稱謂。
1.應用技術。眾所周知,1995年前,用DOS操作系統管理和使用計算機,系統所用的符號全是英文、數字和標點符號,難閱讀、理解、接受和操作,是非英語民族的共同感受。因為DOS操作系統是以比爾·蓋茨為首的美國人開發并推廣全球使用的,英語是他們的母語。今天,我們使用的高效、易閱讀、易接受、可視化窗口式的操作系統WINDOWS,是我國通過漢化、可視化、去功能化、窗口化等技術處理后才實現的,這樣,英文操作系統才實現其為我所用。與此相仿,今天的大數據,要為我國的社會、工作、生活等服務,也離不開強有力技術支撐。
2.創新技術。黨的十八大以來,習近平總書記多次強調科技創新的重要性,要掌握核心技術,市場換不來核心技術,有錢也買不來核心技術,必須靠自己研發;核心技術受制于人是最大的隱患。大數據時代,我國的建設和發展,離不開技術創新,特別是核心技術的創新。
3.綜合技術。建設大數據,管理大數據,開發大數據,應用大數據,除高效的可視化分析技術外,還應具備數據挖掘算法、預測性分析能力、語義引擎和數據質量管理等技術支撐,實現對海量數據的云查找、計算、處理、挖掘和應用,才能找到并獲得高價值數據信息。對具有高價值數據信息的挖掘、獲取、分析、管理、應用等過程,就是大數據技術的綜合表現。
大數據能力的彰顯是通過對數據信息進行深度挖掘,復雜的重組,各種形式反復整合,價值充分利用等來實現的。
1.關聯能力。將存儲在不同媒體介質上,看似零散而不相關的數據進行各種可能的關系設計、整合、“重組”,尋覓數據間可能存在的某種關聯,才能找到其價值所在并得到有效發揮。對數據資源的儲備、高效搜索、查詢及所進行挖掘、整合、“重組”,是一個復雜而繁瑣的具有極大不確定性的關聯過程。
2.創新能力。在找尋、整合、“重組”、挖掘數據資源可能存在價值的關聯過程中,需要分析數據的作用,挖掘數據的潛在價值,進而才能實現數據價值的創新。這種創新可能對社會進步和人們的工作、生活、娛樂等產生一定的影響:催生新的產業或促進產業轉型升級,如互聯網安全產業;產生某種新產品或新行業,如機器人和智慧家政;引起部分失業和再就業,如電力公司抄表員消懈;提升人類生活品質,促進社會進步,如5G落地和8G全面體驗。
3.創奇跡的能力。大數據為基礎,人工智能為平臺,云計算為工具,網絡為中心,人類以此創造奇跡并不多見。被稱為“新世界七大奇跡”之一的港珠澳大橋,[1]采用智慧設計、建造、運營、管理、維護、微控等方式建成,是我國運用大數據創造世界奇跡能力的展現。
1.關聯思維。大數據是一種創新思維,是一種多維度思維,是一種對資源整合、重組思維,是一種解放人性、換位思考、放飛理想思維,是一種以“開放、共享、協作”為核心價值觀的關聯思維。
2.開放思維。大數據思維強調:從信息公開到開放數據,從開放數據到開放數據接口等跨界、跨行、跨區域的大眾化、網絡化、普遍性的開放思維,互聯、互通、共享、協作等理念是對數據信息獨占模式的變革。隨著數據開放共享程度的提高,社會的開放共享程度也在提高,大數據對人類貢獻也會不斷提升。
3.創新思維。攝像頭用于安保、交通、監管等方面是社會慣例、常規思維,而把攝像頭用于管控、人文、定位、施救等跨行業或系統,實現資源共享,是對常規思維模式的變革和創新,表現出大數據創新思維具有的互聯性、開放性和價值性。
1.數據性。大數據開啟了一個以數據為基本元素、以數據為戰略資源、以數據關聯萬物的時代。大數據時代,數據決策、數據管理、數據創新、數據驅動等作用彰顯,顛覆性改變著社會經濟形態、國防安全態勢、維穩治理和資源配置模式,從這個角度講,大數據的多寡是一個國家軟實力強弱的重要標志,誰掌握了大數據,就意味著擁有了核心競爭力。
2.創新性。數據驅動樹立的是基于數據、事實、理想等管理分析的創新管理理念,把數據轉為經濟增長方式,服務社會、工作、生活,惠及企業決策及國家治理,倒逼政府適應新時代需求的管理創新。
3.權屬性。對大數據的擁有,意味著對資源的擁有,而資源是有價值和使用價值的,大數據也就有了歸屬權,所以,大數據具有清晰產權、增值效應、方便交易等時代特征。
4.關聯性。社會已經進入一切讓數據說話的時代,使得數據從樣本數據轉向全量數據,從精確性數據轉向多樣性數據,從因果關系數據轉向相關關聯數據,更加強調人、物與自然等相互間數據的關聯與依存。
大數據作為一種綠色、環保、循環、可持續發展的戰略資源,那么,建設大數據,就須從資源、安全、物理等方面進行全方位考量,使其形成長效、穩固、安全的戰略資源庫。
1.建設資源庫。要把時效性強、數據量大、格式結構復雜、技術含量要求高、價值密度低的數據信息視為大數據。信息以數字形式進行收集、存取、加工處理、傳輸和管理。由于數據信息量大且結構復雜,為保證信息安全和方便管理,通常是分門別類集中存儲和管控,須專用的設施和功能模塊予以支撐。
2.壯大資源庫。大數據是一個“無限窮盡”的資源庫。用戶因工作、生活、娛樂等需要,以費用低廉、靈活方便的方式對信息進行包租(流量或時段),通過網絡實現信息傳輸和共享,利用終端使用數據資源。連接用戶和數據資源庫的網絡,猶如連接湖泊、水庫、海洋和自來水用戶間的管道,彼此相連在一起形成的水系(網絡)。資源庫為用戶提供象征生命的“水”的數據資源供給用戶使用,用戶把用過或生產的新的數據不斷地“注入”資源庫,庫中資源越用越多,資源庫就會不斷地“壯大”。
3.利用資源庫。數據庫資源被用戶利用,是一個“借取”的過程,而用戶把使用過或生產的新的數據信息,作為資源無償地“還存”到資源庫中。通過“借取”與“還存”的關系,實現相互協作、共享、互補、動態的依存平衡,形成綠色良性循環。隨著時間變遷和歷史發展,利用價值俞高,作用更加彰顯。
4.作用資源庫。承載信息價值的數據作為資源,且具有核心競爭力的資源,當被擁有、開發和應用時,會對個人、國家和世界產生重大的深遠影響。時至今日,當我們使用大數據資源并使其作用得到充分彰顯時,會對我們的社會、工作、生活等產生多方面的影響。當然,無人能確切地感知或預測,只能對其未來作豐富而深遠的想象。
1.獨立型。據有關媒體介紹,受美國控制和主導的互聯網根服務器全球共有13個,專門負責和管理互聯網主目錄,即互聯網域名,亞洲唯一的根服務器設在日本。從國家長遠戰略利益考慮,有些國家拒絕美國控制,紛紛建立自己的獨立域名系統,脫離美國主導的互聯網,使美國以互聯網控制全球的時代成為過去。世界互聯網形勢的變化,為我國建立自己獨立漢化的網絡系統和安全、保密、個性化的大數據資源庫提供了可能性。
2.技術型。誰擁有高增值的數據越多,則意味著占有的資源越豐富,在戰略視閾更具主動性和更大發展空間,是一個國家或地區具有核心競爭力的標志。實踐證明,技術強,競爭力就強,靠核心技術支持的數據就更安全。建設強大、穩固、長遠、豐富的具有優勢競爭力的大數據資源庫,已經成為大數據時代各個國家、地區、政府、行業、企業的迫切需求。為提升我國的核心競爭力,要通過強強聯合,把世界納入我國大數據資源庫戰略建設的視閾,建設安全型數據資源庫。
3.環境型。人為的、自然的、國防的等安全因素,是大數據資源庫建設過程中最重要的考量因素。2015年8月,天津高新區火災,從根本上改變了騰訊建設大數據的基本思路。騰訊將大數據資源庫建在貴州新安山中,且在全國多地設點布局并成網,是基于安全環境因素的綜合考量,是一種具有全面安全戰略視閾的正確選擇。
1.儲量型。我國IT界具有代表性的公司——騰訊,不斷升級改造自有的數據存儲中心,經傳統方式的廠房改建——自建園區——模塊化數據中心等三個階段建設,已擁有自己第三代數據中心,即騰訊大數據資源庫。騰訊公司董事會主席兼首席執行官馬化騰認為,經過18年的艱苦奮斗,精心經營建立起來的數據中心,其存儲總量才達到1000PB(1PB=1024TB),[2]僅相當于15000個世界上最大的圖書館的存儲量,還有較大的拓展空間。
2.協作型。騰訊的容量很有限,僅靠騰訊獨家儲存大數據資源是遠遠不夠的。同時說明,我國對未來全球可存儲數據信息總量還缺乏強有力統一組織、籌劃、設計、實施和管理機制。我國建設戰略意義的大數據資源庫,要在政府統一部署下實施,更需要IT界共同謀劃、通力協作,彼此鼎力相助。
3.增量型。據有關媒體報道,以人類目前數據信息存儲技術能力看,若把數字存儲設備和模擬存儲設備等全部計算在內,全球可存儲信息為295艾字節(exabytes,EB),即295*(10)20字節≈295*(1024)11TB。若以騰訊現有信息存儲量看,1000*1024TB/295*(1024)11TB≈3.389*(1024)-10,僅占全球可存儲信息量的億分之0.3389。由此可見,我國對數據信息存儲、擁有量太少。
4.技術性。世界數據信息存儲已以BB(1BB=10242ZB=10245TB)為單位,以2020年全球數據記錄總量40ZB為基數,那么,1BB/40ZB≈2.62144萬年,即1BB存儲空間是2020年全球信息總量的2.6萬倍。如果我國要容納1BB數據信息量,則 1BB/1000*1024TB≈1*109,即要建設約1億個現有的騰訊。若對大數據信息經過排查、刪減、除垃圾,再通過高清壓縮和虛擬等技術處理,則存儲有用、具有高附加值的大數據信息,就更豐富龐雜,歷史越久,數據越豐富,價值越高,就更具發展潛能。
1.價值性。維克托曾說過:“大數據是未來,是新大油田礦,是無污染的金礦。”2012年3月,美國政府正式發布國家大數據戰略《大數據的研究和發展計劃》。[3]2015年10月,黨的十八屆五中全會上首次將大數據提升為國家戰略。隨著大數據不斷地向社會政治、金融經濟、科技教育、文化宣傳、醫療衛生、交通運輸、設計制造、國防維穩、天文地理、自然環保等方面快速滲透,未來有價值的數據將巨量增長。
2.長效性。與時俱進,是我們不斷進取、變革社會、促進人類進步的號角,在大數據資源庫建設中,就應有與眾不同的視閾和思考。戰略型大數據資源庫,要把人類發展歷史長卷的“無限窮盡”大的數據信息記錄在案,以供人類長期探究和發展之用。
3.技術性。綠色環保,可持續發展,節約資源,降低成本,是我國長期發展戰略,需要可循環利用的大數據技術予以支撐,而建設大數據,利用大數據,創新大數據等都離不開技術,迫切需要核心技術服務大數據建設。
建好大數據,管好大數據,用好大數據,充分發揮大數據應有的潛能,要從思想上充分認識大數據,從實踐中感知大數據,從作用上認知大數據,從效能上理解大數據,以新視閾思考大數據賦予我們的新思想、新思維、新理念。
1.政策開放。開放是大數據時代的最強音。在大數據時代,開放意識的缺失,將會使一個國家或政府處于“被淘汰”的境地。著名投資人孫正義認為,大數據時代,要么數字化,要么死亡。沒有開放就沒有發展。無數事實說明:閉關自守,只能使自己坐失發展良機,處于被動挨打境地,我國改革開放40多年偉大發展成就,就是對開放意識的最好驗證。
2.思想開放。習近平總書記強調:中國改革開放之門只會越開越大,不會越開越小。大數據開放意識已在社會現實中有更多的體現,例如,“一帶一路”建設包含著我國對大數據眾多的研究成果,是我國把成熟技術、成果以開放、共享、協作等方式應用到友好國家建設,是思想開放的體現。
3.行為開放。大數據時代,我國大開國門、走向世界、擁抱地球,是行為開放的具體實踐。我國以開放、協作、共享的方式,把數據、科技、成果等貢獻給人類,和世界共同分享,表明我國是一個愛好和平、為人類負責、追求進步、民族平等、合作共贏、共享文明成果國家。
大數據強調開放意識,不僅僅是指數據、科技、經濟等局部開放,還應包含更深層次的意識、理念、思想的開放,故不能以孤立、片面、狹隘、零碎的觀點或方式看待大數據的開放,而應關聯、全面、科學、系統地理解大數據開放的意義。
1.諒解。廣納天下,鏈接萬物,包容一切,是大數據的一大特色。包容是大數據時代對誤會、矛盾和隔閡進行調和、化解的良方,因為大數據的生命在于共享,基礎在合作,力量源泉在共贏,這些都表現出包容所具有的文明元素,彼此間化干戈為玉帛,取得諒解和互通。
2.理解。當大數據被充分運用時,利益雙方的目標或目的幾近趨于一致,彼此間矛盾、分歧、誤會、隔閡等幾乎被抹平,使得國與國間的包容度不斷地增強,政府與公眾之間的包容度也在提升,人與人之間的包容度也在隨處凸顯,彼此理解得以落實,從而表現出對互諒、互讓、互敬等大數據理解精神內涵的強烈需求。
3.信任。語言是國與國、人與人交流最大的障礙,雙方因語言問題容易引起誤解、產生矛盾和隔閡。準確暢快的交流,有利于拉近彼此間的距離,增強彼此間的親近感,提高彼此間的信任度,提升彼此間包容心態。中國國防科技大學研發的訊飛輸入法和翻譯軟件,已用于80多個國家和地區,促進了不同地域、國籍、民族、語言間的溝通、交流。從無數鏡像可見,當領導人有外事活動時,在兩國領導人間起“橋梁”作用的翻譯和記錄員,逐漸身影全無,卻沒有影響兩國領導人間高效、暢快的交流和溝通,其原因在于人工智能和大數據在語言方面的運用,使得不同地域、國籍、民族、語言間的“代溝”或“隔閡”被抹平,語言不再是世界各民族交流、溝通的障礙,順利實現互通有無,增進相互間的理解、信任、互敬和包容。
1.尊重的態度。尊重人才,尊重知識,尊重科學,尊重客觀,是大數據時代的顯著特點。大數據時代,數據的顆粒度在變小,政府所能獲得和提供的數據更加原始與真實,政府決策過程在科技支撐下變得高效與可考證化,決策結果中不確定因素所帶來的風險大大降低。
2.嚴謹的態度。利用大數據技術所從事的活動,都經大量的調研、考證,并進行反復求證、分析,最后才進行具體的實施,降低了風險,提高了效率。例如,具有大數據特征的C919大飛機研發,[4]充分體現出我國政府嚴謹科學態度。經60年風雨歷程,2017年5月5日,我國自主研發的C919大飛機,才從上海浦東國際機場首飛成功,這個嚴謹、科學的漫長歷程是任何一個國家、地區或任何一個產品所不及的。
3.負責的態度。到2018年12月,我國制造的C919大飛機已實現無數次試飛,獲得大量有價值數據,改進了很多設計、制造、測試、飛行等初始數據和設想。這是為用戶負責,為乘客負責,為至高無上的生命負責,這就是我國為人類不斷進步所采取的科學態度的具體在現。
1.萬物關聯。大數據時代,認識問題、思考問題、分析問題、解決問題,都需要進行“關聯”,人的關聯、物的關聯、人與物的關聯、歷史與時間關聯、地理與空間的關聯、多維度關聯,世界萬物無不因大數據而相互關聯在一起。
2.立體關聯。當月球背面第一張照片傳回地球時,震驚世界,其中的功臣很多,但我們不應忽略以“海、陸、空”三方組成的大數據通訊系統所起的重大作用,就是無線通訊、有線通訊、檢測、定位和收發等立體關聯,在通訊、控制、遙感、檢測、定位等方面的綜合展示。據資料統計分析,空中景、地面物、水中游,靜和動的物體,以及人們日常生活的衣、食、住、行等,都因大數據而關聯在一起。
3.創新關聯。臉是人具有的生物外型,一旦和大數據相關聯,則對我們的工作、生活、娛樂等產生重大影響。我國IT界精英馬云說:未來周游世界,可能不需要護照、身份證、鈔票、通訊工具等身外之物,僅需要一張臉就能暢游世界,是人臉生物特征與大數據關聯創新的結果。
1.價值分析。我們通過對數據搜索、查詢,整理和梳理,歸類關聯、基礎分析、深度分析、價值挖掘等步驟,獲得數據有用價值。
2.關聯分析。大數據時代,分析是深度的、實時的、個性化的。數據所承載的信息以形態各異的形式分散在不同的時間段、不同的地理位置和不同的網站平臺,大數據要做的就是不停地分析,深入挖掘看似不相關的數據,找出數據間可能存在的關聯和規律,挖掘出數據的潛在價值。
3.挖掘分析。阿里巴巴以虛擬經濟為主打品牌,騰訊以創新應用而聞名,華為以基礎通訊享譽全球,格力以制造為名片,他們是我國大數據價值挖掘的杰出代表,代表著我國大數據在不同行業、領域的發展方向。在大數據價值挖掘和應用中,各據所長,獨具挖掘分析核心技術。通訊終端設備——手機能被用戶青睞,需要具有速度快、容量大、外觀美、個性強、功能多、兼容性強、使用方便等諸特點,才能占有一定的市場份額,最終走向世界,華為就是我國通訊領域價值挖掘分析的杰出代表。
4.核心分析。華為經過對大數據的深度分析,在核心技術開發、研制等方面,投入了大量的人力、物力和財力,經不斷努力,才掌握了通訊領域的核心技術,能在一納米空間內集成七個處理器,讓同行望其項背,最終取得驕人的成績站在世界頂峰。