,
錢學森在長期領導和指導國防科技情報工作中,以宏博深邃的科學智慧,提出了一系列科學創見,形成了豐富的科技情報學術思想,對我國科技情報事業的發展以及情報學學科建設起到了重要的作用。錢學森當年的很多前瞻性技術預見和情報理論都成為了現實,錢學森情報研究思想集中體現出來的戰略眼光、綜合集成和知識會通等特點,對處于快速發展和深刻變革中的情報學來說,具有重要的指導和借鑒意義。深入研究錢學森情報研究思想,探尋其中的方法論價值,對于提升情報研究工作的層次和質量具有重要的現實意義。
大數據(big data)一詞于20世紀90年代出現,真正意義上的大數據研究標志事件是美國于2012年3月29日發布的《大數據研究與發展倡議》[1]。同月,美國總統奧巴馬提議在2013年投資10億美元創建由15家制造創新機構組成的國家制造創新網絡,進一步通過大數據的整合與分享,促進國家制造創新。2013年9月,美國國防部發布第16版《年度工業能力報告》,將“賽博工業”從信息和通信技術(ICT)工業領域分離出來,令其成為繼飛機、IT/C4(信息技術、指揮、控制、通訊和計算機)、服務保障、陸地戰車、彈藥與導彈、導彈防御、艦船、航天之后的第九大國防工業重點領域[2]。大數據在越來越多的領域得到重視,改變了武器裝備的使用和作戰的模式,引起了工業、商業模式的劇變,給人類的生活方式和思維方式也帶來了巨大沖擊。如同蒸汽機開啟工業革命一樣,大數據及相關技術也將會引領新的科技革命。
隨著信息技術的不斷發展,互聯網已經深入人們生活的方方面面,各種終端設備記錄人們生產、生活過程中的信息從而產生了大量的數據。國際數據公司(IDC)的研究報告稱,2011年全球被創建和被復制的數據總量為1.8ZB,并預測到2020年,全球將擁有35ZB的數據量[3]。巨大的數據量及大數據技術的應用,對情報學的研究思想、研究內容、技術方法都產生了重要的影響,情報學研究范式也由此產生了深刻變化。
情報學研究范式可以歸納為4個階段:20世紀40~60年代,在情報學產生和確立時期的研究,體現的是基于信息的事實型情報學發展范式;20世紀70~90年代,經歷了基于信息管理的綜述型情報學發展范式;1995~2010年經歷了基于智能的智慧型情報學發展范式;進入21世紀后,隨著大數據技術的快速發展和廣泛應用,情報學進入基于大數據的發展范式[4]。
相較于以往的情報學研究,新的研究范式最主要的特征是將情報學的研究帶入了數據領域。最初的情報概念建立在“信息”的基礎上,“信息”是情報學研究的最基本要素,而“信息”是被處理過的“數據”,也就是說,之前的情報學研究的第一步就是需要人在大量數據中提取信息。隨著大數據技術的發展,諸如數據挖掘、深度學習、關聯分析等機器學習方法在情報分析中的應用,情報研究人員可以直接以數據為基本的研究要素,即情報學研究進入了以數據驅動的新時期。
對于情報研究而言,大數據的理念和技術在帶來前所未有的機遇的同時,也帶來了不可忽視的挑戰。首先,大數據時代,數據已經成為繼陸權、海權、空權之后的一種國家核心資產,滲透到每個行業和領域,逐步成為重要的生產要素。因此,以數據為基礎的情報研究工作得到前所未有的重視。大數據相關技術的應用,也給情報研究帶來了更廣闊的視野和更便捷的手段,極大地促進了情報研究理論與實踐的發展。
機遇與挑戰是并存的,情報研究所面臨的挑戰主要體現在兩個方面。
一是技術層面的挑戰。大數據具有4V的特征,即數據體量大(Volume)、處理速度快(Velocity)、來源多樣性(Variety)和價值密度低(Value)[5],尤其是非結構化數據占比高,使情報分析對智能化分析工具和可視化工具的依賴越來越高。工具是設計者開發的,工具的算法體現的是人的思想,算法也是情報分析工具的決定性因素,過去情報分析中人的“偏見”轉化為機器的“偏見”。因此,大數據技術的發展能否滿足情報研究日益增長的工具需求,是能否緊跟世界情報研究發展腳步的重要因素。
二是大數據時代的情報研究對技術工具的依賴性顯著提升,但不能因此降低對情報研究人員自身素質的要求。正如錢老所說“情報是激活了、活化了的知識”。知識或者說數據的激活、活化才是情報研究的核心,而在這方面機器是永遠無法代替人的作用的。大數據背景下的情報研究,技術運用應是手段而非目的。
錢學森在20世紀90年代就預見了信息技術會給情報研究帶來深刻影響,并將信息視為“第五次產業革命”的特征之一[6],創造性地提出了應對賽博空間和大數據時代挑戰的“大成智慧”思想。這一系列的預見及論斷與錢學森系統深刻的情報研究思想體系是分不開的。深入研究錢學森情報研究思想,可以為應對大數據時代情報研究的變化提供戰略指導,為情報研究的發展方向做出指引。
用高屋建瓴的戰略眼光觀察事物,高瞻遠矚、發人未見,是錢學森科學智慧的重要特征,也是情報研究工作的重要要求。錢學森在科學實踐中充分展現了深刻的洞見力,在指導情報研究工作中多次傳授提高戰略性、預見性的經驗方法。這些思想和方法,對提高大數據時代情報研究人員的戰略思維層次具有很強的指導性。
2.1.1 以戰略眼光洞察和預見問題
新工科背景下,利用網絡教學平臺進行混合模式教學,在很大程度上克服了傳統教學存在的弊端,提高了學生的自主學習能力,體現了課程考核的多樣化和公正性。只有將傳統學習與網絡化學習結合起來,使二者優勢互補,才能獲得最佳的學習效果。
錢學森的洞察力和預見性充分體現了其科學智慧。2011年11月8日,本文通訊作者趙超陽曾聽前總裝備部科技委委員汪成為院士講述了錢學森洞察深遠的一件事:錢學森在看到ScientificAmerican雜志1991年9月號專刊后,對該刊中“未來將是在賽博空間中工作、娛樂和成長”的文章特別重視,認為這是美國準備拓展“信息”內涵的一個信號,是為戰略轉型所做的輿論準備,并要求他對該期專刊的相關內容進行翻譯和研究。受教于錢學森的悉心指導,汪院士后來一直關注計算機應用系統方面的研究,并成為此方面的專家。2009年5月29日美國總統奧巴馬宣布對“賽博戰略”賦予美國行政最高優先級,2010年8月25日美國前國防部副部長William Lynn宣布進一步貫徹美國軍方應對網絡進攻的5項措施。這預示著,未來戰爭將是在賽博空間的體系與體系的對抗,并且將對戰爭形態、作戰樣式以及戰略威懾產生深遠影響。
戰略眼光是情報研究人員戰略思維能力的外化和體現,是情報研究工作深度開掘和質量水平的重要保障,形成戰略眼光需要注重以戰略視角觀察問題。在進行科技情報研究時,首先要將科技情報放在世界科技動向和國家科技戰略等宏大背景上去觀察和思考,其次要以前瞻的戰略預見觀察問題。情報研究不僅要及時準確反映當下世界科技發展動向和水平,還要能夠總結特點與規律,預測未來的發展演化與趨勢。錢學森的洞察眼光是建立在他卓越的科學素養和大量的經驗積累上的,并非每個人都可以如錢老一般正確預見20年后的技術發展方向。大數據技術的出現則將洞察深遠的工作的難度大大降低,通過數據挖掘、知識挖掘等技術的應用,可以讓每位情報研究人員具有超出自己知識范圍的深遠目光。
2.1.2 情報研究工作要為宏觀管理和戰略決策服務
錢學森高度重視國防科技情報工作,認為情報工作是突破國防尖端技術的重要途徑,是領導和機關宏觀管理及戰略決策的重要支撐。他多次提出“情報工作要搞戰略情報,當情報參謀”“情報研究的任務是給領導提供戰略方向、動向性情報資料”“情報資料研究,重點研究什么?應是尖端技術的方針政策,說透了是政治和技術的結合”[7]。
盡管在大數據時代下信息爆炸式擴散,信息獲取渠道多樣、方便快捷,但信息爆炸同樣帶來了負面影響,即信息質量低下,從海量信息中提取有針對性、對解決問題真正有意義的情報十分重要。因此以知識密集型、對策咨詢型、濃縮精要型為綜合特點的高端服務依然是情報研究工作的重點。隨著軍事技術的快速發展和武器裝備建設的加速推進,這種高端服務的需求越來越旺盛。錢學森認為,科技情報服務工作不能只停留在文獻檢索或提供資料的層面上,而是要深入到包括文獻資料在內的與所需解決問題有關的各類信息/知識集合中,通過對這些開放的知識集合進行“系統辨識”,尋找其內在聯系,去偽存真、去粗取精,將情報與問題結合起來,才能真正起到“情報參謀”的作用[8]。在大數據時代,情報的表現形式更加多元化,傳統文獻形式的情報來源占比越來越低,非結構化信息越來越豐富,對情報研究人員提出了更高的要求。因此更需要從戰略層面抓準情報研究任務的需求,為領導宏觀管理和決策提供更加精準和具有針對性的情報研究成果。
以系統工程的科學方法指導工作,強調系統思維、綜合集成是錢學森科學思想的具體體現。以科學家的學識和智慧,從情報的本質屬性和情報工作的學科定位出發,提出建立從定性到定量的綜合集成研討廳等思想方法,對深入開展大數據條件下情報研究工作具有很強的指導價值。
2.2.1 情報研究要應用綜合集成方法
1983年7月3日,錢學森在“第一次國防科技情報工作會議”上的報告中強調“高級一點的情報研究工作,實際上是一個綜合的技術,這種綜合技術要用系統科學和系統工程的方法”,并指出“情報的分析工作,靠一個模型”“即使沒有這樣一個模型,現在系統工程、系統科學的方法也告訴我們還是有辦法”[9]。隨著科技實踐和研究思考的不斷深入,錢學森逐步形成了體現系統論的綜合集成方法,對眾多科學領域的研究工作提供了有力指導。綜合集成方法以“從定性到定量的綜合集成研討體系”作為實踐形式,實質是把專家系統、資料與信息系統以及計算機系統有機結合起來,把人的思維及思維成果,人的經驗、知識、智慧以及各種情報、資料和信息集成起來,構成一個以人為主、“人-機”結合與融合的復雜的智能系統。作為一種“人-機”結合獲得信息、知識和智慧的方法,它不僅是信息處理系統,也是知識創新系統、智慧集成系統。錢學森提出的綜合集成方法充分體現了大數據時代人與技術的結合,為新時代情報研究的發展指明了方向。
2.2.2 科學建立集智性專家系統
發揚民主、集思廣益,是錢學森高尚科學品格的重要體現。在情報研究工作中,他非常重視集體智慧作用的發揮。1978年11月18日,他在國防科委情報工作會議上指出“情報資料分析工作,我還是主張搞點社會化的勞動,集體化,不要搞落后的單干戶的辦法”[9]。他還提出“你們所的人有自己的長處,外面的人有外面的情況,你怎么組織這個工作,現在情況不同了,工作要有新的辦法。要吸收做科研工作的專家搞情報研究。你這個機構里的人,是情報專家,要善于利用社會上的力量組織起來搞情報工作”[9]。
隨著信息海量增長、個人知識分化細化以及對情報研究成果更高的質量要求,情報研究主體已經由個體向團隊和專家群轉化,大數據時代則為集智性專家庫的建立提供了前所未有的機會和平臺。因此,按照錢學森情報研究思想的指導進行專家團隊構建,可以充分發揮大數據平臺的信息優勢。在專家團隊的構成上,可以利用智能化專家庫,根據情報研究需求和內容,通過對專家庫的數據分析優化組成科研團隊,并實現團隊內部資源共用、知識共享、思想共鳴,充分發揮集體智慧;在組織結構上,采用以優勢專業領域單位為核心,相關研究單位共同參與的“小核心、大外圍”工作方式,建立以情報研究人員為主體,情報、技術、管理專家聯合協同作業的工作機制,構建一個專家系統,形成專家智慧的聚集融合,提高研究質量效益。
2.2.3 充分開發和利用智能處理技術
情報研究具有很強的科學性、復雜性,在充分發揮人的思維、智能等主體作用的同時,還需要借助輔助思維工具和方法。錢學森一直強調要利用現代技術,特別是計算機技術推動和深化情報工作。1978年,他在國防科技情報工作會議講話中介紹了當時國外利用計算機、激光解決資料存儲、檢索等問題的情況,并預言“整個情報資料工作的搜集、存儲、檢索、復制、提供、傳遞這一套手段,現在由于電子計算機、激光技術的出現,已經在醞釀著一場革命”,并提出“恐怕不久的將來,全世界總是要建立情報資料網”[7]。隨著計算機運算速度和智能化水平的不斷提高,尤其是隨著近年來機器學習與大數據技術的發展,人工智能發展程度越來越高,計算機能夠承擔越來越多的低級或簡單的勞動,從而使人能夠集中更多的時間、精力去從事更高級、更復雜的腦力勞動[10]。現在的情報研究工作,要充分利用建模仿真、定量分析、數據挖掘等方法,實現情報研究從以人為主的“經驗型”向“人技”合一的“科學型”轉變,不斷提高研究成果的層次水平。
另外,除了開發專門的情報研究智能化工具外,也要注意廣泛吸收借鑒來自其他行業的先進技術。阿里云部門經理沈俊先生在軍事科學信息研究中心所做的關于“DT時代阿里巴巴在數據智能領域的探索與實踐”的報告中提到,阿里開發的“魯班”智能機器人每天可以完成1億次定制廣告推送,其背后的算法完全可以應用于大數據與人工智能相結合的情報篩選和情報信息推送。借著軍民融合上升為國家戰略的大好時機,情報研究應當充分利用社會上一切可以吸收的先進技術,推動自身發展。
2.2.4 不斷擴充和整合資料信息系統
在情報研究中,系統辨識、模型構建、綜合集成等方法都需要以大量信息的占有為前提和基礎。錢學森曾把大成智慧譯為Wisdom in Cyberspace,借以強調“大成智慧”的特點是沉浸在廣闊的信息空間里所形成的網絡智慧。現今Cyberspace所呈現的知識爆炸、信息如潮、場域泛在等端倪和特征,為綜合集成資料信息系統提供了無限擴充的可能。盡管信息技術和信息網絡讓人們在海量信息的選擇中面臨去偽存真、去粗取精的困難,但一些新的信息發布和聚集形式,如維基百科、微博、Twitter、Facebook等,應該納入信息資源建設的新領域。同時,還要對這些信息進行挖掘和序化,用知識庫的形式建立查詢檢索方便的信息系統。
錢學森是一位成就卓越的科學家,其廣博的知識、非凡的智慧令他在眾多領域都有很高的建樹。在指導情報研究工作實踐中,他多次強調,情報研究人員要有多學科的知識,在此基礎上才能夠激活情報,實現創新,產生智慧的原始素材。在現代科學技術體系日趨復雜和當前情報研究人員知識結構相對單一的情況下,要提高情報研究質量,必須注重情報研究人員的知識結構優化和積累,大數據時代的情報研究尤其如此。
2.3.1 形成和具備多學科知識
現代學科技術發展的成果及其體系結構是情報研究工作的知識基礎,也是“集大成、得智慧”的知識源泉。錢學森指出“我們掌握的學科知識跨度越大,創新程度也越大。而這里的障礙是人們習慣中的部門分割、分隔、打不通。大成智慧教我們總攬全局,洞察關系,所以促使我們突破障礙,從而做到大跨度的觸類旁通,完成創新”[8]。因此,他多次倡導和要求情報研究人員“要懂得一點現代科學技術的概貌,就是說對于科學技術的體系,它們相互關系,對這個問題要知道一些,不要完全守著自己原來學的那個專業那個學科”“鉆得深一點是必要的,但你做情報資料工作,新的發展往往是最有意義的,那些發展并不在老的專業上,我們搞情報資料分析的同志應有這個知識,不然你的眼界就太窄”“所以我們要搞好情報資料分析研究工作,我們還應有一點特殊的知識:一個是科學體系,一個是科學學”[9]。
這些思想今天依然對我們具有很強的啟示性。大數據時代科學研究已不再是某一學科、某一領域的某個科研團隊獨立進行[11]。學科交叉和知識綜合是當前技術發展的趨勢,新的技術的出現、新的產品的產生,都是多學科、多技術的復雜融合體。情報研究人員在工作實踐中,應該自覺擴展自己的知識面,在不斷深化專業知識的基礎上,學習了解現代科學技術體系的現狀和發展,以及政治、經濟、文化、歷史等方面的知識,把自己塑造成為一個適應情報工作發展的復合型人才。大數據時代也帶來了這樣的機會,讓情報研究人員更加及時、快捷地獲取自己所需的知識,可以極大地加快科學知識的傳播速度,讓個人的知識和眼界可以無限擴充。
2.3.2 善于通過激活轉化知識
1983年,錢學森在《科技情報工作的科學技術》報告中對情報的本質屬性進行了深入分析,指出“情報是激活了、活化了的知識”。錢學森主張將情報學研究的理論框架分為依次遞進的3個層次:研究信息/知識的來源、可獲得性和搜集方法,研究信息/知識的整理序化、儲存檢索和有效提取等技術,研究如何針對特定需要對獲取的信息/知識進行全面分析和激活,并將其轉化為解決問題的有用情報及相關的方法和技術。其中,前兩個層次的研究是情報學研究的基礎,而第三層次(即知識的激活、活化)才是情報學研究的核心[8]。
知識通過人的思維和智慧加以激活,就變成有針對性的活知識,而這種活化了的知識又可能轉化為人的智慧。“信息資料庫所存儲的知識,比任何人所能知道的都多千倍、萬倍、億倍,但信息資料庫本身并沒有智慧,甚至連比智慧在檔次上低得多的智能都沒有。當然,這也絕不是說電子計算機檢索的信息資料系統沒有用;一個有一定知識和智慧的人用了這種網絡系統,就如虎添翼,能獲得大量激活了的情報,也就是有針對性的活知識;而這有針對性的活知識又是人的智慧的原始素材”[12]。智慧在知識的激活和轉化中具有乘數效應,情報研究人員要結合自己的知識和研究需求多思考、多分析,及時有效地形成情報研究成果,并在這種轉化中不斷提高能力、增長智慧,到了一定的階段,就可以運用知識和智慧,“能站在高處,遠眺信息大洋,能觀察到洋流的狀況,察覺大勢,作出預見”[13]。
錢學森情報思想對于我國科技情報工作有著重要的貢獻和意義,為我國科技情報工作與情報科學與技術的研究和發展起到了重要的作用[14]。大數據時代情報學高速發展,對于錢學森情報思想的研究與解讀又迎來了新的高峰[15]。新技術、新方法的應用也許改變了情報研究的范式,但情報研究的內核始終是人的思想。本文在總結提煉錢學森情報研究思想的方法論特征的同時,對在大數據時代如何運用錢學森情報研究思想促進情報研究發展進行了一些思考。在可以預見的將來,錢學森情報思想仍將煥發新的生命力。