文 / 沈水榮 人民出版社
隨著信息技術革命的深入發展,人類進入了一個知識爆炸的時代,知識加速增長積累與人的閱讀學習能力有限之間的矛盾日顯突出,知識資源的低效率使用和浪費日趨嚴重。于是,人們采用以信息化為代表的現代科技手段,對知識信息進行大規模地加工處理,生產出一系列更加便于人們閱讀學習的數字化、網絡化產品,大幅度提高知識信息的使用價值。由此正在帶來一個新型產業的興起,這就是現代知識資源開發產業。
自從人類發明文字,形成了知識積累,就有了開發利用知識資源的現象。但知識資源開發的規模和深度,依賴于承載和利用知識的物質技術條件的發展。隨著物質技術的條件逐步改進,人類知識積累越來越豐富,人的閱讀學習越來越需要借助外部物質條件而進行,也就越來越有必要把知識作為一種資源進行開發利用。如,我國古代就有文獻編目、圖書編纂;近現代出版中有“編、印、發”;圖書館有“采、編、典、借”,等等,這些都是由于知識積累到一定程度,為了幫助人們更加方便地閱讀使用知識所進行的工作、形成的行業,都有知識資源開發的性質。但以往時代由于知識資源開發的規模和深度也很有限,人們沒有提出“知識資源開發”這個概念。
隨著信息化時代的到來,與計算機技術相伴隨,人類用于承載和利用知識的物質技術條件又一次產生了革命性演變,知識信息的儲存、處理、傳播、應用等大大突破了時間、空間的限制,其效率無數倍地大幅提高,從而使知識總量開始以不可思議的幾何級數增長和積累,知識資源的大規模深度開發成為必然。據聯合國教科文組織對全世界4000本雜志研究發現:十九世紀,每隔50年知識更新一次;到了第二次世界大戰的時候,知識更新的周期縮短到15年;上世紀九十年代以后則縮短到3到4年。出版物是知識增長的一個重要標志。我國出版圖書總量1990年約8萬種,2012年達到約40萬種,22年間增長了5倍。與上述關于知識增長速度的預測基本吻合。
這些數據和預測表明,人類已經淹沒在自己創造的知識海洋中。尷尬的是,人的閱讀能力卻極為有限。于是,這些人類文明的精華,要么被束之高閣、落滿歲月的塵埃,要么大量堆積在庫房內,最終銷毀。近年來,人民出版社為承建國家重大項目“中國共產黨思想理論資源數據庫”,從國家版本圖書館等有關方面,對確定范圍內的黨政類圖書進行調查,發現建國以來出版的此類圖書大約100萬冊,但長期以來,這些圖書資源存在著“低效率”使用的問題。據抽樣調查,這100萬種書中,目前一般書店和網站上比較容易買到的實體書只有約1‰,也就是還有999‰被塵封在倉庫里,有不少已經被打成了紙漿,許多出版不到10年的圖書已經尋無下落。
可見,知識,已經如同深藏地下的石油、天然氣一樣,成為一種需要大力開采、開發,才能發揮效用的寶貴資源。
歷史上每一次信息技術的革命,都使得人類大大拓展了知識加工、傳播和利用廣度和深度。“語言”的產生,帶來了人類聲音信息的語義化、規范化,使得人類的經驗、知識可以面對面地相互交流,共同享用。“文字”的產生使人類的語言向符號化、標準化、存儲化、通用化方向發展,使知識可以超越時空的限制而傳遞和利用。“紙”的發明,使人們有了方便記錄文字、圖像等知識信息的載體,使得知識加工整理、傳播和利用的數量、質量大幅度提高。“印刷術”發明后,文字、圖像的等知識信息大量復制、存儲、傳遞成為可能,知識在全世界范圍內實現了更為廣泛地傳播和利用。
現代以信息技術為代表的新技術革命,為知識資源開發利用準備好了一切物質技術條件。計算機技術使文字、圖像、聲音等知識信息數碼化、虛擬化,它與現代通訊技術、傳感技術、復印技術、機讀技術、縮微技術、聲像技術、新材料技術等相結合,使知識加工、傳播、使用在更廣泛、更深入的程度上得到迅速發展。
2.1 信息儲存海量化。儲存器從磁盤、光盤,發展到閃速存儲器、固態硬盤等,目前容量最大的硬盤已經能達到1000—2000gb的容量。在可以預見的未來,納米儲存、磁盤冗余陣列技術、云儲存技術、DNA硬盤等更高數量級儲存技術將逐步走向市場。DNA硬盤 1克存儲量將等于300萬張CD。
2.2 信息處理自動化。可以借助相關技術,將計算機、復印機、打字機、終端機、縮微機、聲象設備、光電、電磁、自動控制設備、印刷裝訂設備、編輯翻譯設備,用光纖、電纜、衛星、微波、電子線路連接起來,實現信息的自動記錄、整理、存貯、交流和利用。可以進行分類自動化、主題標引自動化、信息編碼自動化、信息著錄自動化等。
2.3 信息傳遞瞬間化。無線互聯網、有線互聯網、衛星通信,以及即時通訊軟件、數字傳輸、數字電視等手段,使知識信息在地球任何地點之間、地球與太空之間傳遞的距離概念幾乎不復存在。即使是超大容量數據傳播、高分辨率音視頻和圖片文件傳輸也越來越十分便捷,甚至人類在遙遠的太空可以為地球上的幾億人同時授課,進行互動交流。
2.4 信息展現融合化。信息化聲像技術、模擬語音技術、三維動畫技術、物聯網技術等,可以把同一主題的文字與圖像、聲音、視頻、動畫以及直接來自自然源頭的信息有機融合起來,創作成一部作品,在同一終端同一屏幕展現給讀者。這是一種更加客觀真實、生動具體,全方位、多角度地反映和揭示事物的方式。幾千年前,人類把對客觀世界的認知抽象成文字進行交流;現今,多種形式信息的融合化展現,又將使人類回歸到對客觀世界直接認知的狀態中去,這是一種人類認識世界方式的螺旋式上升。
2.5 信息保護永久化。隨著縮微技術的發展,以及DNA儲存等技術成果的誕生,并逐步投入應用,電子數據難以長久保存的問題也有望迎刃而解。信息化縮微技術可以將數據保存幾百年。英國一個研究小組研發的“DNA硬盤”,有可能使文件保存時長達數千年,比紙質書保存的時間還要長。這樣,信息化手段無論對于知識信息的加工、處理、傳遞、利用,還是保存,都有可能達到十分完美的程度,為現代知識的開發利用提供了前所未有的巨大空間。
信息技術條件下知識資源開發圍繞實現知識資源的深度加工、高效利用,在國內外產業實踐中形成了以下一些方面的基本形式:
3.1 知識存在規模化開發。傳統技術條件下,一柜之中只能架起幾百本書,一囊之內只能裝載幾十本書,一桌之上只能展開幾本書,一掌之中只能翻閱一本書,讀書只能一本一本地讀。作品的分散存放、傳播和使用,導致了原本應該緊密聯系的知識之間相互隔離,影響了知識的使用效率。現代信息化技術條件下,經過規模化開發,方寸之間可以同時承載和傳播幾萬、幾十萬甚至更多的作品,讀者可以把成千上萬本書捆綁到一起,作為一本書來讀。不同作品之中知識的關聯性大大增強,知識傳播和使用效益大大提高。作品資源規模化開發的主要工作,就是通過解決著作權、尋找相關版本等工作,大量收集各種介質的作品,進行統一格式和標準的數字化并建成資源庫,使其形成一定的規模。規模化不宜追求兼收并蓄、通吃天下(實際也做不到),而應當突出重點,按照一定的主題、知識體系、質量標準,比較系統完整而有代表性地將相關作品收集入庫。如人民出版社圍繞黨的兩大理論成果以及反映“重大理論創新、重大歷史事件、重大戰略舉措、重要歷史人物”的線索,系統完整地將優秀作品和有代表性作品收集入庫,使數據庫覆蓋了黨的思想理論領域所有主要著作文獻和知識點。
3.2 知識表現融合化開發。紙質出版條件下,知識在一個作品中只能以比較單一的文字或圖像等形式表現出來,人們對知識的接受和理解受到極大的限制。知識表現融合化開發,就是采用多媒體技術,把圖書、文章、圖片、音視頻、動畫以及來自自然源頭的知識信息融合起來展現,幫助讀者全方位、多角度感知和了解世界。一部融合化作品的開發是一個復雜的創作過程,需要確定主題,整體構思,撰寫腳本,采集、篩選、剪裁素材,開發軟件,標引知識單元,等等,把多種知識表現形式的單元鏈接起來,制作成一個數字化閱讀產品。目前一些廠家已經生產出這樣的融合式電子書產品,這些產品通過方寸之間的輕松點擊,可以感知多種形式的知識信息,達到更好認知世界、掌握知識的效果。人民出版社計劃開發一套名為“中國共產黨思想理論庫書”的融合式產品,將毛澤東、鄧小平、江澤民、胡錦濤同志主要著作中的主要知識點(預計共13萬個)與相關的其他圖書、文章、錄像、圖片、歌曲等作品相鏈接,使這些重要著作成為整個理論數據庫多媒體展現的中心平臺。
3.3 知識授受微距化開發。知識的傳授和接受之間存在空間距離和時間距離。傳統紙質出版條件下,一個作品編輯完成后,需要通過排版、印刷、倉儲、運輸、門店等環節,到達讀者手中,這中間存在漫長時空距離。而在現代信息化條件下,一個作品完成后,一點鼠標即可從授者的桌面到達受者的桌面,幾乎消滅了知識傳遞的時間距離和空間距離。這種變革對于提高知識使用效率的作用和意義是無可估量的。知識授受微距化開發的主要工作,首先,要建設適合知識信息傳遞的信息化通道,當前特別要注重建立起能夠瞬間傳遞大容量、高清化、實時化信息的通道;其次,要開發閱讀軟件,這些軟件既要能夠有效地防止盜版,又要能夠滿足各種格式、標準文字信息的展現閱讀,還能夠用于融合式產品的閱讀使用。第三,要加強數據建設,通過數碼化加工,使所有知識信息以數字代碼的形態存在,并且具有多種標準和格式,能夠適用于各種硬件和軟件條件下的傳播。第四,要加強標準建設,在數字化、網絡化等知識傳播領域形成全國統一,并與國際接軌的標準,使知識信息在傳遞過程中暢通無阻。
3.4 知識發現瞬間化開發。知識的檢索發現,歷來是人們為提高知識應用效率著力研究解決的一個重要問題。傳統紙質書條件下,人們檢索發現一個知識點,幾乎都需要依照“相關圖書館(資料室)→相關圖書類型→相關圖書→相關章節”這樣一個秩序費力尋找。該過程不僅緩慢,而且其終點一般只能是“章節”。經過信息化技術開發的知識資源,一個小小檢索框加關鍵詞,就可以省去紙質出版條件下的一切檢索過程,而且使檢索的對象從章節檢索發展到以語句為單位的知識點檢索。這是文獻檢索史上的一個飛躍。知識發現瞬間化開發要做的工作,除了依賴于信息化通道,首先,要對知識資源進行高質量的數字化。根據知識資源本身的特點、用途以及相關媒體的技術特點,采用相應的標準、格式對作品資源進行數字化。作品數碼化有不同的深度,以一本文字作品為例,人民出版社從6個層面上對圖書進行了編碼:每個文字編碼、每個語段編碼、每個章節編碼、每頁作品編碼、每件作品編碼、每個作品體系編碼。作品數碼化開發越深,知識資源的用途就越大。其次,對數字化的作品資源進行結構化加工。按一定的邏輯結構,特別是按學科體系、用戶需求和使用習慣,在數據庫中對作品資源進行有序存放和展現。同樣的知識信息排列結構不同,形成的產品也不同;結構化程度越高,越能實現知識元素相互之間的關聯,越有利于實現閱讀求知方式的智能化。知識資源結構化與非結構化相比,其使用價值可以以幾何級數增長。人民出版社對近20000本黨政類圖書的電子數據,按照邏輯體系、發展歷程、知識點關聯三種方式進行分類排序,展現出整個理論體系的內在有機聯系,每一部作品都不僅僅是一個獨立的個體,而是被放到完整的理論體系中來展現和傳播。第三,碎片化加工。采用現代標引技術以及詞庫開發技術等,把作品加工成以段落、句子等為單位存在的元素,并通過相應的軟件,使讀者可以快捷方便地檢索使用。碎片化難在語義化,即使檢索出來的文字碎片具有一定的含義或主題。近年來,人民出版社在承建“中國共產黨思想理論資源數據庫”的過程中開創了機器標引加入適當人工的辦法,研發成功了“人民金典語義查詢系統”,把黨的思想理論文獻加工成近億個可供準確查詢的知識點,使文字檢索的語義準確率達到了70—95%準確率。
3.5 知識學習互動化開發。也就是使承載知識的網絡化產品帶有讀者之間互動交流功能。傳統紙質書是一個承載知識的獨立產品,其本身不存在與人交流的功能。現代信息技術條件下,可以通過開發,使網絡化閱讀軟件上附帶相應通信功能,人們可以用于向特定或廣大的其他讀者推送自己的認識和見解,與對方進行交流,相互學習提高。知識學習互動化開發,除了需要利用良好的通信條件,還需要通過挖掘用戶的需求,對作品資源進行特定加工,開發出相應的互動軟件。■