■文/殷圣忠 朱 穎
媒體融合發展下多媒體采編系統技術建設方案
■文/殷圣忠 朱穎
隨著媒體融合時代的到來,傳統媒體固有的信息傳播方式已經被互聯網所顛覆,互聯網不僅是新聞傳播的手段,更成為獲取新聞的一種重要途徑。原有新聞采編發系統受其所固有的封閉性限制,已難以滿足媒體融合時代信息傳播模式下的面向公眾開放交互、以數據服務為核心、即時采編發等需求;另一方面,面向互聯網下的多類型多維度海量數據管理、即時分發、深度挖掘,也對新聞采編發系統在可靠性、安全性、擴展性方面提出了更高的要求。
媒體融合;采編;建設方案
中國新聞社原有新聞采編發系統基于信息管理系統框架構建,面向新聞采編流程,實現了新聞采編發自動化作業和全程監控管理,極大提高了新聞采編發效率,探索出了一條行之有效的、規范的信息采編流程。
新聞采編發系統作為媒體轉型融合的技術支撐平臺,應將傳統媒體和新媒體傳播通道有效結合、資源共享、集中處理,從而衍生出更加符合受眾需求的信息產品。同時需要看到,通過多年實踐,新聞采編發業務模型、流程已經形成,新平臺構建中需要在總體上延續原有運行模式,針對媒體融合特點,合理重構采編流程,設計符合互聯網思維的、滿足國內外業務部門需求的、支持媒體融合發展的多媒體采編大平臺。
2.1建設需求
綜合考慮媒體融合應用和未來發展需求,新多媒體采編系統在保持原有業務模型、數據和采編發基本功能不變的基礎上,主要建設目標如下:
為記者、編輯構建在線投稿、移動辦公平臺,支持媒體融合下業務發展格局和業務流程,并充分考慮與原有應用系統的無縫連接;
統一管理分布在不同區域的數據資源,實現智能分析,資源共享,支持大數據新聞輔助編輯;實時監控系統運行狀態、數據業務流程,實現智能高效的運維管理;負載能力高、可擴展性強,為各類應用提供即時響應。
2.2系統架構設計
新一代多媒體采編發大平臺采用“五橫兩縱”的多層應用架構設計,安全保障體系與標準規范體系貫穿整個系統,基本架構如圖1所示。
表現層是系統和用戶間的橋梁,為記者、編輯、管理人員提供了交互良好的操作界面,為用戶提供信息展示交互、授權下載、查詢檢索、分析報表等功能;應用服務層是系統的核心層,采用面向服務的體系結構(SOA),為各類應用提供包括統一身份認證、在線投稿、移動采編、文字圖片編輯、公共稿庫管理、成品稿庫及發布服務、稿件統計、監控預警等核心服務支持;接口層完成應用服務層與數據存儲層之間的通信和接口轉換,確保各類應用對共享數據資源的統一訪問;數據存儲層采用關系型數據庫和全文數據庫相結合的方式,建立了新聞資源的公共稿庫,實現對資源數據的匯聚、存儲和管理,采用全文檢索實現對關系數據中數據資源的全文索引創建;支撐環境層主要包含操作系統、應用中間件和防毒軟件等軟件環境,以及服務器、存儲、交換機等硬件環境部分。
安全保障體系縱向貫穿整個層面,從支撐環境層到表現層都進行安全管理,保障系統安全運行;標準規范體系在各層建設統一接口規范,包括文件存儲規范、XML文件格式規范、數據完整性一致性要求、統一身份認證系統與第三方應用系統的接口規范等。
2.3系統主要技術特點
基于分層架構構建應用系統,各層相互獨立,前后臺分離,既保證系統良好的可擴展性、易用性,又保證系統核心數據安全。
綜合多種安全技術進行分區、分層防護,建立安全高效的網絡安全體系。
統一具體標準和規范,便于海量數據管理和監控系統的智能化。
采用非關系數據庫和智能處理技術,有效提升系統的大數據應用能力。
新多媒體采編系統實現了整體架構與業務需求接軌,同時在主要環節上引入了關鍵技術,有效提高系統工作性能。
3.1采用可伸縮線性擴展系統架構,便于擴展和管理
綜合考慮系統當前性能以及擴展需求,系統硬件平臺采用集群和網絡存儲模式,并綜合采用縱向擴展(Scale-up)和橫向擴展 (Scale-out)兩種方式進行系統擴展。后臺服務器集群根據訪問群與承載功能的不同進行分區部署和冗余備份,當系統壓力增大需要擴展時,可在原有集群組中加入新的服務器;存儲平臺采用網絡連接存儲(NAS)及存儲區域網絡(SAN)混合存儲方式,NAS存儲主要存儲業務應用非格式化數據,SAN存儲主要用于存儲數據庫核心數據。需要擴展時,SAN存儲采用Scale-up方式擴充,NAS存儲采用Scale-out方式擴充。
3.2綜合緩存加速、讀寫分離、按需存儲、組播等多種手段,提升大數據處理能力
為滿足多用戶并發、海量多媒體信息快速檢索訪問的需求,系統在設計時針對影響系統性能的各個環節進行優化,綜合利用多種技術手段提升用戶交互的響應速度。
在數據服務上,采用緩存加速技術,實現海量多媒體信息快速訪問。為提高請求的處理效率,采用Apache + Squid方案提升系統的抗負載能力。Apache響應靜態請求,應用服務器響應動態請求。
在數據庫結構上,采用ORACLE數據庫集群技術來實現讀寫分離,通過主從數據庫的讀寫分離,有效減輕數據庫壓力,進一步提高了數據庫的工作效率,改善用戶體驗。
在訪問模式上,利用異步JavaScript 和XML技術(Ajax)來實現數據的按需獲取,以減輕系統整體負擔。Ajax相當于在用戶和服務器上加一個中間層,使用戶操作與服務器響應異步化,用戶處的Ajax完成一部分數據驗證和數據處理工作,僅將必須的新數據申請發給服務器,從而減輕服務器負擔、減少用戶等待時間。
在網絡傳輸上,采用組播技術來實現集群服務器間的數據同步,優化網絡環境。組播技術不僅控制網絡流量、消除流量冗余,而且降低服務器和交換機的負擔,有效提升面向互聯網的分布式應用性能。
3.3靈活運用內容管理、數據檢索和文本挖掘技術,支持大數據條件下的新聞輔助編輯
分析海量數據來挖掘數據表象之下的真相獲取“數據新聞”,已成為當前一種重要的新聞生產方式,媒體融合下新聞采編系統的內容管理是一個集人、過程與技術于一體的“技術—社會”工程,將各種非結構化或半結構化的數據資源進行采集、管理、利用、傳遞和增值,并有機集成到結構化數據庫中,讓不同部門、不同需求的用戶都能流暢使用,以實現真正高效的內容管理服務。
數據檢索技術幫助使用者快速定位所需內容。按照搜索方法可分為全文搜索、上下文搜索等。面對海量的內容數據和并發檢索壓力,新采編系統綜合采用智能化信息檢索技術、自然語言查詢、多媒體信息檢索技術等來實現智能檢索。
在新聞編輯審核過程中,采用文本挖掘技術,對海量數據進行有效的分析處理,包括了信息抽取、信息檢索、自然語言處理和數據挖掘。利用內容語義分析、統計等各種智能手段,實現了自動分類、常識校對、文本相似性檢索、信息過濾、自然語言檢索等,在大規模的異構文本資源中提取出符合用戶需求的簡潔、精煉、可理解的數據信息。
推動傳統媒體和新興媒體融合發展是一項復雜的系統工程,多媒體采編系統的建設是媒體融合的基礎。我們應當實時關注和把握技術發展趨勢,堅持先進技術為支撐、內容建設為根本,結合媒體應用實際,找到新技術在媒體融合中的應用切入點,探索傳統媒體與新興媒體在內容、渠道、平臺、經營、管理等方面的深度融合。在中國新聞社多媒體采編系統項目的建設過程中,我們初步探討并重構了多媒體采編資源共享,完善了系統內部標準、流程和要求,強化了互聯網思維和一體化發展理念,進行了相應的內容建設、人才建設和機制建設,為立體多樣、融合發展的現代化傳播體系構建了堅實的基礎。
(作者單位:中國新聞社技術部)
G203
A