文|唐曉梅
互聯網自誕生以來,其網絡規模一直在不斷快速增長。據CNNIC調查顯示,截至2011年12月,我國互聯網用戶達5.13億,比一年前增加12%,呈現出迅猛增長的發展趨勢。互聯網已經成為信息傳播的主要渠道之一。特別是隨著三網融合技術的不斷推進,電信網、計算機網和有線電視網三大網絡在業務應用上逐漸走向融合,技術上趨向一致,網絡層上實現互聯互通,形成無縫覆蓋的多樣化、多媒體化、個性化的網絡體系,更進一步促使互聯網成為重要的多媒體傳播平臺。
數字內容的傳播快速、參與個體眾多、傳播渠道多樣化,也給全球范圍的版權制度帶來了巨大的挑戰和沖擊,版權保護問題,已成為持續的國際熱點問題之一。數字內容的發布與傳播,涉及到版權保護以及合法用戶的正常使用,數字版權管理應運而生。數字版權管理(Digital Rights Management, DRM)是一項涉及到技術、法律以及商業中各個層面的系統工程,它為數字媒體的商業運作提供了一套完整的實現手段。
目前的數字版權保護系統的實現機制主要是在操作系統級進行數字內容的保護,技術系統部署在通用的系統運行平臺上,如個人計算機或移動終端,數字內容的解密和加密驗證過程都是由操作系統層次上的DRM客戶端來負責。這種傳統的版權保護技術能夠提供端到端的版權保護方案,但在信息傳播范圍越來越廣泛、傳播渠道越來越多樣化、傳播體系越來越趨于開放的今天,超越DRM技術的數字版權追蹤與監測越來越成為新的行業熱點。
在數字內容追蹤與監測系統中,面臨的最大難題和挑戰是對數字內容的高效、快速識別。傳統識別技術包括水印技術和哈希轉換技術等,但在某些特定應用領域,上述技術存在一定的局限性。
水印技術
數字水印技術通過一定的算法將一些標志性信息直接嵌入到多媒體內容中,但不影響原內容的價值和使用,并且不能被人的知覺系統覺察或感知,只有通過專用的檢測器或閱讀器才能提取。但加水印會使數字內容發生改變,且多種水印技術互相之間不兼容,追蹤和監測比較困難,且目前存在于傳播發環節中的大多數數字內容是沒有加水印的。因此用水印技術來進行內容識別具有一定的局限性。
哈希轉換技術
哈希轉換技術是一種二進制文件驗證技術。它對數字內容的編輯,如剪切、壓縮等操作非常敏感,微小的文件變化都會導致哈希值的變化。該技術多用于數據鑒定和完整性校驗中,而在傳播途徑多樣化的現代化傳播發體系中數字版權的追蹤,仍有一定的局限性。
1.技術總體架構
通過無線局域網絡來控制橋吊的動作,以模仿橋吊司機在司機室中的操縱動作。通過安裝在橋吊上的攝像探頭,獲取現場的實時影像,發送回操控室遠程遙控操作裝置前的顯示屏,反饋操縱動作的結果,使遠程遙控操作實現可視化。
基于“數字基因”的版權保護追蹤與監測技術包括以下幾個核心部分:“數字基因”提取、基因母本管理、互聯網內容分析,以及基因查詢比對模塊。技術架構如圖1所示。

圖1 基于“數字基因”的數字版權追蹤與監測架構圖

圖2 網站發現過程

圖3 內容獲取過程
“數字基因”指能夠唯一標識數字內容的特征信息,可針對文字、圖片和視頻內容的數字特征信息進行提取、生成基因文件并備案,利用技術系統對所提取的數字基因進行管理,同時對互聯網上的數字內容使用進行監測、分析,與基因母本庫中的內容進行比對,獲取非法使用數字內容的證據,從而達到數字版權追蹤與監測的目的。
該技術具有特征值數據量小、算法不可逆的特點。多媒體內容特別是音視頻文件數據量比較大,利用基因提取模塊對內容進行特征信息的提取,再將提取獲得的基因數據傳送到后臺分析系統進行比對分析,大大降低數據傳輸量以及存儲容量。同時,由于基因提取算法不可逆,擁有基因數據后,無法還原母本的信息,因此使用基因傳輸能夠增強數據的安全性,大大降低母本泄漏的可能性。
2.關鍵技術網站發現
該模塊主要通過爬蟲實現,其一,可通過不斷分析抓到的網頁發現新的網頁url鏈接,再抓取該新的網頁用于分析,重復以上步驟以不停發現新的網頁。其二,也可通過搜索關鍵字,發現符合關鍵字內容的網頁url并抓取該網頁網站。
網站發現過程如圖2所示。
簡而言之,系統能夠自動根據預先設置好的規則和手段,對網站進行檢索掃描,找出新出現的內容網站,如音視頻網站、圖片網站等。
內容獲取
其中,根據不同內容類型以及傳播渠道,通過采用專門的手段進行分析,可定制相應的瀏覽器前端,從而完成內容的下載獲取。
基因提取
基因提取功能主要目的在于提取文章、圖片或音視頻內容的基因,生成基因文件并備案。基因提取分母本基因提取與樣本基因提取。母本基因提取的原始內容源為版權擁有方發布的圖文音像等數字內容;樣本基因提取的原始內容源為目標網站上需要監測的相應數字內容?;蛱崛∵^程如圖4所示。
由于多媒體內容特別是音視頻文件一般都體積巨大,因此不適合直接傳輸到后臺分析系統進行處理,而會利用基因提取模塊對內容進行特征信息也即基因的提取,然后將基因數據發送到后臺分析系統進行比對分析,從而大大降低數據傳輸量以及存儲容量。

圖4 基因提取過程

圖5 基因比對分析過程

圖6 監測報告產生過程
基因比對分析
基因比對分析的主要功能是接收外部的基因查詢比對任務,包括文字、圖片和音視頻的查詢比對,記錄任務相關性信息,將任務中要求查詢的樣本基因與母本數據庫中所有母本基因做對比,發現匹配度高的母本基因,然后根據該母本基因錄入時附帶的相關信息辨別該母本基因的內容,最后將按照系統規定的協議生成查詢比對結果返回給監測管理系統,同時記錄并備案?;虮葘Ψ治鲞^程如圖5所示.
監測報告
監測結果將由系統自動分析統計并以圖表的方式通過網頁展現給系統使用者,系統使用者可以通過制定一些規則對監測結果進行篩選,獲取自己關心的信息并生成報表打印出來,從而生成監測報告。監測報告產生過程如圖6所示.
監測結果數據挖掘功能根據監測結果管理員定義的數據規則,對監測結果數據進行數據挖掘,分析、統計和匯總以后返回滿足管理員需求的數據內容。
通過對監測報告的數據分析,可以有效計算出,盜版行為對版權擁有方的危害以及所造成的負面影響,通過系統平臺發送下架通知等版權保護行為的實施,可以有效保障版權擁有方的利益不受侵害,或將危害減小到最小程度,從而實現對版權擁有方媒體資產進行有效的版權保護,保障資產增值的效益最大化;同時對版權擁有方媒體資產進行有效的監測,為互聯網新聞監管及影響力評估等業務提供有力支撐。
監測結果數據挖掘
監測結果數據挖掘功能根據監測結果管理員定義的數據規則,對監測結果數據進行數據挖掘,分析、統計和匯總以后返回滿足管理員需求的數據內容。
“數字基因”技術是一種先進的數字內容識別技術,基于該技術的數字版權追蹤與監測相關技術系統已經達到了成熟實用階段,隨著我國文化產業國際化趨勢越來越明確,該技術必將在未來發揮更大的作用?!?/p>