韓云鳳,郭 峰
(北方工業大學 計算機學院,北京 100144)
計算機網絡技術的快速發展和互聯網的廣泛普及,促進了數字內容。但由于互聯網環境具有開放性、全球性、非集中管理等特性,在這種自由的信息網絡中,論文的非法傳播和使用嚴重侵犯了期刊論文權利人的利益,在一定程度上阻礙了期刊論文的發展。面向互聯網的侵權檢測的核心任務是找到盜版源,為運用法律手段打擊侵權行為奠定基礎。對版權所有者的權益是一種保護,在一定程度上打擊侵權行為,使期刊論文版權問題得到一定程度的改善。文中從實際應用的角度,提出了一種理論與實際應用相結合的期刊論文侵權檢測模型。
數字水印是用于信息安全的重要技術,將關鍵的版權信息嵌入在數字作品中,可以提取和鑒別版權所屬,而且并不影響原作品的使用功能。數字水印技術基本上應該具有以下幾方面的特點[1]:
(1)魯棒性。
具有能抵抗攻擊的魯棒性,例如對數字作品進行裁剪、打印、旋轉等,水印還會一直存在于作品中。如果去除或者破壞水印信息,將導致作品無法正常使用。
(2)安全性。
具有低誤查率、難偽造、難篡改等特性。
(3)隱蔽性。
具有很好的隱蔽性,不影響原作品的正常使用。
(4)水印信息量。
嵌入的水印信息量必須能夠包含作品的作者或所有者的信息,或購買者的序列號。
網絡爬蟲是一個根據預設條件對互聯網上的信息進行遍歷的計算機程序[2]。其工作原理是:爬蟲從根的URL地址開始,爬取到第一個頁面并將其中的所有URL對應的頁面也抽取出來,并添加到爬蟲鏈接隊列中;然后從隊列中選擇下一個要爬取的網頁URL;重復以上過程,直到達到系統的某一終止條件為止。存儲所有符合條件的網頁,通過分析、過濾、建立索引,爬蟲每爬取一個網頁會下載欲爬取的信息到本地計算機上。在爬蟲運行的整個過程中,始終要保證爬蟲程序運行計算機與互聯網的連接和通暢。
這是一種相對獨立的程序,在網絡上按照某種規則去尋找計算和信息資源,并執行相應的任務,把結果返回給用戶。移動代理具有自主性、移動性、跨平臺性等特點,具有降低網絡流量、均衡網絡負載、分布式處理等優點[3]。
在網絡爬蟲檢測機制中,需要把滿足抓取條件的論文下載到本地進行檢測,即把數據移動到服務器端進行檢測。相對于網絡爬蟲檢測這種機制,移動代理是把程序放到數據端進行檢測[4],無需將期刊論文下載到本地進行檢測,所以移動代理檢測機制可以有效地降低分布式計算中的網絡負載,提高通信效率,從而有效解決大型網絡上的數字水印檢測問題。
出于安全性的考慮,基于互聯網的期刊論文侵權檢測系統在水印制作方案中應該采用密碼學的加密(版權擁有者注冊時認證中心下發的認證證書中的公開密鑰和私有密鑰)體系來加強。而且系統必須具備的功能應該包括權利人注冊獲得CA證書、權利人對期刊論文進行權利登記、向期刊論文嵌入數字水印和對互聯網上的期刊論文進行權利跟蹤和檢測。
系統框架主要包括四個對象:版權擁有者;版權管理服務器;水印檢測服務器;可疑主機(或可疑的主機范圍)。
系統主要包括三個模塊:期刊論文登記模塊;水印嵌入模塊;侵權檢測模塊。
將在2.3節和2.4節分析兩個模型的實現機制和檢測流程,旨在找到一種適合大型網絡的權利跟蹤和檢測模型。
版權擁有者首先要在版權管理服務系統上進行注冊,由版權管理系統審核通過后,CA中心發放CA證書,證書中包括版權擁有者的部分個人信息和公鑰與私鑰(這對密鑰對加入到期刊論文的版權標識符進行加密,當要證明權利時,該密鑰可以正確提取出嵌在期刊論文中的水印,認證中心對密鑰和版權擁有者進行認證——持有合法密鑰的用戶才是真正的版權擁有者[5])。
版權擁有者獲得CA證書后,登錄版權管理服務系統對期刊論文進行登記。登記審核通過后,由水印代理服務系統嵌入經過加密的版權標識符(水印信息)。
(1)水印嵌入。
版權標識符包含版權所有者姓名、論文登記號、版本號等信息。水印代理服務平臺對通過登記審核的期刊論文嵌入數字水印信息的過程如圖1所示。首先對水印信息進行加密,然后調用水印嵌入算法對原始論文嵌入水印信息,生成含有水印信息的論文。
(2)水印檢測。
水印的檢測是水印代理區別于其他代理的關鍵部分,也是代理工作的重點。水印代理通過自帶的密鑰恢復出水印。水印檢測過程如圖2所示。在檢測過程中,根據水印算法的不同,可能需要提供原始論文,首先將原始論文和待測論文進行相似性比較,如結果滿足一定條件,則認為待測論文中含有水印,采用水印提取算法提取水印的加密信息,然后利用密鑰進行解密,從而得到原始水印信息。

圖2 水印檢測流程
基于數字水印和網絡爬蟲的侵權檢測模型,主要由版權管理服務器和CA認證中心組成。當期刊論文版權擁有者懷疑其論文被侵權時,委托版權管理服務單位代其對論文進行侵權檢測,版權管理人員接到申請,根據用戶提供的可疑URL地址,用網絡爬蟲探測條件檢測所有的URL地址,并下載文件到本地,然后檢測是否包含了版權所有者所嵌入的數字水印信息,如果檢測到,查看其所在位置,如果所在地址未經過授權,則記錄并生成測試報告,作為法律依據進行維權活動。
在基于數字水印和網絡爬蟲的侵權檢測模型中,由于檢測模型是把要檢測的論文下載到本地,如果文件數量很大,這種方法并不適合。
數字水印和移動水印代理的檢測模型如圖3所示,主要由版權管理服務器、CA認證中心和水印檢測服務器組成。

圖3 移動水印代理檢測模型
系統包括三部分:基本的代理服務器(支持移動代理運行的環境);移動代理;控制中心(控制代理的運行,根據檢測結果給代理指示,并設置對檢測到的侵權文件采取一定的措施)。
水印代理檢測模型示意如圖4所示。
模型工作過程如下:
(1)版權所有者發送檢測委托申請。
當版權所有者要檢測其論文是否被侵權時,可以向版權管理服務器發送一個檢測委托申請,委托版權管理單位代其在互聯網上檢測其論文是否被侵權,版權管理管理單位根據委托對象和委托內容獲取該論文所有者的密鑰以及被檢測論文的水印信息,通過圖4中提供的檢測服務接口向水印檢測代理控制中心發送檢測請求。
(2)控制中心產生水印代理公文包和水印代理。
控制中心根據代理知識庫和請求內容制定水印代理遷移策略和指定目標主機或主機范圍,控制中心把檢測服務接口傳遞的密鑰、水印信息,控制中心制定的遷移策略、目標主機和中止條件等信息封裝成一個水印代理條件公文包,因為水印條件參數以公文包的形式封裝在網絡上傳輸更安全,控制中心根據水印參數產生水印代理。

圖4 水印代理檢測結構
(3)派遣水印代理。
將分配一個水印代理到指定主機或者主機范圍。
(4)執行水印代理。
代理服務器用于代理在主機間的移動,并為其分配執行環境和服務接口。代理在代理服務器中執行時,通過移動代理通信語言通信并訪問代理服務器提供的服務[6-7]。水印代理到達遠程站點上與代理服務器(agent server)取得聯系,代理服務器將會為水印代理創造執行環境,并執行水印代理。
(5)檢測水印信息。
移動代理過濾文件系統文件找到目標論文,移動代理將提取水印。
(6)收集水印報告。
代理控制中心從網絡上收集移動水印發送過來的報告,并且存入報告庫,控制中心可以根據發送來的報告規則來更新知識庫,為水印代理下一次更智能的遷移提供保障。
因此,在基于數字水印和移動水印代理的侵權檢測模型中,是把程序移動數據端進行計算而不是把大量的數據移動到程序端進行計算,這種模型可以有效地降低分布式計算中的網絡負載,提高通信效率,有效地解決大型網絡上的數字水印檢測問題[8-14]。
系統的水印嵌入部分是用C語言實現的,但是由于Java移動的跨平臺性,系統的移動代理是用Java代碼實現的。為了使Java對象可以方便地調用C語言的水印函數,該系統利用Java語言實現。
系統的水印嵌入和檢測效果如圖5所示。

圖5 水印嵌入和檢測效果
其水印嵌入和檢測如下:
(1)水印嵌入。
其中圖(a)為原始圖片,通過系統的水印嵌入界面,嵌入水印后圖像如圖(c)所示。可以看到,用肉眼看不出原始圖片和嵌入水印后圖像的任何區別。因此,嵌入水印后的圖像的商用價值未被破壞。
(2)水印檢測。
對圖(c)嵌入后的圖像,根據版權所有者的密鑰和嵌入算法,使用檢測算法提出水印信息。提取出的水印信息界面如圖(d)所示。
系統對移動水印代理侵權檢測模型和網絡爬蟲侵權檢測模型進行測試,結果如表1所示。

表1 網絡爬蟲和移動代理檢測對比
根據以上的對比結果,該系統采用移動代理水印檢測技術在大型網絡中實現期刊論文侵權檢測將會更加高效。
提出的基于數字水印代理技術的水印檢測模型優勢如下:水印代理機制是將可執行的程序放到遠程服務器執行,從而減少了網絡負載;控制中心可以創建多個代理,可以在多個機器上執行,從而提高了并行計算能力;移動水印代理不要求網絡一直保持連接狀態,可以異步傳回檢查結果。
因此,數字水印代理檢測模式的分布式處理和非同步性提高了計算效率,程序移動到遠程數據端進行處理的方式極大減少了網絡阻塞,非常適合大型分布式互聯網絡中期刊論文的保護和侵權檢測。