程美華 李美瑩


摘? 要? 文章從技術的視角,對網絡文學的版權困境與版權保護的技術探索進行闡述與分析,并提出完善法律體系、推進技術監管等措施,使網絡文學版權保護技術得以落地,以期能夠為網絡文學的版權保護實踐提供新的思路。
關鍵詞? 網絡文學;版權保護;文字指紋識別系統;區塊鏈
中圖分類號? G2? ? ? 文獻標識碼? A? ? ? 文章編號? 2096-0360(2020)17-0045-04
隨著技術的不斷發展與普及,以及互聯網產業的成熟化,網絡文學逐漸從早期BBS上的免費模式發展到以平臺為載體的付費模式。起點中文網、晉江文學城、榕樹下等一系列網絡小說平臺借助商業資本的力量,走向了一條以市場為導向的產業化的道路[1],付費閱讀模式逐漸被讀者接受。但由于技術門檻較低、部分讀者付費意愿不強以及在法律上難以取證等原因,網絡文學盜版現象屢見不鮮,成為其發展過程中的“阿喀琉斯之踵”。
筆者對國內網絡文學相關的研究進行梳理時發現,目前已經有許多學者對于網絡文學版權保護的問題進行了探討。荊琦從網絡文學版權保護在法律層面上的不足進行探析,并提出完善著作權懲罰性賠償的構想[2]。田常清、孟鑫從網絡文學侵權的特征、成因等方面進行分析,并提出了增強國民版權保護意識、優化組織管理等對策[3]。肖海、江舒通過對于日本動漫版權保護體系的研究,提出對于中國網絡文學版權保護的啟示[4]。這些成果主要從法律層面或版權意識等方面提出建設性意見,但尚未有學者從技術層面對網絡文學版權保護問題進行詳細的分析。本文擬從技術的視角,對網絡文學版權保護問題進行探析。
1? 網絡文學版權困境
根據艾瑞咨詢中國網絡文學盜版損失模型最新核算數據,2019年中國網絡文學總體盜版損失規模為56.4億元,其中移動端盜版損失規模為39.3億元,同比增長了10.4%。如此大規模的網絡文學盜版損失,不僅分流了網絡文學網站與讀者的主要利潤來源,也在一定程度上打擊了作者的創作積極性。網絡文學版權的困境主要表現在以下幾個方面。
1.1? 盜版網站門檻較低
1.1.1? 準入門檻低
與數字音樂的mp3、wav、wam格式或網絡視頻的mov、avi等格式的大體積儲存空間不同,網絡文學主要以txt、epub等格式為主,是PC端及大多數移動終端的文本通用格式,體積相對較小,存儲更加方便。對于盜文網站來講,文本格式較小的存儲空間極大地弱化了網站對服務器帶寬的壓力,因此也降低了網站的準入門檻。也正是這種體量較輕的運營模式和成本較低的準入門檻,使網絡文學盜版網站能夠不斷涌入市場。
1.1.2? 技術門檻低
網絡文學盜版網站泛濫的另一原因即技術門檻較低。頭部盜文網站通過訂閱VIP渠道自動采集所需要內容,在相對較短的時間內便可實時抓取更新章節,而更多的小平臺是通過盜取頭部盜文網站資源。如果說之前的盜文還要通過寫Python程序對內容按章節進行抓取,有一定的技術門檻與人力成本,那么現在利用采集器自動抓取正版網站內容,就是“傻瓜式”的操作模式。目前盜版網站常用的關關采集器就是這種針對小說網站專門設計的程序,很大程度上降低了盜版網站所需要的技術門檻。
1.1.3? 運營門檻低
網絡文學的盜版網站主要運營模式是利用免費小說來吸引用戶點擊,進而將用戶的注意力販賣給廣告商,在整個運營的閉環中,網站收入來源主要是廣告,販售的核心產品則是用戶的點擊與注意力。因此,在網站的運營過程中主要的是引入用戶流量,即盜取并發布內容后,由負責SEO(搜索引擎優化)的編輯提升該網站在搜索引擎上的綜合排名,更容易被用戶點擊。與正版網絡文學網站需要對接作者、吸引讀者、榜單獎勵等諸多運營機制相比,盜版網站的運營門檻相對較低。
1.2? 侵權行為成本較低
1.2.1? 相關法律的滯后性
目前已經制定了一系列如《中華人民共和國著作權法》《信息網絡傳播保護條例》《最高人民法院關于審理侵害信息網絡傳播權民事糾紛案件適用法律若干問題的規定》等關于知識產權的法律法規、司法解釋,對于著作權保護方面確實產生了一定成果[5]。但由于法律的滯后性,面對互聯網時代由新技術引發的網絡文學作品著作權問題,無法給予有效的保障與及時的救濟[6],對于侵權者也沒能及時給予相關的判罰與賠償,由此便使侵權行為愈演愈烈。
1.2.2? 行為主體判定復雜
在網絡文學侵權行為中,行為主體的判定是十分復雜的。第一,盜版網站一般將服務器設立在海外,且頻繁更換域名及網站名稱,加大了技術追蹤的難度,使版權方在追溯責任的時候十分困難。第二,盜版網站經常依據“避風港原則”,逃避可能存在的追責。例如盜文的頭部網站“筆趣閣”就在網站底部標注“本站所有小說為轉載作品,所有章節均由網友上傳”,以技術中立為借口免除侵權的責任。第三,由于網民的付費意識不強,許多用戶偏向主動選擇免費的盜版小說,但很難追溯用戶來源,版權方無法對看盜版小說的用戶進行有效追責。
1.2.3? 訴訟過程繁瑣
由于版權方提出訴訟的過程中程序較為繁瑣,成本較高,但獲賠金額卻相對較少,不足以彌補版權方的損失,也無法給侵權方帶來壓力和警示。這就使版權方疲于訴訟,而侵權方在關站后往往另起爐灶,以“一庫多站”的模式繼續存在。
2? 版權保護的技術探索
網絡文學因盜版問題損失較大,且由于判定復雜、訴訟繁瑣等原因,很難通過法律手段對于侵權行為進行精準打擊。面對網絡文學版權問題現存的諸多困境,很多網絡文學平臺不斷升級平臺的版權保護技術,從源頭上遏制盜版行為。
2.1? 文字指紋識別系統
2.1.1? 系統結構(圖1)
在文字指紋識別系統的整個結構中,主要可以概括為爬取內容、編碼指紋、庫內對比與數據分析這幾個步驟。
爬蟲系統的主要目的是從網絡文學的盜版網站中抓取網頁內容,為整個大的文字指紋識別系統提供待檢測的內容,是原始數據的來源。在抓取完原始數據后,再對海量數據進行編碼,這一步驟就是通過Simhash算法生成二進制字符串作為指紋,為后續的比對工作做好前期工作。
通過算法生成的指紋是確定的,而相同文本的指紋也是相同的,指紋特征越相似,文本內容也就越相似。比對的過程就是將新生成的指紋與版權方的庫內指紋進行對比,迅速判斷新文本與庫內文本是否有重復,最后由數據分析系統對大量文本的指紋比對結果進行統計與分析,最后生成報告并進行追蹤。
2.1.2? 算法適用性
文字指紋識別系統本質上是模仿生物學的指紋,將文本哈希成數字指紋的技術,以對比文本指紋間的相似度。其中Simhash算法因其檢測較為準確,且檢測速度較快,而得到廣泛使用[7]。
有研究結果顯示,在應用過程中,Simhash具有無法識別由同義詞產生重復等問題,但是在網絡小說的侵權過程中,盜版網站為了節約時間成本與人力成本,往往直接對正版網站內容進行抓取,不存在對內容進行同義詞替換等問題,因此Simhash算法在網絡文學的版權保護過程中是更加適用的。
2.1.3? 現實應用
由盛大文學開發并投入使用的防盜版軟件核心就是文字指紋識別系統,主要通過計算機程序提取盜版網站文本特征后,與數據庫內文本特征進行比對,進而對盜版網站進行實時監控并取得侵權證據。該系統上線后,不僅在網站內容抄襲判定上卓有成效,對于盜版網站也有不小的打擊。
除了應用在網絡文學的版權保護中,文字指紋識別系統的思路還應用在了段視頻侵權內容打擊上面,字節跳動自主研發的視頻版權保護系統“靈識系統”就是利用相同的思路將每一個段視頻指紋進行比對,以此快速發現侵權內容。
2.2? 區塊鏈技術
區塊鏈技術實質上是一種分布式記賬系統,由于其具有的去中心化、防篡改以及共識信任等特征[8],可以用于解決數字作品的版權問題。目前在國外,已經有Monegraph、Blockai等項目專門利用區塊鏈技術去保護藝術家的數字資產。
2.2.1? 系統結構(圖2)
在區塊鏈應用于版權保護的過程中,首先是作者注冊后,上傳自有版權內容[8],而后通過時間戳和哈希樹根值進行版權的登記,將版權的信息登記在區塊鏈中,生成無法篡改的分布式賬本,并使之能夠隨時調閱[9]。
將作品進行上傳、登記后,由作者自行設置授權模式或分銷渠道,給作者較強的自主性,最后由平臺對于作者身份真實性、版權及作品證明進行審核,確認區塊鏈中數據的準確性。
2.2.2? 版權登記適用性
在區塊鏈中進行版權登記時,主要是應用時間戳和哈希樹根值,其中哈希樹根值主要是對作者的身份、上傳的時間、具體表現形式等內容進行登記,但是對于作品的獨創性是無法進行確認的。
因此,區塊鏈技術在網絡文學版權的應用中,尚難以對抄襲等涉及作品獨創性的侵權行為進行判定,但是對于其他網站的“盜文”行為則能夠高效地判定并對于證據進行有效留存。
2.2.3? 現實應用
目前利用區塊鏈進行版權保護的嘗試已經開啟,國內的紙貴、億書等公司就是以區塊鏈保護版權為主要項目方向。
其中紙貴科技就是通過“區塊鏈+版權保護”,實現侵權取證、版權存癥的一站式版權保護服務,平臺對于侵權的頁面進行實時保存的同時將取證上傳至杭州之江公證處進行公正,形成具備法律效力的電子證據并上傳至區塊鏈中,供日后第三方檢驗使用。
3? 推進版權保護的有效策略
如果認為僅僅依靠技術的進步就能夠鑄成網絡文學版權保護的護城河,那么無疑是陷入了技術決定論的巢窠,我們無法忽視技術所帶來的變革,但也同樣不能盲目地崇拜技術。在推進網絡文學版權保護技術落地的過程中,同樣也要從法律保障與技術監管等方面進一步推進版權的保護進程。
3.1? 完善法律體系
無論是文字指紋識別系統還是區塊鏈技術,目前在版權保護中所扮演的角色主要還是集中在取證與存證上,如何打擊網絡文學盜版網站并保護版權方利益,則是由法律體系來進行保障。
于2018年通過的《最高人民法院關于互聯網法院審理案件若干問題的規定》,在第十一條中就提到了電子數據的確認問題——“當事人提交的電子數據,通過電子簽名、可信時間戳、哈希值校驗、區塊鏈等證據收集、固定和防篡改的技術手段或者通過電子取證存證平臺認證,能夠證明其真實性的,互聯網法院應當確認。”[10]
該規定在一方面承認了區塊鏈保存電子證據的方式,另一方面也規定了如何審查新出現的電子數據真實性,是一種面向新的版權保護技術,不斷對法律法規進行完善和補充的思路的體現。
3.2? 推進技術監管
有關部門應該對新出現的網絡文學盜版現象加大監管力度,并針對技術造成的盜版現象進行專項的監管行動,打擊技術侵權問題。國家版權局、工業和信息化部、公安部、國家互聯網信息辦公室聯合啟動的“2020劍網”就是針對網絡的盜版侵權行為展開的專項行動,其中強調了要繼續鞏固網絡文學、網盤等領域取得的工作成果,持續打擊網絡文學侵權問題[11]。
除了對于盜版技術的監管,也應該加強對于新出現的版權保護技術的監管——目前區塊鏈技術在版權方面的應用仍然存在著缺乏行業自律、外界監管等問題。在對于新出現的版權保護技術監管的過程中,也應該在鼓勵行業內部加強自律,建立自律制度與行業準則的同時,加強相關部門與社會公眾的有效監督,促進行業有效健康發展。
4? 結語
網絡文學的版權保護并非學界新提出的問題,但在業界卻對于盜版侵權現象屢禁不止,雖然從技術方面來看,已經出現了較為有效的新技術,能夠迅速對于盜版網站進行分析、追蹤、取證與存證,對于推動網絡文學版權保護有一定的保護作用的同時,也存在著一些適用性難題[12]。因此,在不斷推進版權保護的技術革新的同時,還應該在法律體系、行業自律與外部監管等方面不斷完善,共同推動網絡文學版權保護的進步。
參考文獻
[1]茅碩.商業化背景下的網絡文學發展現狀與前景[J].科技與出版,2016(10):108-111.
[2]荊琦.對我國網絡文學作品侵權懲罰性賠償制度的分析[J].法制博覽,2019(21):90-91.
[3]田常清,孟鑫.我國網絡文學著作權侵權成因及對策分析[J].出版與印刷,2020(1):55-61.
[4]肖海,江舒.日本動漫版權保護對中國網絡文學版權保護的啟示[J].大慶師范學院學報,2020,40(2):58-66.
[5]王偉亮.常見“似是而非”著作權問題例析[J].青年記者,2017(6):22-24.
[6]賈淑華.網絡文學作品的著作權保護:困境、根源及突破路徑[J].戲劇之家,2020(6):186-188.
[7]姜雪,萬正景,梁燕,陶以政.基于語義指紋的海量文本快速相似檢測算法研究[J].電腦知識與技術,2016,12(36):175-177.
[8]聶靜.基于區塊鏈的數字出版版權保護[J].出版發行研究,2017(9):33-36.
[9]賈引獅.基于區塊鏈技術的網絡版權交易問題研究[J].科技與出版,2018(7):90-98.
[10]胡仕浩.《最高人民法院關于互聯網法院審理案件若干問題的規定》的理解與適用[N].人民法院報,2018-09-08(004).
[11]“劍網2020”專項行動啟動? 聚焦5大重點領域[J].新聞世界,2020(7):36.
[12]黨璽,王萬玉.數字音樂版權區塊鏈技術保護的相關法律問題研究[J].電子知識產權,2020(4):28-42.