999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數(shù)據(jù)生產(chǎn)理論下爬蟲技術(shù)的法律規(guī)制路徑*

2022-02-09 08:24:10高富平冉高苒
江淮論壇 2022年5期
關(guān)鍵詞:生產(chǎn)

高富平 冉高苒

(華東政法大學(xué)法律學(xué)院,上海 200042)

一、引言

在諸如人工智能、云計算、區(qū)塊鏈等紛繁復(fù)雜的新興技術(shù)之中,爬蟲技術(shù)(Data Scraping)似乎難以“新技術(shù)”自居。簡單說來,爬蟲技術(shù)就是從一個或多個網(wǎng)站上掃描和提取大量數(shù)據(jù)副本的過程。[1]從起源時間來看,早在20世紀(jì)90年代末,美國出現(xiàn)的賬戶聚合服務(wù)(Account Aggregation)中就已經(jīng)使用了早期的屏幕爬蟲(Screen Scraping)技術(shù),使客戶能夠在一個地方查看自己來自不同機構(gòu)的賬戶信息。[2]而我們慣常使用的谷歌搜索引擎也是在這個時期出現(xiàn),它也是爬蟲技術(shù)的早期技術(shù)形態(tài)。[3]2-3從技術(shù)普及情況來看,爬蟲技術(shù)已經(jīng)在眾多互聯(lián)網(wǎng)領(lǐng)域開始普遍使用。有機構(gòu)統(tǒng)計,目前有將近二分之一的網(wǎng)絡(luò)流量來自爬蟲技術(shù)。[4]爬蟲技術(shù)已經(jīng)成為被普遍使用的網(wǎng)絡(luò)技術(shù)之一。

新技術(shù)會提高生產(chǎn)力,促進經(jīng)濟發(fā)展,會帶來巨大的社會進步,但同時也會帶來在政治制度、社會制度以及經(jīng)濟制度之上的不平等。[5]對于爬蟲技術(shù)而言,由于其獲取散落數(shù)據(jù)的便捷性與低成本性,一方面成為需求者高效獲取數(shù)據(jù)的主要途徑,其重要性之于特定網(wǎng)絡(luò)商業(yè)模式不言而喻,但另一方面又因為其近似“盜竊”“掠奪”的資源獲取方式,給被爬者帶來了極大的防范成本和經(jīng)營困局,甚至由于其違背Robots協(xié)議(1)等“君子協(xié)定”而成為網(wǎng)絡(luò)世界人人喊打的“害蟲”。因此,對于技術(shù)與法律的研究者來說,需要謹(jǐn)慎、客觀地推進我們對新興技術(shù)領(lǐng)域的連續(xù)性觀察,及早發(fā)現(xiàn)既有模式存在的問題并加以改進,從而探索出符合人類社會普遍認知與行為準(zhǔn)則的途徑。[6]

本文將按照如下邏輯展開討論。首先,爬蟲技術(shù)呈現(xiàn)出從表層內(nèi)容爬蟲到底層原始數(shù)據(jù)爬蟲的流變趨勢。爬蟲技術(shù)的原始性、寄生性等特質(zhì)導(dǎo)致了目前的巨大爭議,而實踐中單純依靠現(xiàn)有法律規(guī)范并不能完全化解這些爭議。其次,從生產(chǎn)性的維度來看,爬蟲技術(shù)的流變是互聯(lián)網(wǎng)生產(chǎn)活動由內(nèi)容生產(chǎn)向數(shù)據(jù)生產(chǎn)深化的結(jié)果與體現(xiàn)。其中網(wǎng)絡(luò)運營者(或稱網(wǎng)絡(luò)平臺)發(fā)揮著重要的組織核心作用。(2)但現(xiàn)有法律并未對代碼層面的數(shù)據(jù)生產(chǎn)活動進行必要的規(guī)范,這在一定程度上導(dǎo)致了以爬蟲技術(shù)為代表的數(shù)據(jù)生產(chǎn)、利用秩序的混亂。理性對待爬蟲技術(shù)負面影響的同時,我們必須認識到其本質(zhì)是獲取數(shù)據(jù)生產(chǎn)活動所需的生產(chǎn)要素,核心目的系為實現(xiàn)數(shù)據(jù)重用。最后,通過對于各國探索與中國實踐的經(jīng)驗總結(jié),本文將討論如何超越數(shù)據(jù)權(quán)屬爭論,從數(shù)據(jù)利用秩序上解決爬蟲爭議的問題。網(wǎng)絡(luò)運營者基于數(shù)據(jù)生產(chǎn)活動事實上控制了數(shù)據(jù),法律應(yīng)當(dāng)承認并尊重這種事實上的財產(chǎn)性權(quán)益。為防止“反公地悲劇”的出現(xiàn),法律還需要賦予網(wǎng)絡(luò)運營者一定的數(shù)據(jù)分享義務(wù),以實現(xiàn)數(shù)據(jù)要素的充分流通和利用,從而從根本上實現(xiàn)對于非法爬蟲的科學(xué)規(guī)制。

二、爬蟲技術(shù)的流變與爭議

(一)爬蟲技術(shù)的發(fā)展流變

從技術(shù)目的上來說,爬蟲技術(shù)主要是為了方便、快捷地獲取網(wǎng)絡(luò)上海量的數(shù)據(jù)/信息應(yīng)運而生的。網(wǎng)絡(luò)可以承載傳輸海量的信息,為了獲取相關(guān)的有價值的信息,有許多公司專門雇用員工從互聯(lián)網(wǎng)上手動收集相關(guān)內(nèi)容。(3)這樣的方式看起來似乎原始至極,但卻是爬蟲技術(shù)的初始形態(tài)。隨著技術(shù)成本的降低,爬蟲技術(shù)很快擺脫了人工的束縛,進入程序/代碼或者機器爬蟲的階段。(4)

爬蟲技術(shù)從人工走向機器,其爬蟲對象也從淺層信息走向了底層數(shù)據(jù)。從數(shù)據(jù)/代碼角度來說,網(wǎng)絡(luò)提供的以任何形式呈現(xiàn)的內(nèi)容,包括網(wǎng)頁、超文本語言、文字、照片、視頻等等都是由結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的定量或定性數(shù)據(jù)組成。[7]這些數(shù)據(jù),首先是用澤字節(jié)(Zettabytes)測量的海量數(shù)據(jù);其次,這些數(shù)據(jù)存儲有各種各樣的格式,并依賴于各種技術(shù)和標(biāo)準(zhǔn);再次,這些數(shù)據(jù)并不是靜態(tài)的,它是以極快的速度生成、流通和修改變化的。[8]為了應(yīng)對上述的技術(shù)挑戰(zhàn),現(xiàn)階段的爬蟲技術(shù)開始被廣泛地定義為一種數(shù)據(jù)收集技術(shù),包括從一般的屏幕輸出中收集數(shù)據(jù),或從大多數(shù)網(wǎng)站顯示的HTML代碼中提取數(shù)據(jù),更為流行的是在通過解析對底層網(wǎng)絡(luò)數(shù)據(jù)進行訪問時,在沒有數(shù)據(jù)主機許可甚至感知的情況下爬取大量數(shù)據(jù)。[9]也正因此,如今爬蟲技術(shù)已經(jīng)從獲取網(wǎng)頁數(shù)據(jù)轉(zhuǎn)移至底層數(shù)據(jù),成為許多所謂的大數(shù)據(jù)公司獲取數(shù)據(jù)、從事大數(shù)據(jù)挖掘的最主要的手段[10]8,因此也被稱為數(shù)據(jù)爬蟲。

一開始,爬蟲技術(shù)看起來是一種簡單的信息獲取技術(shù),或者更接近于一般的傳播媒介技術(shù),而“媒介是人的延伸”[11],爬蟲技術(shù)為網(wǎng)絡(luò)用戶提供了器官與思維上獲取半徑的擴展,這種技術(shù)對任何網(wǎng)絡(luò)用戶而言具有積極意義。后來,人們逐漸發(fā)現(xiàn)如果爬蟲技術(shù)應(yīng)用于以信息聚合為代表的互聯(lián)網(wǎng)新興產(chǎn)業(yè)中,就不難看出其技術(shù)價值已經(jīng)由簡單的信息獲取走向新的聚合價值的生產(chǎn),由此,爬蟲技術(shù)成為了一種基礎(chǔ)數(shù)據(jù)資源的獲取(或者采集)工具。隨著網(wǎng)絡(luò)用戶開始習(xí)慣通過這種方式接受網(wǎng)絡(luò)服務(wù),傳統(tǒng)的(或者擁有先發(fā)優(yōu)勢的)網(wǎng)絡(luò)服務(wù)提供商就難以繼續(xù)沿用一般的網(wǎng)絡(luò)服務(wù)模式和生產(chǎn)模式開展商業(yè)活動。因為爬蟲技術(shù)開始妄圖成為一個一般性的商業(yè)模式基礎(chǔ)技術(shù)進入已有的網(wǎng)絡(luò)生產(chǎn)組織系統(tǒng),并妄圖以改變現(xiàn)有的法律態(tài)度以使得自身可以獲得合法的生產(chǎn)性地位。在這一階段,兩者之間的張力開始顯現(xiàn),傳統(tǒng)的生產(chǎn)商渴望揭示其背后的原始性與侵入性,削弱技術(shù)本身的合法性與正當(dāng)性,從而對其使用場景和空間進行壓縮。

(二)爬蟲技術(shù)的價值爭議與適法困境

爬蟲技術(shù)帶來的爭議可以從數(shù)據(jù)生產(chǎn)機制本身與法律規(guī)范兩個維度來分析。

一是數(shù)據(jù)生產(chǎn)機制層面的爭議。網(wǎng)絡(luò)運營者的構(gòu)架設(shè)計是一種面向長期的市場性的激勵機制,還為這種機制找到了穩(wěn)定的市場和法律環(huán)境,通過各種方法來組織維護它,以確保“平臺經(jīng)濟”的各參與方可以得到確定的收益。這種機制的生產(chǎn)性成本和“交叉收益”[12]都是巨大的,但爬蟲技術(shù)“寄生蟲”般的技術(shù)邏輯卻打破了這一平衡。首先,爬蟲技術(shù)具有原始性。此處與原始性相對應(yīng)的概念是市場性,就是指遵循所謂“市場的邏輯”,即“以利人之行,實現(xiàn)利己之心”。(5)在成熟的市場性生產(chǎn)機制中,為生產(chǎn)作出貢獻的主體都恰當(dāng)?shù)孬@得了相應(yīng)的貢獻對價。從用戶角度來看,作為UGC(User Generated Content)的貢獻者,用戶一方面獲得了來自網(wǎng)絡(luò)運營者的激勵補貼,同時也可以直接獲取源于自身IP的廣告利益;而網(wǎng)絡(luò)運營者則在“交叉收益”的機制下獲得了源自廣告商的收益,同時也可以直接向消費型用戶收取平臺服務(wù)的相關(guān)費用作為提供內(nèi)容產(chǎn)品的對價。對于爬蟲技術(shù)來說,由于獲取目標(biāo)數(shù)據(jù)是不需要向被爬者支付對價的,利益的獲取方只有爬蟲者。作為原始數(shù)據(jù)的生產(chǎn)者和控制者,用戶和網(wǎng)絡(luò)運營者在整個爬蟲的生產(chǎn)流程中處于利益缺位的狀態(tài)。這樣的數(shù)據(jù)生產(chǎn)方式類似于“掠奪式”的原始積累,具有生產(chǎn)要素獲取機制上的原始性。

其次,爬蟲技術(shù)具有寄生性。此處與寄生性相對應(yīng)的概念是共生性,體現(xiàn)在各個機制主體(即共生單元)之間可以進行物質(zhì)、信息和能量的雙向交流,這種交流是否存在或是否順暢是共生關(guān)系得以實現(xiàn)的基礎(chǔ)條件。[13]具體來看,就是用戶、平臺、廣告商之間可以實現(xiàn)資金、技術(shù)、信息的流通,可以構(gòu)建維持一個共生環(huán)境和共生界面。因此,有學(xué)者曾言,“共生,是運用科技增加社會福祉,用社會訴求推動科技創(chuàng)新的基本法則。”[14]而爬蟲這樣的數(shù)據(jù)獲取方式是寄生性的,它的存在完全依賴于被爬平臺,甚至給被爬者以破壞。爬蟲程序可以在未經(jīng)用戶和平臺同意的情況下爬取數(shù)據(jù),并可以依靠數(shù)據(jù)的重用來獲取具有競爭性的用戶和廣告收入,以削弱被爬平臺的收入。此外,爬蟲技術(shù)可能收集、侵害用戶的隱私信息,甚至可能直接損害被爬者的數(shù)據(jù)主機。[3]3這樣一種數(shù)據(jù)資源的獲取是單向度的,是缺乏生態(tài)持續(xù)性的。

最后,爬蟲技術(shù)具有不穩(wěn)定性。生產(chǎn)要素供給的穩(wěn)定帶來產(chǎn)品供給的穩(wěn)定,這樣的穩(wěn)定既體現(xiàn)在產(chǎn)品的質(zhì)量上,同時也體現(xiàn)在供給的持續(xù)性上。而爬蟲面臨著技術(shù)與法律的雙重挑戰(zhàn),反爬蟲技術(shù)可以阻礙、中斷數(shù)據(jù)獲取,法律的立場和態(tài)度也可以從市場規(guī)范和商業(yè)模式的合法性上阻礙、中斷數(shù)據(jù)獲取。在數(shù)據(jù)要素市場中,數(shù)據(jù)要素的供給需求是動態(tài)持續(xù)且穩(wěn)定的,而爬蟲技術(shù)是獲取靜態(tài)數(shù)據(jù)的,且隨時面臨持續(xù)性挑戰(zhàn),其獲取的數(shù)據(jù)質(zhì)量低,穩(wěn)定性低,持續(xù)性差。這既是爬蟲技術(shù)天生的缺陷,也是數(shù)據(jù)生產(chǎn)機制自我保護的體現(xiàn)。由于網(wǎng)絡(luò)數(shù)據(jù)中存在大量虛假或不完整、不標(biāo)準(zhǔn)化數(shù)據(jù),當(dāng)通過爬蟲技術(shù)手段獲取的數(shù)據(jù)呈現(xiàn)多源異構(gòu)性時,數(shù)據(jù)資源的時效性、關(guān)聯(lián)性、準(zhǔn)確性無法保障,當(dāng)其被再利用后,不但造成數(shù)據(jù)分析計算價值的下降,還會造成數(shù)據(jù)資源的“污染”,嚴(yán)重危害數(shù)據(jù)要素市場的健康運行。

二是現(xiàn)行法律的局限性導(dǎo)致了爬蟲技術(shù)規(guī)制問題上的巨大爭議與不確定。首先,版權(quán)制度無法解決數(shù)據(jù)權(quán)益問題。平臺數(shù)據(jù)來源具有多樣性,以微信公眾號為例,平臺所管理的數(shù)據(jù)就包括用戶登記的賬號信息、用戶發(fā)布的信息內(nèi)容以及平臺產(chǎn)生的用戶與平臺互動數(shù)據(jù),當(dāng)平臺因為這些數(shù)據(jù)被爬而提起版權(quán)訴訟時,基本無法得到支持。因為,微信公眾號平臺不“擁有”其網(wǎng)站上的所有數(shù)據(jù),特別是當(dāng)它是用戶生成的內(nèi)容時,平臺并沒有得到權(quán)利的專有許可或者轉(zhuǎn)讓。更為重要的理由是,思想不能受到版權(quán)法保護——只有這些思想的具體形式或表達可以,原創(chuàng)性成為平臺不可能達成的舉證義務(wù),而且,這種爬蟲技術(shù)所得數(shù)據(jù)的再利用,很可能構(gòu)成版權(quán)法上的合理使用。

其次,Robots協(xié)議的效力存在巨大爭議。對于訴諸合同法(典型的如用戶服務(wù)協(xié)議、Robots協(xié)議)的案件來說,針對任何使用網(wǎng)站的用戶來說,都會被要求簽署一份“用戶服務(wù)協(xié)議”。這樣的協(xié)議通常面臨兩個方面的質(zhì)疑。一是關(guān)于協(xié)議效力的問題,是否屬于“格式條款”(6);二是協(xié)議對象的問題,用戶服務(wù)協(xié)議往往只是針對自然人用戶,而爬蟲技術(shù)是以機器人的身份出現(xiàn)的,這就導(dǎo)致爬蟲技術(shù)者事實上并不是所謂“用戶服務(wù)協(xié)議”的相對人,因為它并不是用戶。也正是由于后者的原因,網(wǎng)絡(luò)運營者專門針對機器人/腳本設(shè)計了專門的Robots協(xié)議,但針對Robots協(xié)議的法律性質(zhì)和強制力效力的問題也爭議不斷。一些學(xué)者認為其系一種集體協(xié)議,一些認為其是一種寬泛的契約關(guān)系,一些認為其是網(wǎng)站所有者與搜索引擎間是一種事實上的信息服務(wù)合同關(guān)系,還有一些認為Robots協(xié)議是體現(xiàn)了相關(guān)細分領(lǐng)域公認商業(yè)道德的行業(yè)慣例。因此,當(dāng)被爬者希望通過合同法的路徑取得利益保護的時候,受制于合同主體、效力等問題,并不總是能得到法律積極的反饋。

最后,技術(shù)控制面臨巨大的成本和合法性挑戰(zhàn)。在缺失法律從社會層面保障的情況下,網(wǎng)絡(luò)運營者自身的技術(shù)防御措施也會面臨成本和法律的挑戰(zhàn)。對于反爬蟲技術(shù)來說,網(wǎng)絡(luò)運營者為了實現(xiàn)對于其平臺上數(shù)據(jù)的控制,愿意付出一定的技術(shù)成本來采取反爬蟲技術(shù)。更為嚴(yán)峻的現(xiàn)實是,網(wǎng)絡(luò)運營者的技術(shù)措施并不一定會得到法律的積極認可。例如,美國在HiQ與Linkedln的案件中,HiQ主動提起訴訟,認為LinkedIn的技術(shù)手段系違反信息自由的基本原則,要求通過法律手段強制允許自己繼續(xù)持續(xù)爬取LinkedIn的數(shù)據(jù),而該請求在地區(qū)法院和巡回法院獲得了初步禁令的支持。由此,被爬者單方意思和技術(shù)措施不再能發(fā)生法律上禁止他方數(shù)據(jù)爬取的效果,其對數(shù)據(jù)的封閉將面臨反不正當(dāng)競爭法、憲法第一修正案、開放互聯(lián)網(wǎng)之公共利益的挑戰(zhàn)。[15]正如本案所反映的,網(wǎng)絡(luò)運營者的反爬蟲技術(shù)同樣需要法律的確認,而在法律缺失明確態(tài)度的情況下,這樣的方式與爬蟲技術(shù)一樣會面臨合法性的質(zhì)疑,例如信息自由價值、市場競爭價值等。

三、爬蟲技術(shù)的生產(chǎn)性意涵

(一)互聯(lián)網(wǎng)生產(chǎn)活動與數(shù)據(jù)生產(chǎn)

以互聯(lián)網(wǎng)為基本載體的數(shù)字經(jīng)濟已經(jīng)成為國民經(jīng)濟的重要組成部分,各產(chǎn)業(yè)的數(shù)字化改革推動著國家數(shù)字經(jīng)濟的發(fā)展,也成為我國未來數(shù)字經(jīng)濟的主要方向。互聯(lián)網(wǎng)的這種特殊的創(chuàng)造力被稱為:生產(chǎn)性(Generativity)。這種依靠網(wǎng)絡(luò)從事的生產(chǎn)性活動被概括性地稱為互聯(lián)網(wǎng)生產(chǎn)活動。互聯(lián)網(wǎng)的生產(chǎn)性被認為是一項技術(shù)的總體能力,它能夠在大量、多樣和不協(xié)調(diào)的網(wǎng)絡(luò)用戶的推動下產(chǎn)生非預(yù)期的變化。[16]特別是對于商業(yè)互聯(lián)網(wǎng)平臺而言,當(dāng)用戶消費需求異質(zhì)化、技術(shù)分散、整體市場軌跡不確定的時候,這種生產(chǎn)能力尤為重要,甚至成為某一商業(yè)互聯(lián)網(wǎng)平臺得以生存的技術(shù)支撐架構(gòu)。這也就形成了諸如微信公眾號、頭條號、知乎、抖音等相對獨立、封閉,卻又生產(chǎn)異質(zhì)性內(nèi)容的網(wǎng)絡(luò)運營者,并成為支撐我國數(shù)字經(jīng)濟的重要力量。

從網(wǎng)絡(luò)分層理論來看,上述這樣的互聯(lián)網(wǎng)生產(chǎn)活動表面上是一個獨立的生產(chǎn)行為,卻在不同的層級具有不同的生產(chǎn)機制和生產(chǎn)結(jié)果,當(dāng)然也會產(chǎn)生不同的市場作用與價值。(7)它揭示了網(wǎng)絡(luò)生產(chǎn)活動可以在內(nèi)容層(具有一定信息意義的內(nèi)容)、代碼層(原始數(shù)據(jù)和數(shù)據(jù)集的產(chǎn)生),或者通過物理載體,以不同的產(chǎn)品形式予以呈現(xiàn)。這三個層次當(dāng)然是聯(lián)系在一起的,因為物理層承載代碼層,代碼層蘊含內(nèi)容層意義。然而,從生產(chǎn)性的法律角度來看,每一層都代表著定義一定“產(chǎn)品”和生產(chǎn)活動的相對獨立。

因此,除去物理層之外,可以在內(nèi)容層和代碼層中分別定義互聯(lián)網(wǎng)生產(chǎn)活動。對于內(nèi)容層而言,互聯(lián)網(wǎng)生產(chǎn)的活動價值在于信息與知識的加工創(chuàng)造。互聯(lián)網(wǎng)內(nèi)容生產(chǎn)者通過創(chuàng)造性的思維結(jié)合標(biāo)準(zhǔn)化的過程來更便捷地創(chuàng)造內(nèi)容和信息商品。這樣的生產(chǎn)活動起源于非常早期的人類歷史,隨著生產(chǎn)技術(shù)的不斷推進,從打字機、攝影、電報、電話、錄音錄像到廣播電視,最后是互聯(lián)網(wǎng)信息技術(shù),產(chǎn)品的呈現(xiàn)以文字、圖片、音頻、視頻等出現(xiàn),本質(zhì)仍是直接生產(chǎn)人類可以識讀的,以降低人類活動不確定性為價值的信息。

對于代碼層而言,互聯(lián)網(wǎng)的生產(chǎn)活動就是數(shù)據(jù)生產(chǎn)活動。數(shù)據(jù)是對客觀世界的數(shù)字化映射,是信息和知識的數(shù)字化表達。隨著互聯(lián)網(wǎng)、人工智能等技術(shù)的發(fā)展,數(shù)據(jù)的價值開始逐漸被人類發(fā)覺。首先,人類通過網(wǎng)絡(luò)實施的各種行為活動越來越多地被數(shù)據(jù)化。例如,網(wǎng)絡(luò)用戶的Cookies等“數(shù)字痕跡”開始被數(shù)據(jù)化記錄。其次,聯(lián)網(wǎng)的智能設(shè)備(物)可以產(chǎn)生、存儲和傳輸數(shù)據(jù),成為大數(shù)據(jù)主要的來源。例如,智能汽車、智能電話、智能家居和可穿戴設(shè)備等等。再次,數(shù)據(jù)自身也被當(dāng)作某種類“資源”進行交易。因此,數(shù)據(jù)經(jīng)濟不僅是指數(shù)據(jù)驅(qū)動或數(shù)據(jù)控制的經(jīng)濟,還是一種以數(shù)據(jù)為基本生產(chǎn)要素的經(jīng)濟模式。正是基于這種具有機讀性,非人類可直接識讀的數(shù)據(jù)的價值爆發(fā),才使得傳統(tǒng)的互聯(lián)網(wǎng)內(nèi)容生產(chǎn)具有了數(shù)據(jù)生產(chǎn)的價值意味。

可見,之前停留在內(nèi)容層的互聯(lián)網(wǎng)生產(chǎn)活動已經(jīng)突破了語義、信息的界限,在代碼層完成了數(shù)據(jù)生產(chǎn)的價值創(chuàng)造過程。網(wǎng)絡(luò)運營者為了創(chuàng)造激發(fā)互聯(lián)網(wǎng)生產(chǎn)的活力,為了在內(nèi)容層創(chuàng)造差異性、功能分化的競爭價值,在代碼層生產(chǎn)更多可供計算分析的數(shù)據(jù),更多地擔(dān)負起中介與組織的雙重功能,它們的供給支持創(chuàng)新和創(chuàng)造力,為內(nèi)容生產(chǎn)提供了構(gòu)架和行為模式上的基礎(chǔ),但同時也限制了參與,并將其引導(dǎo)到有利于平臺創(chuàng)造者的生產(chǎn)活動中。[17]正是在此種數(shù)據(jù)生產(chǎn)理論的視域下,爬蟲技術(shù)具有了一種生產(chǎn)性意義上的表征,需要得到法律的正視與回應(yīng)。

(二)數(shù)據(jù)重用:爬蟲技術(shù)的生產(chǎn)性表征

盡管當(dāng)下數(shù)據(jù)的生產(chǎn)要素性質(zhì)已經(jīng)得到了政策制定者和產(chǎn)業(yè)界、學(xué)界不同程度的認同。但如何實現(xiàn)數(shù)據(jù)要素的生產(chǎn)性價值,人們似乎并無定論。“這些數(shù)據(jù)最好是結(jié)構(gòu)化的,但不一定是結(jié)構(gòu)化的”,因此“實現(xiàn)大數(shù)據(jù)的潛力需要從所有來源進行更多的數(shù)據(jù)重用”[18]。數(shù)據(jù)(或者信息)的創(chuàng)生性、涌現(xiàn)性、相互性與共享性決定了相同的數(shù)據(jù)用于不同的場景(或者與不同的數(shù)據(jù)進行匹配),會創(chuàng)造不同的價值。(8)因此,與數(shù)據(jù)(一次)使用相對應(yīng),數(shù)據(jù)重用就成為數(shù)據(jù)生產(chǎn)與數(shù)據(jù)價值創(chuàng)造的重要途徑。數(shù)據(jù)重用主要有數(shù)據(jù)循環(huán)(Data Recycling)、數(shù)據(jù)目的重用(Data Repurposing)和數(shù)據(jù)場景重用(Data Recontextualization)三種主要形式[18],而爬蟲技術(shù)是實現(xiàn)后兩者數(shù)據(jù)重用的重要技術(shù)手段。

從技術(shù)機制來看,將爬蟲技術(shù)的技術(shù)過程進行細致劃分,現(xiàn)階段的爬蟲技術(shù)一般包含網(wǎng)站解析(Website Analysis)、網(wǎng)站爬行(Website Crawling)和數(shù)據(jù)組織(Data Organization)三個步驟。首先,網(wǎng)站解析就是通過檢查一個網(wǎng)站(或多個網(wǎng)站)或網(wǎng)絡(luò)存儲庫(例如在線數(shù)據(jù)庫)以了解所需數(shù)據(jù)的網(wǎng)絡(luò)架構(gòu)和存儲方式。其次,通過開發(fā)和運行一個程序腳本,自動瀏覽網(wǎng)站和檢索所需的數(shù)據(jù)來進行對于底層數(shù)據(jù)的爬取。具體使用怎樣的代碼語言與這些語言在數(shù)據(jù)科學(xué)的可用性有關(guān),它們的目的是自動抓取和選擇數(shù)據(jù)。最后,從選定的網(wǎng)絡(luò)存儲庫中爬取出必要的數(shù)據(jù)后,需要對其進行清理、預(yù)處理和組織,以便能夠?qū)@些數(shù)據(jù)進行進一步分析。[8]

結(jié)合數(shù)據(jù)生產(chǎn)和重用理論的分析,上述三個過程可以清晰地體現(xiàn)出爬蟲技術(shù)的技術(shù)邏輯。一方面,網(wǎng)站解析和網(wǎng)站爬行實現(xiàn)了數(shù)據(jù)網(wǎng)絡(luò)存儲庫(就如同蘊含資源的礦藏)和數(shù)據(jù)(資源本身)的分離,實現(xiàn)了初始的數(shù)據(jù)要素獲取的過程,即通過對網(wǎng)站代碼層的數(shù)據(jù)化解析、篩選和復(fù)制,實現(xiàn)對于網(wǎng)絡(luò)內(nèi)容、網(wǎng)絡(luò)活動的數(shù)據(jù)化映射,從而為數(shù)據(jù)本身成為資源或者商品[19]進行流通,提供了基本的可能。另一方面,隨著技術(shù)的深化,爬蟲技術(shù)也不單單扮演“搬運工”的角色,數(shù)據(jù)組織過程讓爬蟲技術(shù)具有了價值創(chuàng)造和價值添付的功能,組織標(biāo)準(zhǔn)、組織范圍、組織語言等的選擇與確定[8],使得數(shù)據(jù)的可攜性與互操作性的統(tǒng)一成為可能,更是實現(xiàn)了“基于需求的數(shù)據(jù)供給”成為可能。[20]這一階段,爬蟲者通過將爬蟲得到的數(shù)據(jù)以某種標(biāo)準(zhǔn)進行分類、組織,甚至還涉及不同數(shù)據(jù)源的數(shù)據(jù)要素匹配和融合的過程,以生產(chǎn)出新的數(shù)據(jù)要素。事實上,這一過程已經(jīng)完成了數(shù)據(jù)不同語境的變換,實現(xiàn)了場景化(或者語境化)重用與價值添付的過程。加之,若被爬數(shù)據(jù)的最終用途與數(shù)據(jù)源不同,則又實現(xiàn)了數(shù)據(jù)目的的重用。(9)

從生產(chǎn)對象來看,如前所述,用戶利用平臺主動生成的數(shù)據(jù)和網(wǎng)絡(luò)行為的“數(shù)字痕跡”都是數(shù)據(jù)資源的重要組成,但不可否認的是,如同原始采集來的能源資源未經(jīng)“清洗”難以高效使用一樣,上述兩種原始數(shù)據(jù)由于質(zhì)量、用途、采集方式、使用目的等各方面因素的差異性,直接用于數(shù)據(jù)分析/挖掘的可用性并不高。打破不同類型原始數(shù)據(jù)的孤立性,實現(xiàn)原始數(shù)據(jù)的互通、再提煉,將原始數(shù)據(jù)匯集成為更有價值的數(shù)據(jù)集(Dataset)的過程同樣具有價值創(chuàng)造上的重要意義。[21]

從爬蟲技術(shù)的結(jié)果來看,爬蟲的過程就是通過不同的數(shù)據(jù)匯集與重用,以形成新的數(shù)據(jù)集。爬蟲技術(shù)的價值就在于發(fā)現(xiàn)這些海量數(shù)據(jù)的某些特征,為特定目的、以可識別標(biāo)準(zhǔn)創(chuàng)建不同的原始數(shù)據(jù)之間的聯(lián)系,將它們匯聚起來。基于特定的標(biāo)準(zhǔn)和意圖,出于效率和良好系統(tǒng)運行的考慮,當(dāng)這些原始數(shù)據(jù)在大多數(shù)情況下以一種標(biāo)準(zhǔn)類型的“數(shù)據(jù)包”的形式存在時,它們所包含的計算價值通常才是特定的(或者說是可以量化的),才可以用以支持收集、創(chuàng)建它們的直接目的。因此,對于商業(yè)數(shù)據(jù)競爭而言,真正的競爭優(yōu)勢往往來自那些生產(chǎn)出的具有獨特性的數(shù)據(jù)集,而不是原始數(shù)據(jù)。[22]“數(shù)據(jù)生產(chǎn)實現(xiàn)數(shù)據(jù)從無到有,數(shù)據(jù)集生產(chǎn)則實現(xiàn)關(guān)于某個對象的數(shù)據(jù)匯聚和優(yōu)化。”因此,爬蟲技術(shù)在原始數(shù)據(jù)“數(shù)據(jù)集化”的過程中扮演了極為重要的角色。[21]

綜上,爬蟲技術(shù)是一種典型的數(shù)據(jù)重用技術(shù),具有一定意義上的生產(chǎn)性意涵。但需要強調(diào)的是,本文把爬蟲技術(shù)定義為數(shù)據(jù)重用行為,這里的重用只是事實判斷意義上的,因為其確實付出了生產(chǎn)上的勞動,實現(xiàn)了從1到多(或者從分散到聚集、從粗放到優(yōu)化)的價值創(chuàng)造的跨越。[23]但這樣的行為或者技術(shù)能否得到價值判斷上的正當(dāng)性確認,則是另一個層面的問題。因此,在法律上如何對待爬蟲技術(shù)需要更為系統(tǒng)的分析論證。

(三)法律回應(yīng)的缺失

從生產(chǎn)性的視角來看,作為數(shù)據(jù)生產(chǎn)者的網(wǎng)絡(luò)運營者,希望其生產(chǎn)性貢獻得到法律的確認和保護,這種合法性的確認既是商業(yè)模式的考量,也是利益分配的考量。從現(xiàn)實來看,網(wǎng)絡(luò)運營者對于自身生產(chǎn)行為的控制存在于技術(shù)與法律兩個維度。

從技術(shù)維度來看,自發(fā)的技術(shù)控制是網(wǎng)絡(luò)運營者自力救濟(自我保護)的體現(xiàn)。網(wǎng)絡(luò)運營者對于自身生產(chǎn)活動控制是高度依賴技術(shù)構(gòu)架的。以微信公眾號為例,微信公眾號設(shè)置有登陸限制、IP訪問限制、驗證機制等技術(shù)措施。諸如此類網(wǎng)絡(luò)運營者設(shè)置的登陸機制,其目的就是在于通過限制非真人的訪問。對于IP頻率訪問限制而言,網(wǎng)絡(luò)運營者會設(shè)置IP訪問頻率限制。如果一個訪問者訪問太快了,網(wǎng)絡(luò)運營者就會認為你不是一個人,而是一個機器人或者其他腳本程序。除了上述對于訪問者主體身份的控制外,對于平臺內(nèi)容來說,網(wǎng)絡(luò)運營者也會通過分享控制、編輯限制、“白名單”、原創(chuàng)聲明等方式,在不違背信息自由的基本前提下,一定程度上實現(xiàn)對內(nèi)容生產(chǎn)的技術(shù)控制。

從法律維度來看,內(nèi)容層的法律規(guī)范是網(wǎng)絡(luò)運營者的社會性保護,同時也是對平臺內(nèi)容生產(chǎn)技術(shù)控制的確認。通過知識產(chǎn)權(quán)保護由人類思想創(chuàng)造性的信息,如發(fā)明創(chuàng)造、藝術(shù)作品或?qū)@O(shè)計;通過合同(典型的如用戶服務(wù)協(xié)議等)實現(xiàn)與平臺用戶的法律關(guān)系的確認并明確兩者之間的權(quán)利義務(wù)關(guān)系;通過反不正當(dāng)競爭實現(xiàn)對于市場競爭者、競爭利益與競爭環(huán)境的規(guī)范等等。因此,法律通過對于平臺技術(shù)的規(guī)制和確認,從人類的網(wǎng)絡(luò)行為規(guī)范層面實現(xiàn)了對于內(nèi)容生產(chǎn)活動正當(dāng)性的保護,確認了這種知識生產(chǎn)的新模式及其背后所代表的商業(yè)利益與價值。

而對于代碼層或者數(shù)據(jù)來說,法律的應(yīng)對體現(xiàn)出了其自身固有的保守性和滯后性。當(dāng)可被人直接識讀的信息、知識,被數(shù)據(jù)化為僅機器可讀的數(shù)據(jù)時,其價值也從單純的信息價值向更復(fù)雜的計算價值跨越,由此,網(wǎng)絡(luò)運營者相應(yīng)地用于生產(chǎn)和管理數(shù)據(jù)并據(jù)此控制數(shù)據(jù)生產(chǎn)過程的邏輯也發(fā)生了變化。因此,正是代碼層法律的缺失導(dǎo)致了數(shù)據(jù)生產(chǎn)活動的混亂。一方面,網(wǎng)絡(luò)運營者自發(fā)的技術(shù)控制未得到法律的認可,典型的體現(xiàn)如美國《計算機欺詐與濫用法案》(CFAA)對于突破技術(shù)防線訪問計算機系統(tǒng)是否構(gòu)成“未經(jīng)授權(quán)訪問”的爭議,Robots協(xié)議性質(zhì)與效力的爭議等。另一方面,無論是因為法律的體系局限性還是法律適用的有限性,傳統(tǒng)法律(如前述知識產(chǎn)權(quán)、競爭法等)又無法像規(guī)范內(nèi)容生產(chǎn)一樣應(yīng)對數(shù)據(jù)代碼層面的爭議。因此,以數(shù)據(jù)爭議為表現(xiàn)的數(shù)據(jù)生產(chǎn)活動秩序的混亂由此產(chǎn)生。

綜上,限于時間、技術(shù)或者其他眾多原因的影響,人們對于內(nèi)容層的探討與思考較多,而對于代碼層面的數(shù)據(jù)生產(chǎn)認識尚淺。而用喬納森·齊特林(Jonathan Zittrain)的話來說,“入侵者可以在一層工作,而無需了解另一層工作,和另一層工作之間不需要任何協(xié)調(diào)或關(guān)系。”[24]隨著大數(shù)據(jù)、傳感等技術(shù)的深化,內(nèi)容(信息)可以輕松實現(xiàn)數(shù)據(jù)化的轉(zhuǎn)化,從而使存在于內(nèi)容層的問題延伸、擴展至代碼層。(10)由此,當(dāng)爬蟲技術(shù)出現(xiàn)時,現(xiàn)行法律在代碼層面的不完善成為網(wǎng)絡(luò)運營者對于數(shù)據(jù)生產(chǎn)活動法律上控制的難題,這也導(dǎo)致了未經(jīng)授權(quán)的爬蟲技術(shù)被大量應(yīng)用,成為網(wǎng)絡(luò)運營者眼中人人喊打的“害蟲”。

四、規(guī)制路徑的各國探索與我國實踐

為化解爬蟲技術(shù)的爭議,世界各國都進行了各具特色的制度創(chuàng)新與嘗試。其中,美國法律在面對爬蟲技術(shù)時的,動用了幾乎法律“武器庫里”任何可以想象到的“武器”。其中最具美國特色的法律就是《計算機欺詐與濫用法案》(以下簡稱CFAA)。CFAA是一項聯(lián)邦法規(guī),規(guī)定任何“在未經(jīng)授權(quán)的情況下故意訪問計算機或超出授權(quán)訪問范圍”的主體都應(yīng)承擔(dān)刑事責(zé)任。與合同法的理論沒有很大的差異,適用CFAA的案例通常取決于用戶是否對網(wǎng)站用戶服務(wù)條款的限制性條款有實際或建設(shè)性的了解(即明知爬蟲是“未經(jīng)授權(quán)的”)。在過去二十年中,大量的爬蟲技術(shù)案件涉及CFAA的適用問題,但法院并未達成共識,特別是針對“未經(jīng)授權(quán)訪問”的理解與解釋問題上仍存在巨大分歧。[25]372-415但總體的趨勢是,對于構(gòu)成CFAA所描述的“未經(jīng)授權(quán)”,美國法院的態(tài)度越來越謹(jǐn)慎,以防止其適用范圍的無限擴大,對正常的網(wǎng)絡(luò)信息流通產(chǎn)生不利影響。典型如備受關(guān)注的HiQ與Linkedln的案件,經(jīng)過初審、上訴和重審的立場搖擺,美國第九巡回法院的第二次裁決,依然堅持并重申了其最初的裁決意見,認為爬取互聯(lián)網(wǎng)上已公開的數(shù)據(jù)并不違反CFAA,并強調(diào)“未經(jīng)授權(quán)”的概念不適用于公共網(wǎng)站。(11)由此可見,美國法院對于爬蟲技術(shù)是否適用CFAA的看法動搖。正如安德魯·塞勒斯(Andrew Sellars)教授所言,“爬蟲技術(shù)的法律地位經(jīng)歷了二十年的不確定性——這不是像一些學(xué)者所說的那樣一片混亂,而是在不同時刻搖擺的狀態(tài)。”[25]412

最具歐洲特色的法律應(yīng)對是通過“數(shù)據(jù)庫權(quán)(Database Right)”來實現(xiàn)對于爬蟲技術(shù)的規(guī)制。為了對“數(shù)據(jù)庫”施加保護,歐盟在既有知識產(chǎn)權(quán)法的體系框架之下設(shè)置了一種特殊的專有權(quán)——數(shù)據(jù)庫權(quán),并通過頒布《關(guān)于數(shù)據(jù)庫法律保護的第96/9/EC指令》(以下簡稱“數(shù)據(jù)庫指令”)確認了該項專有權(quán),該項權(quán)利旨在保護以系統(tǒng)或方法方式排列并通過電子或其他方式單獨訪問的獨立作品、數(shù)據(jù)或其他材料的集合。(12)在數(shù)據(jù)生產(chǎn)的語境下,數(shù)據(jù)庫權(quán)所保護的數(shù)據(jù)至少需要具備兩個條件,第一個是該數(shù)據(jù)必須是以系統(tǒng)或有條理的方式排列并通過電子或其他方式單獨獲取的數(shù)據(jù),即結(jié)構(gòu)性。第二個條件是在獲取、驗證或呈現(xiàn)內(nèi)容方面的質(zhì)量和/或數(shù)量上的大量投資,即投入性。盡管《數(shù)據(jù)庫指令》的出發(fā)點不可謂不積極,但在實際的運用中還是出現(xiàn)了巨大的爭議。很明顯,《數(shù)據(jù)庫指令》忽略了對于非結(jié)構(gòu)化數(shù)據(jù)和經(jīng)營行為衍生數(shù)據(jù)(即經(jīng)營副產(chǎn)品)的保護,這使得當(dāng)下真正占據(jù)大多數(shù)的網(wǎng)絡(luò)活動的“單一數(shù)據(jù)源數(shù)據(jù)庫(Solo-source Database)”無法被視為《數(shù)據(jù)庫指令》保護的對象。這就導(dǎo)致目前大多數(shù)網(wǎng)絡(luò)運營者在面對爬蟲技術(shù)時,依然不能依據(jù)確定的財產(chǎn)權(quán)路徑進行保護。2017年歐盟頒布《構(gòu)建歐洲數(shù)據(jù)經(jīng)濟》(Building a European Data Economy)文件,提出構(gòu)建“數(shù)據(jù)生產(chǎn)者權(quán)”(Data Producer's Right)的財產(chǎn)權(quán)保護路徑以解決機器生成數(shù)據(jù)的權(quán)屬問題,是否可以有效解決爬蟲技術(shù)所帶來的沖突問題,還需要更多的研究與思考。(13)

結(jié)合我國的司法現(xiàn)狀,我國法院采用最為常見的路徑是通過反不正當(dāng)競爭法和刑法來對爬蟲技術(shù)行為進行規(guī)制。對于法院認定爬蟲技術(shù)構(gòu)成反不正當(dāng)競爭行為的案件不勝枚舉。但總體看來,法院并沒有直接對于爬蟲技術(shù)本身做出任何價值判斷,而是堅持從反不正當(dāng)競爭行為的一般判定要件出發(fā),對于利用Robots協(xié)議或者爬蟲所得數(shù)據(jù)進行的市場活動,(14)進行行為性質(zhì)的合法性判斷。這就導(dǎo)致行為人對于爬蟲技術(shù)行為的行為預(yù)期始終處于不確定的狀態(tài)。盡管很多案件的原告都取得了勝訴判決,但在法律適用問題上的爭議并不鮮見。[26]因此,適用《反不正當(dāng)競爭法》來規(guī)制爬蟲技術(shù)行為總體上是一種“曲線救國”的應(yīng)對方式。

在“谷米公司訴元光公司不正當(dāng)競爭案”中,元光公司為提升本公司的APP軟件“車來了”的服務(wù)質(zhì)量,利用網(wǎng)絡(luò)爬蟲技術(shù)爬取了谷米公司“酷米客”APP軟件上的公交信息數(shù)據(jù),將之用于“車來了”APP并提供給公眾查詢。法院認為,“元光公司利用網(wǎng)絡(luò)爬蟲技術(shù)大量獲取并無償使用‘酷米客’APP實時公交信息數(shù)據(jù)的行為,是一種不勞而獲的行為,破壞他人的市場競爭優(yōu)勢,具有主觀過錯,違反了誠實信用原則,擾亂了競爭秩序,構(gòu)成不正當(dāng)競爭。”(15)在“新浪微博訴蟻坊公司不正當(dāng)競爭案”中,由于新浪微博與蟻坊公司之間并無明顯的商業(yè)模式和用戶對象的競爭關(guān)系,法院在認定兩者的競爭關(guān)系,明顯擴大了解釋與適用的范圍,認為“只要經(jīng)營者的行為不僅具有對其他經(jīng)營者利益造成損害的可能性,且其同時會基于該行為獲得現(xiàn)實或潛在的經(jīng)濟利益,則可以認定二者具有競爭關(guān)系”,“在當(dāng)前的市場環(huán)境下,這種競爭并不限于同業(yè)競爭,顯然也包括非同業(yè)競爭但仍對交易機會、交易能力存在爭奪的情形;因此,如一方經(jīng)營者為了提高自己的交易能力而直接侵占或損害另一方經(jīng)營者的合法權(quán)益,即便雙方并非同業(yè)競爭者,仍然構(gòu)成了競爭關(guān)系。”(16)

由此可見,互聯(lián)網(wǎng)反不正當(dāng)競爭法的保護已經(jīng)明顯向市場主體合法利益的侵權(quán)法方向發(fā)展。[27]針對爬蟲技術(shù)來說,就是指網(wǎng)絡(luò)運營者所主張的數(shù)據(jù)權(quán)益,這種權(quán)益除其對數(shù)據(jù)本身所享有的權(quán)益之外,還包括運營網(wǎng)絡(luò)平臺,維護數(shù)據(jù)安全而產(chǎn)生的成本控制,以及基于所享有權(quán)益的數(shù)據(jù)進行衍生性利用或開發(fā)所獲得經(jīng)營利益等。(17)

另一條重要的路徑是刑法路徑。據(jù)不完全統(tǒng)計,爬蟲技術(shù)涉案主要罪名為侵犯公民個人信息罪、侵犯著作權(quán)罪、非法獲取計算機信息系統(tǒng)數(shù)據(jù)罪與破壞計算機信息系統(tǒng)罪等。(18)罪名的多樣性,也意味著對于爬蟲技術(shù)本身性質(zhì)的模糊性。總體看來,《刑法》對于爬蟲技術(shù)非法與合法的判斷,重點是從形式層面進行的。[28]因此,有學(xué)者提出要從實質(zhì)的法益侵害性來進行罪與非罪的判斷。[28]以關(guān)系最為緊密的非法侵入計算機系統(tǒng)罪來看(19),我國是否會陷入如CFAA一樣對于“入侵”和“非法”等關(guān)鍵概念的解釋困境,爬蟲技術(shù)能否被認定為黑客行為,還需要司法的實踐以于驗證。[29]

事實上,不論是從哪個側(cè)面進行的探索,都體現(xiàn)了法律制度本身對于爬蟲技術(shù)外部性的積極回應(yīng)。法律還應(yīng)當(dāng)發(fā)揮出一種具有導(dǎo)向性的作用,從而尋找和確定我們面對爬蟲技術(shù)的應(yīng)然態(tài)度和價值取向。因此,有必要將爬蟲技術(shù)放置于更大更宏觀的整個數(shù)據(jù)生產(chǎn)與數(shù)據(jù)要素資源市場化配置的體系之中予以分析和討論,才可以擺脫單純的技術(shù)主義視角,對爬蟲技術(shù)做出全面而恰當(dāng)?shù)姆蓱?yīng)對。

五、控制與分享:爬蟲技術(shù)的法律應(yīng)對

通過對我國司法實踐的觀察,我們不難得出以下結(jié)論:利用反不正當(dāng)競爭法來規(guī)制爬蟲技術(shù)行為,表面上是對于市場競爭性秩序的保護,但實質(zhì)上卻有明顯的數(shù)據(jù)財產(chǎn)性權(quán)利保護的趨勢。現(xiàn)行法雖然暫時缺乏有名財產(chǎn)性權(quán)益來明確,但在案件裁判上仍然會不知不覺地借用財產(chǎn)性權(quán)益的分析框架來完成判斷與說理。所以,不論是理論上還是現(xiàn)實需要,為數(shù)據(jù)構(gòu)建相應(yīng)的財產(chǎn)性利益保護規(guī)則是解決爬蟲技術(shù)爭議的根本路徑。只是這種財產(chǎn)性價值的利用與分配規(guī)則最終會以何種形式被法律體系表達出來需要探討。本文主張的制度方案主要包括“控制”與“分享”兩個方面。

(一)控制:數(shù)據(jù)持有者權(quán)

爬蟲技術(shù)之所以爭議巨大,究其根本是數(shù)據(jù)權(quán)屬的爭議問題。無論是傳統(tǒng)的法學(xué)理論還是經(jīng)典的經(jīng)濟學(xué)理論,解決產(chǎn)權(quán)問題一直都是資源配置、利益分配的基礎(chǔ)與核心問題。[30]但由于數(shù)據(jù)這一權(quán)利客體本身的非競爭性與非排他性[31],加上數(shù)據(jù)利益相關(guān)者的多樣性,導(dǎo)致在數(shù)據(jù)權(quán)屬這一重大學(xué)術(shù)議題的討論中往往無法形成基本共識。在筆者看來,超越傳統(tǒng)的權(quán)利范式,從數(shù)據(jù)資源的利用角度,為網(wǎng)絡(luò)運營者配置數(shù)據(jù)持有者權(quán),以實現(xiàn)資源的有序利用是切實可行的制度路徑。

1.技術(shù)視角。其一,數(shù)據(jù)持有者權(quán)的正當(dāng)性在于數(shù)據(jù)生產(chǎn)活動。如前所述,網(wǎng)絡(luò)運營者通過內(nèi)容層的組織架構(gòu)和內(nèi)容生產(chǎn)機制客觀上實現(xiàn)了代碼層的數(shù)據(jù)生產(chǎn)活動,一方面實現(xiàn)了數(shù)據(jù)源對于原始數(shù)據(jù)的自主性供給,另一方面通過分離數(shù)據(jù)源和數(shù)據(jù),實現(xiàn)元數(shù)據(jù)的生產(chǎn)和處理,數(shù)據(jù)價值的添付。從這個數(shù)據(jù)生產(chǎn)活動的意義上來說,數(shù)據(jù)持有者權(quán)就是生產(chǎn)組織者對于生產(chǎn)過程全流程的管控,其當(dāng)然性地包括生產(chǎn)者與生產(chǎn)要素。關(guān)于數(shù)據(jù)生產(chǎn)與內(nèi)容生產(chǎn)前文已具體論述,此處不再重復(fù)。

其二,數(shù)據(jù)持有者權(quán)的邊界是平臺。數(shù)據(jù)資源的流動性問題,直接關(guān)系互聯(lián)網(wǎng)的生產(chǎn)機制和過程的成敗。[32]流動性既是數(shù)據(jù)價值產(chǎn)生、匯集的關(guān)鍵,但也客觀上成為數(shù)據(jù)控制基本難題。而平臺相對意義上的封閉性就成為實現(xiàn)數(shù)據(jù)控制技術(shù)上的關(guān)鍵。基于前文對于互聯(lián)網(wǎng)生產(chǎn)機制中網(wǎng)絡(luò)運營者的組織核心地位,我們不難看出,互聯(lián)網(wǎng)的開放是建立在各個平臺的相對封閉性之上的,從架構(gòu)技術(shù)上來說,平臺內(nèi)部的通用標(biāo)準(zhǔn)和架構(gòu)模塊往往只在本平臺內(nèi)部使用,要想實現(xiàn)跨平臺的互通往往具有使用標(biāo)準(zhǔn)上的復(fù)雜性和困難度,這也不難解釋諸如阿里、騰訊、谷歌總是被認為進行事實上的“壟斷”。從網(wǎng)絡(luò)運營者主觀上來看,這種構(gòu)架上的差異性是內(nèi)容異質(zhì)性和商業(yè)活動競爭性的要求。他們希望通過控制核心構(gòu)架和標(biāo)準(zhǔn)上的差異,來滿足不同的市場需求。而且隨著各種新技術(shù)、新的組織和人類行為模式的共同發(fā)展,這種持續(xù)的相對封閉性可能會繼續(xù)下去。而這種相對的封閉性就成為數(shù)據(jù)持有者權(quán)相對清晰的邊界,一面為財產(chǎn)劃定的邊界,一面可以匹配數(shù)據(jù)的供求關(guān)系。例如針對爬蟲技術(shù)的“反爬蟲”訴求的實質(zhì)是要求構(gòu)建一種新的生產(chǎn)秩序,并由在先的、往往擁有大量信息內(nèi)容的平臺主導(dǎo)。

其三,數(shù)據(jù)持有者權(quán)的實現(xiàn)途徑是訪問控制。由于數(shù)據(jù)的非物質(zhì)性,技術(shù)上實現(xiàn)對于數(shù)據(jù)的控制就是訪問控制,它的意義相當(dāng)于有形財產(chǎn)中占有的價值。從互聯(lián)網(wǎng)生產(chǎn)性活動的視角來看,訪問控制就是限制對資源的訪問。通過訪問控制,可以識別個人(或計算機),驗證他們的身份,授權(quán)他們擁有所需的訪問級別,然后針對用戶名、IP地址或其他識別信息記錄他們的操作,以實現(xiàn)流程的可追溯。訪問控制最大限度地降低了授權(quán)訪問平臺或者數(shù)據(jù)庫,接觸到數(shù)據(jù)的風(fēng)險,構(gòu)成了信息安全、數(shù)據(jù)安全和網(wǎng)絡(luò)安全的基礎(chǔ)部分,同時也是實現(xiàn)數(shù)據(jù)有效控制的基本手段。

2.法律視角。其一,數(shù)據(jù)持有者權(quán)是對于平臺生產(chǎn)性投入的確認。目的是法律的創(chuàng)造者,而目的本身就是利益……利益是權(quán)利構(gòu)成的本質(zhì)要素。[33]而分配權(quán)利的標(biāo)準(zhǔn)之一可以是考慮已完成的投資和用于創(chuàng)建數(shù)據(jù)的資源。這一點與歐盟《數(shù)據(jù)庫指令》的立法思想基本一致,但其內(nèi)涵應(yīng)該是廣義的。此類投資通常由兩方進行:配備傳感器的機器、工具或裝置(生成數(shù)據(jù))的制造商,他們投資于機器、工具或裝置的開發(fā)和市場商業(yè)化,以及使用此類機器的經(jīng)濟運營商,支付購買價格或租賃的工具或設(shè)備,并必須攤銷機器、工具或設(shè)備。這也符合數(shù)據(jù)生產(chǎn)理論中為價值創(chuàng)造者配置權(quán)利的邏輯。因為只有這樣才能平衡網(wǎng)絡(luò)運營者對于組織數(shù)據(jù)生產(chǎn)的成本,保證數(shù)據(jù)的有效供給,才可以促進數(shù)據(jù)的后續(xù)分析與利用。

其二,數(shù)據(jù)持有者權(quán)旨在實現(xiàn)一定程度的排他性。典型的財產(chǎn)權(quán)必然包括三個核心特征:對世、排他和追及。其中對世是自動創(chuàng)設(shè)與全世界所有其他人之財產(chǎn)關(guān)系;排他為物權(quán)人與他人之間的法律關(guān)系之內(nèi)容,即他人有不侵犯財產(chǎn)權(quán)的義務(wù);追及則是在同一物上的多個權(quán)利人之間發(fā)揮作用。[34]由于數(shù)據(jù)的非物質(zhì)性和非獨占性,不能排除他人對合法取得的同樣數(shù)據(jù)的使用,因此數(shù)據(jù)控制不應(yīng)包括完全的對世性。由于數(shù)據(jù)的范圍和能產(chǎn)生的價值都具有不確定性,如果賦予數(shù)據(jù)持有者無限的追及效力,會導(dǎo)致權(quán)利界分與識別的復(fù)雜化,讓數(shù)據(jù)流通產(chǎn)生極高的交易成本。因此,該權(quán)利沒有追及力,喪失控制即喪失權(quán)利。綜上,數(shù)據(jù)持有者權(quán)實際上主要的權(quán)利效果是有限的排他效力,以防止無權(quán)使用數(shù)據(jù)的第三方首次使用數(shù)據(jù),包括因未經(jīng)授權(quán)訪問和使用數(shù)據(jù)而要求損害賠償?shù)臋?quán)利。

其三,數(shù)據(jù)持有者權(quán)負有數(shù)據(jù)合法管理義務(wù)。法律上得以確認的數(shù)據(jù)控制必須是合法的。這既是數(shù)據(jù)生產(chǎn)的前提,也是數(shù)據(jù)流通的前提。對于數(shù)據(jù)生產(chǎn)活動來說,要想取得對于數(shù)據(jù)的合法控制,就要在生產(chǎn)過程中遵守《民法典》《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法》等規(guī)范數(shù)據(jù)處理行為的法律規(guī)定,只有這樣生產(chǎn)/獲得的數(shù)據(jù)才是合法的財產(chǎn)。反之,不遵守法律會導(dǎo)致侵權(quán)責(zé)任、行政處罰甚至刑事責(zé)任,導(dǎo)致數(shù)據(jù)持有喪失法律基礎(chǔ)。[35]而對于后續(xù)的流通供應(yīng)來說,合法性同樣是數(shù)據(jù)進入流通環(huán)節(jié)的前提。因為數(shù)據(jù)上存在的利益多樣性,即使合法取得的數(shù)據(jù)也并不能消滅或忽視數(shù)據(jù)上存在的合法利益。[35]因此,數(shù)據(jù)使用環(huán)節(jié)仍然需要維護數(shù)據(jù)上所承載的利益主體的利益,只有每個環(huán)節(jié)都保證自己的數(shù)據(jù)控制合法合規(guī),且可以追溯到流通前手,才能保證整個數(shù)據(jù)流通過程的合法合規(guī)性,保證數(shù)據(jù)要素市場的運行秩序。又由于這樣的財產(chǎn)權(quán)是純粹的防御性權(quán)利,它也可以通過增加防御元素來增強平臺對于數(shù)據(jù)的控制,從而更好地實現(xiàn)數(shù)據(jù)的流通共享。

(二)分享:數(shù)據(jù)分享義務(wù)

當(dāng)多重專有權(quán)導(dǎo)致公共資源的低效利用時,“反公地悲劇”就會發(fā)生。[36]因此,我們在構(gòu)建數(shù)據(jù)持有者權(quán)時,有意地限制了傳統(tǒng)所有權(quán)的對世、排他、追及權(quán)能,并使權(quán)利人盡量明確,但這還遠遠不夠。由于龐大的網(wǎng)絡(luò)運營者事實上控制著用戶的網(wǎng)絡(luò)活動和海量的數(shù)據(jù),其性質(zhì)已經(jīng)越來越接近具有公共性的基礎(chǔ)設(shè)施,因此,解決數(shù)據(jù)資源供給問題的另一條途徑,就是讓數(shù)據(jù)資源的控制者分享(Data Sharing)或開放其數(shù)據(jù)資源,從而使更多的數(shù)據(jù)需求者得到滿足,而不是“自產(chǎn)自銷”。

1.基于公共利益的數(shù)據(jù)分享(開放)。賦予網(wǎng)絡(luò)運營者數(shù)據(jù)開放義務(wù)的正當(dāng)性理由主要有以下兩個方面。一方面,很多網(wǎng)絡(luò)平臺已逐漸具備準(zhǔn)公共基礎(chǔ)設(shè)施的屬性。要滿足傳統(tǒng)的公共基礎(chǔ)設(shè)施的定位,一般需要滿足雙重條件:一是“自然壟斷(Natural Monopoly)”[37],二是“受到公眾利益的影響”。[38]這兩種要件完全可以適用到目前的大型網(wǎng)絡(luò)平臺,因為它們的作用往往是“嵌入的,大部分是不可見的,通常被認為是理所當(dāng)然的、高度標(biāo)準(zhǔn)化的信息傳播系統(tǒng)”[39],具有自然的壟斷地位和高度的社會依賴性。結(jié)合我國實際來看,對于網(wǎng)絡(luò)平臺的準(zhǔn)公共基礎(chǔ)設(shè)施地位的討論也有涉及,在《個人信息保護法》第58條(也被稱為互聯(lián)網(wǎng)“守門人條款”)[40]“互聯(lián)網(wǎng)平臺個人信息保護特別義務(wù)”規(guī)定中的三個條件“基礎(chǔ)互聯(lián)網(wǎng)服務(wù)”“用戶數(shù)量巨大”和“業(yè)務(wù)類型復(fù)雜”,就從平臺規(guī)模、力量、持續(xù)性與生態(tài)影響等幾個方面事實上劃定了一個網(wǎng)絡(luò)平臺是否為準(zhǔn)公共基礎(chǔ)設(shè)施的標(biāo)準(zhǔn),在實現(xiàn)從“開放資源到基礎(chǔ)服務(wù)”[41]的過程中,事實上接受了一種公共信任和公共責(zé)任。

另一方面,很多具有公共利益的數(shù)據(jù)存在“私人控制”的情況。由于數(shù)據(jù)價值的凸顯,數(shù)據(jù)開放帶來的好處已經(jīng)得到了世界各地政府的普遍承認,受益于政府信息公開制度的借鑒價值[42],政府?dāng)?shù)據(jù)開放率先成為國際社會的熱潮,并逐漸掀起一項開放政府?dāng)?shù)據(jù)運動。我國也于2015年印發(fā)《促進大數(shù)據(jù)發(fā)展行動綱要》將“加快政府?dāng)?shù)據(jù)開放共享”作為大數(shù)據(jù)發(fā)展的主要任務(wù)。顯而易見,公共利益因素是早期數(shù)據(jù)開放,尤其是政府?dāng)?shù)據(jù)開放的重要出發(fā)點。結(jié)合近年各地方政府紛紛出臺相關(guān)的“公共數(shù)據(jù)管理辦法”,其中的一個重要目的旨在“加強公共數(shù)據(jù)管理,促進公共數(shù)據(jù)應(yīng)用創(chuàng)新……保障數(shù)字化改革……推進省域治理體系和治理能力現(xiàn)代化”(20)。簡單而言,就是出于公共管理、社會治理等公共利益的目的而推進公共數(shù)據(jù)的分享與開放。

但上述舉措都沒有解決一個基礎(chǔ)性的缺陷,即具有公共利益的數(shù)據(jù)的私人控制的問題。在我國,無論是政府?dāng)?shù)據(jù)還是公共數(shù)據(jù)都依據(jù)“數(shù)據(jù)控制者”標(biāo)準(zhǔn),被界定為被政府或者公主體實際控制的數(shù)據(jù)。這就造成很多作為私主體的網(wǎng)絡(luò)運營者,特別是典型的“互聯(lián)網(wǎng)巨頭”們,即使由于其業(yè)務(wù)類型和用戶數(shù)量,事實上控制了很多涉及公共利益的數(shù)據(jù),卻無法在滿足特定條件的情況(如環(huán)境惡化、疫情防控等突發(fā)事件)下被分享使用,以滿足公共利益的目的。因此,為化解“公益數(shù)據(jù)的私人控制”問題,網(wǎng)絡(luò)運營者被賦予一定意義上的數(shù)據(jù)分享(開放)義務(wù)具有正當(dāng)性與合理性。事實上,在歐盟委員會最新立法建議《關(guān)于公平獲取和使用數(shù)據(jù)的協(xié)調(diào)規(guī)則(數(shù)據(jù)法)》(Data Act)中,已經(jīng)明確規(guī)定,基于突發(fā)公共事件、重大自然災(zāi)害以及重大網(wǎng)絡(luò)安全事件等公共利益的目的,使用數(shù)據(jù)的公共利益將超過數(shù)據(jù)持有者自由處置其持有數(shù)據(jù)的利益。在這種情況下,私人的數(shù)據(jù)持有者有義務(wù)根據(jù)公共部門、工會等相關(guān)機構(gòu)的要求向其分享(開放)數(shù)據(jù)。(21)

2.基于市場需求的數(shù)據(jù)分享。嚴(yán)格意義上來說,基于市場需求的數(shù)據(jù)分享更具有鼓勵數(shù)據(jù)控制者積極參與數(shù)據(jù)流通(包括數(shù)據(jù)開放、共享、交換、交易等形式)的意味,這不是一般意義上的賦予社會責(zé)任或義務(wù)。從獲取數(shù)據(jù)資源的數(shù)據(jù)生產(chǎn)角度出發(fā),市場化的數(shù)據(jù)分享是獲得生產(chǎn)要素,規(guī)范數(shù)據(jù)流通的必由之路和主要途徑。隨著越來越多的網(wǎng)絡(luò)運營者開始進行數(shù)據(jù)市場化的數(shù)據(jù)分享時,其對于削弱爬蟲技術(shù)的需求具有不可替代的作用。因此,本文亦對此部分作簡要論述。

由于前述數(shù)據(jù)持有者權(quán)的存在,(除公共數(shù)據(jù)外)網(wǎng)絡(luò)運營者應(yīng)當(dāng)自主決定自身所管理的數(shù)據(jù)資源的開放方式。[10]5-16,254最大的可能是為了服務(wù)于網(wǎng)絡(luò)運營者的利益,會決定自愿與其他市場主體進行合作。為此,應(yīng)向這些網(wǎng)絡(luò)運營者提供適當(dāng)?shù)募畲胧怨膭钸@種自愿的合作與分享。事實上,作為開放數(shù)據(jù)運動的深化,很多政府在激勵、推廣、普及數(shù)據(jù)分享方面取得了重大進展,而這些網(wǎng)絡(luò)運營者(包括企業(yè)、社會組織、學(xué)術(shù)機構(gòu)等等)通過免費開放、共享和數(shù)據(jù)交易為更多的數(shù)據(jù)市場利益相關(guān)者帶來切實的利益。(22)另一種形式的激勵措施可以包括建立相關(guān)的稅收政策。推動包含激勵因素的稅務(wù)制度設(shè)計,探索實施“以數(shù)抵稅”政策,對于積極開放、共享數(shù)據(jù)并產(chǎn)生較大經(jīng)濟價值的網(wǎng)絡(luò)運營者,在因數(shù)據(jù)帶來的增值性收入中,給予適當(dāng)比例稅收減免,對于具有較大社會公益價值的,給予一定的稅收優(yōu)惠。綜上,政府可以通過培養(yǎng)和傳播機構(gòu)數(shù)據(jù)能力、闡明價值并建立影響證據(jù)庫、支持新的數(shù)據(jù)中介機構(gòu)、建立治理框架、創(chuàng)建可重用的技術(shù)基礎(chǔ)設(shè)施等方式實現(xiàn)對于數(shù)據(jù)市場化流通的激勵。[20]

此外,具有我國特色的“公共數(shù)據(jù)授權(quán)運營”制度也為公共數(shù)據(jù)參與數(shù)據(jù)要素市場分享活動提供了重要的制度途徑。公共數(shù)據(jù)除了前述公共性價值,同時也具備了無限的經(jīng)濟價值與商業(yè)利用可能性。為了激發(fā)這部分?jǐn)?shù)據(jù)價值的轉(zhuǎn)化,以市場化的方式實現(xiàn)公共數(shù)據(jù)的分享與流通,“公共數(shù)據(jù)授權(quán)運營”可以說是一種極具中國特色的數(shù)據(jù)要素分享模式。授權(quán)運營單位通過取得公共數(shù)據(jù)管理機構(gòu)的授權(quán),對授權(quán)運營的公共數(shù)據(jù)進行加工,形成的數(shù)據(jù)產(chǎn)品和服務(wù),以實現(xiàn)向市場化的主體提供符合標(biāo)準(zhǔn)要求的數(shù)據(jù)要素的目的。這種具有“特許經(jīng)營”性質(zhì)的市場化數(shù)據(jù)分享模式[43],一方面協(xié)調(diào)了公主體及其他社會主體之于公共數(shù)據(jù)之上的利益關(guān)系,同時也在可控、可監(jiān)督的數(shù)據(jù)安全監(jiān)管范疇內(nèi)實現(xiàn)了高質(zhì)量數(shù)據(jù)要素產(chǎn)品的供給,實現(xiàn)了市場化價值與效率的提升。包括上海、浙江、成都等在內(nèi)的地方政府都在積極進行“公共數(shù)據(jù)授權(quán)運營”的實踐層面的探索與嘗試。這一制度與公共數(shù)據(jù)開放、共享制度相結(jié)合,將完整構(gòu)建關(guān)于公共數(shù)據(jù)分享利用的制度框架,對化解爬蟲技術(shù)所面臨的數(shù)據(jù)“獲取難”問題大有裨益。

六、結(jié)語

互聯(lián)網(wǎng)不僅僅是通信和活動開展的工具,還是感知和記錄客觀世界的系統(tǒng)。由此形成的數(shù)字化記錄(數(shù)據(jù))正成為新的知識生產(chǎn)方式的原料。人類文明所呈現(xiàn)出的“數(shù)據(jù)→信息→知識→智慧”的遞進式結(jié)構(gòu)[44],已經(jīng)隨著數(shù)字技術(shù)發(fā)展而發(fā)生了重要變化,人類認知世界的對象也由人類觀察和描述的信息、知識向底層數(shù)據(jù)——可機讀數(shù)據(jù)、語義元數(shù)據(jù),不斷地深化,關(guān)于客觀世界的機讀數(shù)據(jù)、語義元數(shù)據(jù)開始成為數(shù)字時代的生產(chǎn)要素。

正因為互聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù)具有巨大的重用價值,以爬蟲技術(shù)為代表的“代碼層”爭議不斷出現(xiàn)。對此,本文論證了爬蟲技術(shù)的兩面性。顯然,目前的理論與司法實踐都更加關(guān)注其負面影響,而未正視其生產(chǎn)性的數(shù)據(jù)重用價值。爬蟲技術(shù)對于便利要素流動,擴展要素重用場景、拓展要素使用目的,實現(xiàn)數(shù)據(jù)要素計算循環(huán)價值有著與生俱來的特殊技術(shù)優(yōu)勢。因此,爬蟲技術(shù)的問題本質(zhì)是對于數(shù)據(jù)要素市場主體合法利益分配治理的制度性問題,是解決創(chuàng)制數(shù)據(jù)和添附價值的數(shù)據(jù)生產(chǎn)者對數(shù)據(jù)重用權(quán)益保護問題。

通過“控制”與“分享”的二元路徑,既可以實現(xiàn)對于數(shù)據(jù)利益的合理分配,促進數(shù)據(jù)要素市場的穩(wěn)定供給和生產(chǎn),又可以幫助促成更加公平的數(shù)據(jù)利益分享機制,為全社會主體有效獲取利用數(shù)據(jù)開辟道路。推而廣之,數(shù)據(jù)要素的“控制”與“分享”應(yīng)當(dāng)是所有數(shù)字經(jīng)濟社會主體圍繞數(shù)據(jù)流通使用的“社會契約”,以保障公平實現(xiàn)社會主體參與數(shù)據(jù)價值的轉(zhuǎn)化,共同探索建立數(shù)據(jù)治理的信任框架。

注釋:

(1)Robots協(xié)議,也稱爬蟲協(xié)議、爬蟲規(guī)則等,是約定俗成的規(guī)范,不具有強制力。指網(wǎng)站通過建立robots.txt文件來告訴搜索引擎哪些頁面可以抓取,哪些頁面不可以抓取。

(2)《網(wǎng)絡(luò)安全法》規(guī)定:網(wǎng)絡(luò)運營者是指網(wǎng)絡(luò)的所有者、管理者和網(wǎng)絡(luò)服務(wù)提供者。另外需要說明的是,網(wǎng)絡(luò)可以實現(xiàn)各種社會活動,在實現(xiàn)或組織實現(xiàn)這些活動過程會形成數(shù)據(jù)這種“副產(chǎn)品”,內(nèi)容平臺或者具有內(nèi)容生產(chǎn)功能的社交平臺只是其中典型。本文以內(nèi)容平臺為例進行相關(guān)分析論述,相關(guān)結(jié)論同樣適用于其他的網(wǎng)絡(luò)運營者,特在此予以強調(diào)說明。

(3)一些公司主要是依靠員工手動瀏覽網(wǎng)站,并每天將數(shù)據(jù)從一個或多個網(wǎng)站復(fù)制/粘貼到電子表格或表單中。這種方法有許多缺點,包括支付人工費用、數(shù)據(jù)準(zhǔn)確性較低以及時間限制等。

(4)相關(guān)研究參見劉艷紅:《網(wǎng)絡(luò)爬蟲行為的刑事規(guī)制研究——以侵犯公民個人信息犯罪為視角》,《政治與法律》2019年第11期;Myra F.Din.Breaching and Entering:When Data Scraping Should Be a Federal Computer Hacking Crime.Brook.L.Rev.2015,(81)等。

(5)參見張維迎.理念的力量[M],西安:西北大學(xué)出版社,2014.本書中張維迎教授具體區(qū)分了“市場邏輯”與“宗教邏輯”。

(6)關(guān)于網(wǎng)絡(luò)服務(wù)協(xié)議、服務(wù)政策效力的相關(guān)研究參見王葉剛:《論網(wǎng)絡(luò)隱私政策的效力——以個人信息保護為中心》,《比較法研究》2020年第1期;姚黎黎:《網(wǎng)絡(luò)服務(wù)協(xié)議中動態(tài)條款的異質(zhì)性規(guī)則與權(quán)利平衡》,《學(xué)習(xí)與實踐》2017年第4期。

(7)參見L.Lessig.The Future of Ideas:The Fate of the Commons in a Connected World,New York:Random House,2002.在談到現(xiàn)代網(wǎng)絡(luò)信息技術(shù)中的信息傳遞時,萊斯格教授(Lawrence Lessig)所提出的這三個層面區(qū)分的經(jīng)典理論至今起著至關(guān)重要的作用。

(8)參見王天恩:《信息及其基本特征的當(dāng)代性開顯》,《中國社會科學(xué)》2022年第1期。信息既不是物質(zhì)也不是能量,而是一種基于物能的感受性關(guān)系,其成熟形態(tài)即信宿和信源間的感受性關(guān)系過程。

(9)相關(guān)案例參見杭州鐵路運輸法院(2021)浙8601民初309號民事判決書。事實上,在我國的司法審判中,數(shù)據(jù)的用途與數(shù)據(jù)源的用途是否具有實質(zhì)性替代的效果,成為判斷爬蟲技術(shù)是屬于不正當(dāng)競爭行為的重要考量因素。

(10)內(nèi)容生產(chǎn)活動一方面創(chuàng)造了UGC數(shù)據(jù),一方面也基于用戶的生產(chǎn)活動客觀產(chǎn)生了觀測數(shù)據(jù)和衍生數(shù)據(jù)。從數(shù)據(jù)生產(chǎn)角度來說,進行內(nèi)容生產(chǎn)就是一種數(shù)據(jù)生產(chǎn)活動。

(11)參見HiQ Labs,Inc.v.LinkedIn Corp.No.17-16783 D.C.No.3:17-cv-03301-EMC.

(12)參見Directive 96/9/EC of the European Parliament and of the Council of 11 March 1996 on the Legal Protection of Databases.

(13)參 見P.Hugenholtz.Against‘Data Property’.Kritika,2018,(3).對于數(shù)據(jù)生產(chǎn)者權(quán),學(xué)界質(zhì)疑的聲音比較大。

(14)參見(2017)京民終487號民事判決書。

(15)參見(2017)粵03民初822號民事判決書。

(16)參見(2019)京73民終3789號民事判決書。

(17)參見(2019)京73民終3789號民事判決書。

(18)據(jù)蘇青教授統(tǒng)計,截至2020年12月31日,網(wǎng)絡(luò)爬蟲涉罪刑事案件共有31件,涉案主要罪名為侵犯公民個人信息罪、侵犯著作權(quán)罪、非法獲取計算機信息系統(tǒng)數(shù)據(jù)罪與破壞計算機信息系統(tǒng)罪,案件數(shù)量分別為13件、8件和7件。參見蘇青:《網(wǎng)絡(luò)爬蟲的演變及其合法性限定》,《比較法研究》2021年第3期。

(19)《刑法》第285條規(guī)定了非法侵入計算機信息系統(tǒng)罪,非法獲取計算機信息系統(tǒng)數(shù)據(jù)與非法控制計算機信息系統(tǒng)罪,提供侵入、非法控制計算機信息系統(tǒng)程序、工具罪。

(20)參見《浙江省公共數(shù)據(jù)條例》第1條。

(21)參見REGULATION OF THE EUROPEAN PARLIAMENT AND OF THE COUNCIL on Harmonised Rules on Fair Access to and Use of Data(Data Act),{SEC(2022)81 final}-{SWD(2022)34 final}-{SWD(2022)35 final},Brussels,23.2.2022,COM(2022)68 final,2022/0047(COD).

(22)例如,美國專利商標(biāo)局(USPTO)也可能為聲稱從數(shù)據(jù)池獲得新創(chuàng)新的專利申請者提供快速途徑,從而激勵平臺公司參與數(shù)據(jù)池。

猜你喜歡
生產(chǎn)
讓安全生產(chǎn)執(zhí)法真正發(fā)揮震懾作用
我國夏糧生產(chǎn)喜獲豐收
熱軋雙相鋼HR450/780DP的開發(fā)與生產(chǎn)
山東冶金(2022年2期)2022-08-08 01:50:42
用舊的生產(chǎn)新的!
“三夏”生產(chǎn) 如火如荼
S-76D在華首架機實現(xiàn)生產(chǎn)交付
生產(chǎn)管理系統(tǒng)概述
全面生產(chǎn)維護(TPM)
中國制筆(2017年2期)2017-07-18 10:53:09
反生產(chǎn)行為差異化治理策略
安全生產(chǎn)重于泰山
主站蜘蛛池模板: 午夜视频免费一区二区在线看| 午夜爽爽视频| 国产日本一线在线观看免费| 国产欧美视频综合二区| 久久精品91麻豆| 青青网在线国产| 丁香婷婷综合激情| 国产成人一区二区| 一本大道东京热无码av | 欧美国产日韩在线| 精品人妻系列无码专区久久| 青青草原国产一区二区| 天堂亚洲网| 国产精品视频久| 国产精品爽爽va在线无码观看| 在线免费观看a视频| 亚国产欧美在线人成| 亚洲欧美在线综合图区| 有专无码视频| 91精品国产自产在线老师啪l| 亚洲永久精品ww47国产| 农村乱人伦一区二区| 亚洲一区第一页| 91在线日韩在线播放| 国产乱人乱偷精品视频a人人澡| 国产日韩丝袜一二三区| 国产精品福利导航| 91人妻在线视频| 欧美成人综合在线| 欧美狠狠干| 成人精品区| 亚洲天堂成人| 三级欧美在线| 日韩大乳视频中文字幕| 色亚洲成人| 国产福利小视频高清在线观看| 亚洲一级毛片免费看| 欧美成人国产| 91午夜福利在线观看精品| 波多野结衣中文字幕一区二区 | 99青青青精品视频在线| 精久久久久无码区中文字幕| 91视频国产高清| 亚洲 欧美 日韩综合一区| 亚亚洲乱码一二三四区| 97青草最新免费精品视频| 日本一本在线视频| 中文字幕亚洲综久久2021| 国产精品久线在线观看| 色国产视频| 国产在线精品美女观看| 国产精品欧美在线观看| 国产女人在线观看| 少妇人妻无码首页| 国产成人91精品免费网址在线| 久久综合九色综合97婷婷| 亚洲综合18p| 无码专区国产精品一区| 亚洲Av综合日韩精品久久久| 999国产精品| 国产久草视频| 国产精品内射视频| 欧美天堂在线| 色视频久久| a天堂视频| 日韩天堂视频| 欧美日韩国产一级| 久久久亚洲色| 国产理论最新国产精品视频| 亚洲VA中文字幕| 免费一级毛片不卡在线播放| 国产精品hd在线播放| 午夜视频在线观看免费网站| 69av在线| 国产一区三区二区中文在线| 成人午夜视频免费看欧美| 国产AV毛片| 一级福利视频| 91高清在线视频| 制服丝袜一区| 日韩欧美成人高清在线观看| 欧美日韩免费观看|