宋家璇 董金鑫
[摘要]為保護(hù)企業(yè)數(shù)據(jù)財(cái)產(chǎn)和公民個(gè)人信息,當(dāng)前我國(guó)司法實(shí)踐將未經(jīng)授權(quán)的數(shù)據(jù)爬取認(rèn)定為侵權(quán),甚至情節(jié)嚴(yán)重的認(rèn)定為犯罪。對(duì)數(shù)據(jù)爬取的評(píng)價(jià)需要進(jìn)行利益衡量,原因在于數(shù)據(jù)爬取存在利益沖突,此種沖突集中體現(xiàn)為平臺(tái)的數(shù)據(jù)財(cái)產(chǎn)利益、信息自由利益和反壟斷利益無(wú)法同時(shí)實(shí)現(xiàn)。通過(guò)對(duì)數(shù)據(jù)爬取利益和拒絕數(shù)據(jù)爬取的利益進(jìn)行衡量,可以發(fā)現(xiàn)法律應(yīng)當(dāng)維護(hù)數(shù)據(jù)爬取利益,數(shù)據(jù)爬取并非違法行為。為糾正司法實(shí)踐對(duì)數(shù)據(jù)爬取的錯(cuò)誤評(píng)價(jià),應(yīng)當(dāng)通過(guò)立法確立公開(kāi)數(shù)據(jù)屬于公眾、公開(kāi)數(shù)據(jù)可自由流通。為了使制度能夠真正落地,還需要妥善應(yīng)對(duì)數(shù)據(jù)爬取合法化帶來(lái)的一系列潛在風(fēng)險(xiǎn)。
[關(guān)鍵詞]數(shù)據(jù)爬取;利益衡量;數(shù)據(jù)歸屬;數(shù)據(jù)流通
[中圖分類號(hào)]D922? ? ? [文獻(xiàn)標(biāo)識(shí)碼]A
[DOI]:10.20122/j.cnki.2097-0536.2024.02.004
引言
數(shù)字時(shí)代,數(shù)據(jù)成為關(guān)鍵生產(chǎn)要素,企業(yè)之間的競(jìng)爭(zhēng)已經(jīng)擴(kuò)展到數(shù)據(jù)上的競(jìng)爭(zhēng),平臺(tái)有著強(qiáng)烈的控制自身數(shù)據(jù)的意愿,為此平臺(tái)會(huì)設(shè)置反爬取措施避免自身數(shù)據(jù)被他人爬取。由于公開(kāi)數(shù)據(jù)的開(kāi)放性程度較高,爬蟲(chóng)總是能夠爬取到數(shù)據(jù),平臺(tái)為維護(hù)自身權(quán)益只能求助于法律,因此產(chǎn)生了大量的法律糾紛。當(dāng)前我國(guó)立法在數(shù)據(jù)爬取問(wèn)題上尚處空白,司法實(shí)踐在保護(hù)被爬取方利益的同時(shí),阻礙了公開(kāi)數(shù)據(jù)的流通,而數(shù)據(jù)流通能夠?qū)崿F(xiàn)巨大的社會(huì)利益。這一現(xiàn)象向法學(xué)界提出了一個(gè)問(wèn)題,數(shù)據(jù)爬取利益是否比拒絕數(shù)據(jù)爬取的利益更值得法律保護(hù),這一問(wèn)題等同于數(shù)據(jù)爬取是合法行為還是違法行為,對(duì)這一問(wèn)題的解答決定著公開(kāi)數(shù)據(jù)的歸屬和流通,并直接影響著立法和司法實(shí)踐。為此,本文試圖揭示出數(shù)據(jù)爬取能夠?qū)崿F(xiàn)的法益,通過(guò)對(duì)爬取方和被爬取方的法益進(jìn)行衡量,以解決數(shù)據(jù)爬取是否應(yīng)當(dāng)合法化這一問(wèn)題。
一、數(shù)據(jù)爬取面臨現(xiàn)實(shí)困境
我國(guó)一概禁止數(shù)據(jù)爬取的執(zhí)法和司法,忽略了數(shù)據(jù)爬取利益,當(dāng)前法律維護(hù)的是拒絕數(shù)據(jù)爬取的利益。[1]已生效的司法判決具有立法的效果,其產(chǎn)生的指引和預(yù)測(cè)作用,使數(shù)據(jù)爬取面臨著違法甚至犯罪的危險(xiǎn),嚴(yán)重阻礙了數(shù)據(jù)流通,數(shù)據(jù)爬取利益難以實(shí)現(xiàn)。具體來(lái)說(shuō),兩方面原因使數(shù)據(jù)爬取利益難以實(shí)現(xiàn)。一是法律對(duì)數(shù)據(jù)財(cái)產(chǎn)的保護(hù)阻礙了數(shù)據(jù)爬取,法律要求爬取方爬取公開(kāi)數(shù)據(jù)需要獲得平臺(tái)同意,未經(jīng)平臺(tái)授權(quán)爬取數(shù)據(jù)構(gòu)成侵權(quán)。二是法律對(duì)個(gè)人信息的保護(hù)阻礙了數(shù)據(jù)爬取,法律要求爬取方爬取已公開(kāi)的個(gè)人信息需要獲得個(gè)人同意,未經(jīng)個(gè)人授權(quán)爬取承載著個(gè)人信息的數(shù)據(jù)構(gòu)成侵權(quán)。
(一)法律對(duì)數(shù)據(jù)財(cái)產(chǎn)的保護(hù)阻礙了數(shù)據(jù)爬取
對(duì)于公開(kāi)數(shù)據(jù)屬于誰(shuí)這個(gè)問(wèn)題,立法并未做出規(guī)定。而梳理現(xiàn)有的數(shù)據(jù)爬取糾紛判決,可以發(fā)現(xiàn)法院普遍認(rèn)為未經(jīng)授權(quán)爬取數(shù)據(jù)侵犯了平臺(tái)的數(shù)據(jù)財(cái)產(chǎn)利益,通過(guò)援引《反不正當(dāng)競(jìng)爭(zhēng)法》第2條判定未經(jīng)授權(quán)爬取數(shù)據(jù)構(gòu)成侵權(quán)。[2]此外,刑法第285條第2款規(guī)定了非法獲取計(jì)算機(jī)信息系統(tǒng)數(shù)據(jù)罪,實(shí)踐中已有未經(jīng)授權(quán)爬取公開(kāi)數(shù)據(jù)被定罪的先例。司法實(shí)踐承認(rèn)了公開(kāi)數(shù)據(jù)屬于平臺(tái),要求爬取方爬取數(shù)據(jù)需要獲得平臺(tái)的同意。而對(duì)于很多公開(kāi)數(shù)據(jù),平臺(tái)不會(huì)允許社會(huì)公眾爬取,強(qiáng)行爬取構(gòu)成侵權(quán),嚴(yán)重的構(gòu)成犯罪,數(shù)據(jù)爬取受到極大阻礙。
(二)法律對(duì)個(gè)人信息的保護(hù)阻礙了數(shù)據(jù)爬取
信息一經(jīng)分享進(jìn)入公共領(lǐng)域即視為可自由流通,然而大數(shù)據(jù)時(shí)代使得信息流動(dòng)的元規(guī)則因個(gè)人信息保護(hù)受到挑戰(zhàn)。在微博訴脈脈案中,法院明確提出了三重授權(quán)原則,即第三方通過(guò)開(kāi)放平臺(tái)爬取用戶已公開(kāi)的個(gè)人信息,需要用戶授權(quán)+平臺(tái)授權(quán)+用戶授權(quán)。具體而言,一是微博獲取用戶個(gè)人信息需要用戶授權(quán);二是爬取方爬取個(gè)人信息需要微博授權(quán);三是爬取方爬取個(gè)人信息需要用戶授權(quán),違反該原則的數(shù)據(jù)爬取是違法的。微博訴脈脈案,給社會(huì)公眾一種指引,爬取承載著個(gè)人信息的公開(kāi)數(shù)據(jù)現(xiàn)需要個(gè)人同意。爬取承載著個(gè)人信息的公開(kāi)數(shù)據(jù)需要個(gè)人同意,會(huì)因?yàn)樯婕昂A總€(gè)人信息,而難以履行告知同意義務(wù),數(shù)據(jù)爬取受到嚴(yán)重阻礙。
二、數(shù)據(jù)爬取合法化的正當(dāng)性
法律對(duì)數(shù)據(jù)爬取的評(píng)價(jià)需要進(jìn)行利益衡量,原因在于,數(shù)據(jù)爬取和拒絕數(shù)據(jù)爬取所實(shí)現(xiàn)的利益都是法律保護(hù)的利益,并且一方利益的實(shí)現(xiàn)會(huì)導(dǎo)致另一方利益無(wú)法實(shí)現(xiàn),存在利益沖突。此種沖突集中體現(xiàn)為平臺(tái)的數(shù)據(jù)財(cái)產(chǎn)利益與信息自由利益和反壟斷利益無(wú)法同時(shí)實(shí)現(xiàn)。通過(guò)比較兩種利益的重要性,可以發(fā)現(xiàn)數(shù)據(jù)爬取利益大于拒絕數(shù)據(jù)爬取的利益,兩利相衡取其大,法律應(yīng)當(dāng)選擇維護(hù)數(shù)據(jù)爬取利益,數(shù)據(jù)爬取是一種合法行為。
(一)拒絕數(shù)據(jù)爬取的利益為平臺(tái)的數(shù)據(jù)財(cái)產(chǎn)利益
在數(shù)據(jù)生產(chǎn)活動(dòng)中,平臺(tái)投入了大量的勞動(dòng)和資本,平臺(tái)建立起網(wǎng)絡(luò)架構(gòu),在此架構(gòu)基礎(chǔ)上生產(chǎn)了大量數(shù)據(jù),并且平臺(tái)需要一直維護(hù)網(wǎng)站的正常運(yùn)行,保存并管理產(chǎn)生的數(shù)據(jù)。財(cái)產(chǎn)法的一般原理是,對(duì)于通過(guò)自身勞動(dòng)創(chuàng)造出來(lái)的財(cái)產(chǎn),勞動(dòng)者享有處分權(quán)利。所以憑借著勞動(dòng)和資本投入,平臺(tái)獲得了數(shù)據(jù)財(cái)產(chǎn)權(quán)利,這種權(quán)利受到法律保護(hù)。未經(jīng)授權(quán)爬取數(shù)據(jù)損害的是平臺(tái)的數(shù)據(jù)財(cái)產(chǎn)利益,拒絕數(shù)據(jù)爬取的利益為平臺(tái)的數(shù)據(jù)財(cái)產(chǎn)利益。
(二)數(shù)據(jù)爬取利益為信息自由利益和反壟斷利益
數(shù)據(jù)爬取實(shí)現(xiàn)了信息自由利益。我國(guó)憲法規(guī)定公民享有言論自由權(quán),言論自由權(quán)利的設(shè)立目的在于保障公民可以自由交流,然而言論自由權(quán)的內(nèi)容卻僅保護(hù)言論可以自由發(fā)出,對(duì)言論可以自由接收的保護(hù)長(zhǎng)期缺位。信息自由權(quán)保護(hù)的是接收言論的自由,根據(jù)言論自由權(quán)的設(shè)立目的可以發(fā)現(xiàn)信息自由權(quán)是一種隱含的權(quán)利。[3]憲法中已規(guī)定的具體的基本權(quán)利的內(nèi)涵決定著人權(quán)條款中人權(quán)的外延,言論自由屬于人權(quán),與之相對(duì)應(yīng)、具有同等地位的信息自由也應(yīng)當(dāng)屬于人權(quán),信息自由是憲法應(yīng)當(dāng)保護(hù)的基本權(quán)利。信息自由包含著獲取信息的方式和工具使用的自由,數(shù)據(jù)爬取是一種獲取信息的方式,數(shù)據(jù)爬取技術(shù)是獲取公開(kāi)信息的一種工具,數(shù)據(jù)爬取自由是信息自由的應(yīng)有之義,所以公民享有爬取公開(kāi)數(shù)據(jù)的權(quán)利,數(shù)據(jù)爬取實(shí)現(xiàn)了信息自由利益。
數(shù)據(jù)爬取實(shí)現(xiàn)了反壟斷利益。平臺(tái)授權(quán)其他主體爬取數(shù)據(jù)的方式是通過(guò)公布robots.txt文件,robots協(xié)議本質(zhì)上是授權(quán)條款,在一般禁止的情況下,其向外界宣示哪些主體可以爬取數(shù)據(jù)。在瀏覽器的網(wǎng)址搜索欄中輸入域名/robots.txt,可以查看平臺(tái)的robots協(xié)議,查看了微博、抖音、快手、好看視頻、百度知道、百度百科、百度經(jīng)驗(yàn)、百度貼吧、百度文庫(kù)、搜狗問(wèn)問(wèn)、搜狗百科、360問(wèn)答、360百科、知乎、嗶哩嗶哩、小紅書(shū)的robots協(xié)議。能夠發(fā)現(xiàn)許多平臺(tái)存在差別授權(quán)的現(xiàn)象。平臺(tái)的差別授權(quán)突出體現(xiàn)在,上述平臺(tái)通過(guò)robots協(xié)議授權(quán)的主體都是當(dāng)前用戶數(shù)較多的搜索引擎,而拒絕其他一切主體爬取,百度、谷歌和搜狗得到了所有平臺(tái)的授權(quán)。百度、谷歌和搜狗比通用搜索引擎市場(chǎng)的潛在進(jìn)入者占有更多的公開(kāi)數(shù)據(jù),如果沒(méi)有獲得授權(quán)的主體無(wú)法爬取到數(shù)據(jù),那么平臺(tái)的差別授權(quán)行為會(huì)在通用搜索引擎市場(chǎng)產(chǎn)生排除、限制競(jìng)爭(zhēng)的效果,原因如下。首先,公開(kāi)數(shù)據(jù)是搜索引擎提供搜索服務(wù)的基礎(chǔ)。其次,多占有的數(shù)據(jù)所承載的信息是用戶在使用搜索引擎時(shí)最需要的那類信息,并且多占有的這部分信息在質(zhì)量和數(shù)量上,都要優(yōu)于潛在進(jìn)入者占有的相應(yīng)信息,多占有的這部分?jǐn)?shù)據(jù)是提供更好搜索服務(wù)的基礎(chǔ)。最后,當(dāng)數(shù)據(jù)的數(shù)量較多、質(zhì)量較高,因模仿所需要的經(jīng)濟(jì)成本過(guò)高以及耗費(fèi)的時(shí)間過(guò)長(zhǎng)時(shí),實(shí)際不具備可模仿性。[4]多占有的數(shù)據(jù)所帶來(lái)的競(jìng)爭(zhēng)優(yōu)勢(shì)能夠在通用搜索引擎市場(chǎng)排除、限制競(jìng)爭(zhēng)。我國(guó)反壟斷法的調(diào)整對(duì)象是壟斷行為,排除、限制競(jìng)爭(zhēng)的行為是壟斷行為,平臺(tái)的差別授權(quán)行為是壟斷行為。盡管這種行為不同于反壟斷法已規(guī)定的任何一種具體壟斷行為,但因?yàn)槠鋵儆诜磯艛喾ǖ恼{(diào)整對(duì)象,受反壟斷法調(diào)整,為調(diào)整這種壟斷行為需要使公眾能夠爬取到數(shù)據(jù)。數(shù)據(jù)爬取起到了反壟斷的效果,數(shù)據(jù)爬取實(shí)現(xiàn)了反壟斷利益。
(三)數(shù)據(jù)爬取利益重要性大于拒絕數(shù)據(jù)爬取利益
社會(huì)公共利益是指不特定的社會(huì)成員所享有的利益,數(shù)據(jù)爬取利益包括信息自由利益和反壟斷利益,數(shù)據(jù)爬取利益是社會(huì)公共利益,平臺(tái)的數(shù)據(jù)財(cái)產(chǎn)利益是一種個(gè)體財(cái)產(chǎn)利益。社會(huì)公共利益優(yōu)先于個(gè)體財(cái)產(chǎn)利益是基本共識(shí),[5]所以信息自由利益和反壟斷利益都比平臺(tái)的數(shù)據(jù)財(cái)產(chǎn)利益更為重要,數(shù)據(jù)爬取利益的重要性大于拒絕數(shù)據(jù)爬取利益的重要性,法律應(yīng)當(dāng)選擇維護(hù)數(shù)據(jù)爬取利益,數(shù)據(jù)爬取并非違法行為。
三、數(shù)據(jù)爬取合法化的制度設(shè)計(jì)
(一)將數(shù)據(jù)爬取確立為合法行為
為維護(hù)數(shù)據(jù)爬取利益,擺脫當(dāng)前數(shù)據(jù)爬取面臨的困境,應(yīng)當(dāng)通過(guò)立法的方式糾正司法實(shí)踐對(duì)數(shù)據(jù)爬取的錯(cuò)誤評(píng)價(jià)。在制度設(shè)計(jì)上,應(yīng)將數(shù)據(jù)爬取確立為合法行為。數(shù)據(jù)爬取合法化的關(guān)鍵在于明確的數(shù)據(jù)歸屬,明確的財(cái)產(chǎn)權(quán)屬能夠有效避免糾紛,對(duì)于數(shù)據(jù)的流通和利用、培育數(shù)字經(jīng)濟(jì)有著重要意義,有恒產(chǎn)者方能有恒心。具體來(lái)說(shuō),法律應(yīng)當(dāng)規(guī)定公開(kāi)數(shù)據(jù)屬于公眾,公開(kāi)數(shù)據(jù)是一種公共財(cái)產(chǎn),任何人都可以自由地復(fù)制和利用,享受該財(cái)產(chǎn)利益。此外,應(yīng)當(dāng)明確規(guī)定用戶一旦公開(kāi)承載著個(gè)人信息的數(shù)據(jù)即具有同意他人爬取的意思表示,爬取承載著個(gè)人信息的公開(kāi)數(shù)據(jù)無(wú)需獲得任何人的同意,公開(kāi)數(shù)據(jù)可自由流通。
(二)妥善應(yīng)對(duì)數(shù)據(jù)爬取合法化帶來(lái)的風(fēng)險(xiǎn)
在維護(hù)數(shù)據(jù)爬取利益的制度設(shè)計(jì)上,要妥善應(yīng)對(duì)數(shù)據(jù)爬取合法化帶來(lái)的一系列潛在風(fēng)險(xiǎn),著重預(yù)防平臺(tái)商業(yè)利益和個(gè)人知識(shí)產(chǎn)權(quán)利益受到損害,降低法益受損風(fēng)險(xiǎn),以兼顧好社會(huì)各方利益,為公開(kāi)數(shù)據(jù)的自由流通鋪平道路。為防止流量過(guò)載導(dǎo)致平臺(tái)商業(yè)利益受到損害,法律應(yīng)當(dāng)做出下列規(guī)定。其一是允許平臺(tái)在大多數(shù)時(shí)間里設(shè)置反爬取措施,在清晨和深夜等用戶數(shù)非常少的時(shí)間,禁止平臺(tái)設(shè)置反爬取措施,反爬取措施起到減速帶的作用。其二是允許平臺(tái)設(shè)置在不同的時(shí)間段所能夠承受的最大爬蟲(chóng)流量值,當(dāng)達(dá)到最大值時(shí)通過(guò)彈窗的方式警告爬取方,若爬取方繼續(xù)爬取構(gòu)成侵權(quán)。其三是允許平臺(tái)規(guī)定某些時(shí)間段禁止爬取方爬取數(shù)據(jù),例如在用戶使用平臺(tái)的高峰期,可禁止爬取方爬取數(shù)據(jù),違反平臺(tái)規(guī)定爬取數(shù)據(jù)構(gòu)成侵權(quán)。其四是將集中的爬蟲(chóng)流量分散開(kāi)來(lái),可規(guī)定某個(gè)時(shí)間段只允許商用爬蟲(chóng)爬取數(shù)據(jù),某個(gè)時(shí)間段只允許普通用戶爬蟲(chóng)爬取數(shù)據(jù)。為防止用戶的知識(shí)產(chǎn)權(quán)利益受到損害,應(yīng)當(dāng)規(guī)定只要未經(jīng)用戶同意,將用戶在平臺(tái)生產(chǎn)的內(nèi)容發(fā)布在其他平臺(tái)就構(gòu)成侵權(quán)。實(shí)質(zhì)性替代平臺(tái)的內(nèi)容或服務(wù)需要發(fā)布海量的內(nèi)容,發(fā)布方實(shí)際不可能獲得那么多用戶的同意,因此這樣的規(guī)定可以有效預(yù)防用戶的知識(shí)產(chǎn)權(quán)利益受到損害。
四、結(jié)語(yǔ)
數(shù)據(jù)的真實(shí)價(jià)值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,而絕大部分則隱藏在表面之下。在當(dāng)前實(shí)踐中,由于爬蟲(chóng)對(duì)于很多公開(kāi)數(shù)據(jù)的爬取是違法的,公開(kāi)數(shù)據(jù)無(wú)法自由流通,數(shù)據(jù)的大量?jī)r(jià)值尚未發(fā)掘。本文揭示出數(shù)據(jù)爬取能夠?qū)崿F(xiàn)法律保護(hù)的利益,法律對(duì)數(shù)據(jù)爬取的評(píng)價(jià)需要進(jìn)行利益衡量。通過(guò)利益衡量,發(fā)現(xiàn)數(shù)據(jù)爬取利益是更值得法律維護(hù)的利益,數(shù)據(jù)爬取是一種合法行為。最終得出了公開(kāi)數(shù)據(jù)屬于公眾、公開(kāi)數(shù)據(jù)可自由流通的結(jié)論,這一結(jié)論的意義不僅在于能夠?qū)崿F(xiàn)信息自由利益和反壟斷利益,而且可以充分釋放出數(shù)據(jù)的潛在價(jià)值,有益于社會(huì)的進(jìn)步和發(fā)展。
參考文獻(xiàn):
[1]許可.數(shù)據(jù)爬取的正當(dāng)性及其邊界[J].中國(guó)法學(xué),2021(2):166-188.
[2]盧代富,張煜琦.從權(quán)益保護(hù)到利益衡量:數(shù)據(jù)抓取行為正當(dāng)性認(rèn)定的路徑優(yōu)化[J].河南財(cái)經(jīng)政法大學(xué)學(xué)報(bào),2022,37(6):59-70.
[3]敖海靜.信息自由的憲法基礎(chǔ)[J].華東政法大學(xué)學(xué)報(bào),2023(2):34-52.
[4]孫晉,鐘原.大數(shù)據(jù)時(shí)代數(shù)據(jù)構(gòu)成必要設(shè)施的反壟斷法分析[J].電子知識(shí)產(chǎn)權(quán),2018(5):38-49.
[5]王利明.民法上的利益位階及其考量[J].法學(xué)家,2014(1):79-90+176-177.
基金項(xiàng)目:青島市社科規(guī)劃項(xiàng)目,項(xiàng)目名稱:新冠疫情背景下青島市涉外合同法律適用研究(項(xiàng)目編號(hào):QDSKL2101048)
作者簡(jiǎn)介:
宋家璇(1999.5-),男,漢族,山東濰坊人,碩士,研究方向:民商法學(xué);
董金鑫(1985.9-),男,漢族,山東威海人,博士,副教授,研究方向:國(guó)際民商法。