(四川大學(xué)圖書館 四川成都 610041)
數(shù)據(jù)創(chuàng)新與知識(shí)產(chǎn)權(quán)保護(hù)是大數(shù)據(jù)時(shí)代背景下所面臨的兩大重要內(nèi)容。由于國(guó)內(nèi)具有價(jià)值的數(shù)據(jù)大多散落在各級(jí)政府、醫(yī)院、科研院校以及其他行業(yè)并相互獨(dú)立,形成了信息孤島,從而產(chǎn)生了暫時(shí)擱淺的休眠數(shù)據(jù),這些數(shù)據(jù)不僅單項(xiàng)價(jià)值巨大,多重?cái)?shù)據(jù)的整合開發(fā)更能發(fā)揮出巨大潛能。休眠數(shù)據(jù)是指已經(jīng)存在于數(shù)據(jù)庫中、當(dāng)前并不使用、將來有可能使用的數(shù)據(jù),這種數(shù)據(jù)隨著時(shí)間延長(zhǎng)而積累蔓延[1]。也有學(xué)者認(rèn)為休眠數(shù)據(jù)是指數(shù)據(jù)價(jià)值被特定主體利用殆盡之時(shí),只是這些數(shù)據(jù)的某一方面用途的價(jià)值被使用,并不意味著這些數(shù)據(jù)沒有其他任何價(jià)值,可能由于主體或主體數(shù)據(jù)需求的改變,可能由于數(shù)據(jù)技術(shù)的發(fā)展,也可能由于其關(guān)聯(lián)數(shù)據(jù)的出現(xiàn),使其成為非常有價(jià)值的數(shù)據(jù)或者數(shù)據(jù)集合[2]。而如何將大量具有潛在價(jià)值的休眠數(shù)據(jù)進(jìn)行再利用或重組創(chuàng)新,以及相關(guān)知識(shí)產(chǎn)權(quán)保護(hù)問題對(duì)傳統(tǒng)知識(shí)產(chǎn)權(quán)法提出了怎樣的要求,都亟需進(jìn)一步探討和分析。
休眠數(shù)據(jù)的數(shù)據(jù)創(chuàng)新是將已經(jīng)存在于各種數(shù)據(jù)庫中的不經(jīng)常被使用或不被挖掘,但是具有一定潛在價(jià)值的數(shù)據(jù),通過重組或整合等方式釋放,從而使數(shù)據(jù)的潛在價(jià)值得到充分體現(xiàn)。
海量休眠數(shù)據(jù)的潛在價(jià)值巨大,其數(shù)據(jù)再利用的不同環(huán)節(jié)和不同階段都蘊(yùn)含著重大的商業(yè)性價(jià)值,并能促使產(chǎn)品增值以實(shí)現(xiàn)新的價(jià)值創(chuàng)造[3]。休眠數(shù)據(jù)再利用的典型例子是通過大數(shù)據(jù)技術(shù)搜索關(guān)聯(lián)數(shù)據(jù),使主體和客體數(shù)據(jù)之間瞬時(shí)交互形成關(guān)聯(lián)列表,使數(shù)據(jù)中隱藏的價(jià)值得以實(shí)現(xiàn)。例如,京東商城將顧客在網(wǎng)站內(nèi)的所有瀏覽軌跡都通過機(jī)器人系統(tǒng)自動(dòng)記錄下來,根據(jù)不同的數(shù)據(jù)特點(diǎn)進(jìn)行自動(dòng)分類并分析處理,按照商品類別形成不同的推薦欄目,從而為客戶提供個(gè)性化的服務(wù);攜程網(wǎng)對(duì)機(jī)票價(jià)格與機(jī)票預(yù)定時(shí)間二者銷售數(shù)據(jù)之間的關(guān)系進(jìn)行了分析,以預(yù)測(cè)未來一段時(shí)間機(jī)票價(jià)格的走勢(shì)。
休眠數(shù)據(jù)有時(shí)需要通過與另一個(gè)毫無相干的數(shù)據(jù)集結(jié)合,其價(jià)值才能被激活變得有意義,即用一種用戶自己特定需要的方式根據(jù)不同的創(chuàng)新要求混合這些數(shù)據(jù)——數(shù)據(jù)重組。例如,廣州軍區(qū)廣州總醫(yī)院在2013年對(duì)手機(jī)輻射是否可增加大腦神經(jīng)膠質(zhì)瘤風(fēng)險(xiǎn)進(jìn)行了研究,其中手機(jī)用戶以中華人民共和國(guó)工業(yè)和信息化部統(tǒng)計(jì)數(shù)據(jù)其中一部分(2 750人)為例,與此同時(shí),選取膠質(zhì)瘤患者2 630名作為參照對(duì)象,結(jié)合兩個(gè)數(shù)據(jù)集研究后發(fā)現(xiàn)二者并沒有任何的直接關(guān)系。總之,隨著大數(shù)據(jù)時(shí)代的到來,兩個(gè)或多個(gè)數(shù)據(jù)源重組再利用的總和比部分?jǐn)?shù)據(jù)更加有價(jià)值。當(dāng)我們將多個(gè)獨(dú)立數(shù)據(jù)集合的總和重組在一起時(shí),重組總和本身的價(jià)值比單個(gè)數(shù)據(jù)總和更大。
大數(shù)據(jù)時(shí)代,創(chuàng)新主體對(duì)休眠數(shù)據(jù)的分析和挖掘以及重組再利用是通過對(duì)數(shù)據(jù)的抓取、分析與加工等手段得到新的數(shù)據(jù)集信息。但是這一過程中同時(shí)又產(chǎn)生了新的問題,即原有數(shù)據(jù)創(chuàng)造者的權(quán)利維護(hù)(即知識(shí)產(chǎn)權(quán))與創(chuàng)新主體現(xiàn)有權(quán)利的擁有該如何界定和分配,對(duì)傳統(tǒng)的知識(shí)產(chǎn)權(quán)法提出了更高更精準(zhǔn)的要求。而傳統(tǒng)意義上的知識(shí)產(chǎn)權(quán)是指人們就其智力勞動(dòng)成果所依法享有的專有權(quán)利,通常是國(guó)家賦予創(chuàng)造者對(duì)其智力成果在一定時(shí)期內(nèi)享有的專有權(quán)或獨(dú)占權(quán)[4]。知識(shí)產(chǎn)權(quán)從本質(zhì)上說是一種無形財(cái)產(chǎn)權(quán),其客體是智力成果或者知識(shí)產(chǎn)品,是一種無形財(cái)產(chǎn)或者一種沒有形體的精神財(cái)富,是創(chuàng)造性的智力勞動(dòng)所創(chuàng)造的勞動(dòng)成果。
傳統(tǒng)的知識(shí)產(chǎn)權(quán)簡(jiǎn)單來說具有3個(gè)特征:專有性、地域性、時(shí)間性。大數(shù)據(jù)時(shí)代又重新賦予了知識(shí)產(chǎn)權(quán)新的特征:其網(wǎng)絡(luò)資源相對(duì)于傳統(tǒng)文字資源有著自己獨(dú)特的特征。①數(shù)字化、網(wǎng)絡(luò)化,這是網(wǎng)絡(luò)信息資源的基本特征;②信息量大,種類繁多;③信息更新周期短;④資源龐大,開放性強(qiáng),信息資源不受地域限制,任何聯(lián)網(wǎng)的計(jì)算機(jī)都可以上傳和下載信息;⑤組織分散,沒有統(tǒng)一的管理機(jī)制和機(jī)構(gòu)。而黃立芳提出數(shù)據(jù)產(chǎn)權(quán)這一概念,即數(shù)據(jù)開發(fā)者對(duì)合法獲得的共有或?qū)S蓄I(lǐng)域的數(shù)據(jù),通過抓取、分析、加工、處理等智力勞動(dòng)獲得的數(shù)據(jù)或數(shù)據(jù)集所擁有的人身權(quán)和財(cái)產(chǎn)權(quán)[5],也是對(duì)大數(shù)據(jù)時(shí)代背景下知識(shí)產(chǎn)權(quán)的補(bǔ)充。
海量休眠數(shù)據(jù)經(jīng)過數(shù)據(jù)重組或整合等方式加工處理后成功創(chuàng)造出新的數(shù)據(jù)集合或數(shù)據(jù)集,即數(shù)據(jù)創(chuàng)新。這些創(chuàng)新數(shù)據(jù)既可以作為評(píng)價(jià)科研機(jī)構(gòu)產(chǎn)出水平的數(shù)據(jù),也可以通過在商業(yè)領(lǐng)域、銀行、商戶之間的交易記錄和憑證預(yù)測(cè)消費(fèi)者消費(fèi)傾向[6]。李學(xué)龍、龔海剛依據(jù)目前大數(shù)據(jù)分析的主要領(lǐng)域?qū)⒋髷?shù)據(jù)生成的來源劃分為科學(xué)數(shù)據(jù)、商業(yè)數(shù)據(jù)和互聯(lián)網(wǎng)數(shù)據(jù)3種類型[7]。無論是嚴(yán)謹(jǐn)?shù)目茖W(xué)數(shù)據(jù)、熱點(diǎn)的商業(yè)數(shù)據(jù)還是自然語言處理的互聯(lián)網(wǎng)數(shù)據(jù),都存在暫時(shí)被擱置的具有潛在價(jià)值的休眠數(shù)據(jù)。這些休眠數(shù)據(jù)經(jīng)過進(jìn)一步挖掘、加工、分析與整理需要新的知識(shí)產(chǎn)權(quán)政策支撐,是否會(huì)侵害到原有數(shù)據(jù)創(chuàng)造者的合法權(quán)利,是否對(duì)重組的結(jié)果給予合理的保護(hù),這些都使得原有知識(shí)產(chǎn)權(quán)保護(hù)面臨新的挑戰(zhàn)。
數(shù)據(jù)創(chuàng)新強(qiáng)調(diào)利用數(shù)據(jù)挖掘(包括關(guān)聯(lián)規(guī)則學(xué)習(xí)、聚類分析和分類分析等[8])與知識(shí)發(fā)現(xiàn)(是指從數(shù)據(jù)中識(shí)別出有效的、新穎的、潛在有用的、最終可理解的模式過程[9])等大數(shù)據(jù)技術(shù)對(duì)具有潛在價(jià)值的休眠數(shù)據(jù)進(jìn)行重組與整合,而創(chuàng)新的過程就是知識(shí)產(chǎn)權(quán)的應(yīng)用和獲得過程。數(shù)據(jù)的二次利用涉及源數(shù)據(jù)隱私及商業(yè)機(jī)密的知識(shí)產(chǎn)權(quán)保護(hù)問題,其產(chǎn)權(quán)的保護(hù)與歸屬不僅是相關(guān)原有主體間的利益分割問題,更是創(chuàng)新主體持續(xù)發(fā)展和掌握競(jìng)爭(zhēng)主動(dòng)的重要支撐,所以知識(shí)產(chǎn)權(quán)保護(hù)與歸屬是數(shù)據(jù)創(chuàng)新的關(guān)鍵所在。在創(chuàng)新過程中,創(chuàng)新主體需要投入優(yōu)勢(shì)資源和秘密技術(shù)等,同時(shí)圍繞一項(xiàng)產(chǎn)生的知識(shí)產(chǎn)權(quán)有很多利益主體,所以知識(shí)產(chǎn)權(quán)對(duì)于數(shù)據(jù)創(chuàng)新主體更多的是約束而不是激勵(lì)和促進(jìn),這在一定程度上阻礙了創(chuàng)新主體的創(chuàng)新積極性。只有數(shù)據(jù)創(chuàng)新各方面的利益達(dá)到均衡保障,創(chuàng)新主體的潛力與優(yōu)勢(shì)才能充分發(fā)揮,數(shù)據(jù)創(chuàng)新活動(dòng)才能順利開展。
如何平衡各創(chuàng)新主體之間新的利益格局以及使知識(shí)產(chǎn)權(quán)法律規(guī)則更具彈性,是在大數(shù)據(jù)時(shí)代環(huán)境下所面臨的新的要求。筆者認(rèn)為上述問題可以簡(jiǎn)化為兩個(gè)名詞:“平衡”與“彈性”。
(1)平衡。在新的背景下,休眠數(shù)據(jù)的重新整合以及利用知識(shí)產(chǎn)權(quán)法對(duì)原有數(shù)據(jù)資源的控制,導(dǎo)致知識(shí)產(chǎn)權(quán)法的發(fā)展必須在更廣闊的空間內(nèi)的各種利益之間進(jìn)行平衡。一方面,海量休眠數(shù)據(jù)再利用使得知識(shí)產(chǎn)權(quán)保護(hù)成為一個(gè)迫不及待的問題,因?yàn)閿?shù)據(jù)的二次利用涉及大量知識(shí)產(chǎn)品,而創(chuàng)新主體所生產(chǎn)的本身就是知識(shí)產(chǎn)品,如果缺乏法律意義上的知識(shí)產(chǎn)權(quán)保護(hù),技術(shù)的發(fā)展就會(huì)受到限制,數(shù)字化進(jìn)程就會(huì)遇到障礙;而提高知識(shí)產(chǎn)權(quán)保護(hù)標(biāo)準(zhǔn)又可能束縛科技的發(fā)展。另一方面,數(shù)字化帶來的利益沖突是數(shù)據(jù)創(chuàng)新獲得的利益是否受到知識(shí)產(chǎn)權(quán)的保護(hù),如果應(yīng)受到保護(hù),保護(hù)的范圍有多大,與原專利權(quán)團(tuán)體之間的關(guān)系又該如何處理。因?yàn)樾聦@赡軙?huì)侵害到原專利權(quán)人的權(quán)利,一旦受到保護(hù)之后,原專利權(quán)人的權(quán)利又該受到何種保護(hù),同時(shí)對(duì)于重新組合的產(chǎn)品,法律風(fēng)險(xiǎn)已經(jīng)被規(guī)避,但是對(duì)原專利權(quán)人造成的損失又該如何處理[10]。
(2)彈性。彈性與平衡相輔相成,各種利益需要在更廣泛的空間內(nèi)保持平衡,因此就得充分保持法律法規(guī)的彈性。就數(shù)據(jù)創(chuàng)新主客體而言,彈性的需求是顯而易見的。因?yàn)閰f(xié)調(diào)創(chuàng)新主客體之間知識(shí)產(chǎn)權(quán)的法律法規(guī),而協(xié)調(diào)本身不可能統(tǒng)一,因此妥協(xié)就不可避免,而妥協(xié)本身也就意味著彈性,只有更具彈性的法律法規(guī)才更具有廣泛性。過分原則的法律法規(guī)會(huì)導(dǎo)致規(guī)則范圍內(nèi)所追求的目標(biāo)無法實(shí)現(xiàn)[4]。在大數(shù)據(jù)時(shí)代,彈性這一要求表現(xiàn)得尤為突出,具有恰當(dāng)彈性的知識(shí)產(chǎn)權(quán)法律法規(guī),不僅可以使知識(shí)產(chǎn)權(quán)法能夠更好地適用各種新技術(shù)所帶來的法律問題,又可以使創(chuàng)新主客體之間清晰地理解相關(guān)規(guī)范。
大數(shù)據(jù)時(shí)代,數(shù)據(jù)創(chuàng)新越來越受到密切關(guān)注,且成了新的利益增長(zhǎng)點(diǎn)和競(jìng)爭(zhēng)力,而休眠數(shù)據(jù)的二次利用并重新釋放它的能量,為創(chuàng)新主體注入了新的活力。但如何平衡數(shù)據(jù)創(chuàng)新與知識(shí)產(chǎn)權(quán)保護(hù)的利益點(diǎn)是科學(xué)研究的重要課題。本文初步探析了二者之間的平衡點(diǎn),為以后的研究打下基礎(chǔ),至于如何建立二者沖突與協(xié)調(diào)機(jī)制,有待于進(jìn)一步研究。