摘要:版權制度與作品利用技術的發展密不可分,并隨著版權利用技術的創新而不斷調整和完善。現代版權制度的核心在于對作品的利用所生之利益以市場的方式進行合理分配,以鼓勵作品的創作和傳播,促進經濟發展和文化繁榮。為了應對科技發展所帶來的版權利益分配問題,歷史上對作品利用方式所生之利益進行分配的形式主要有四種,分別是:新增作品類型、新增專有性權利、新增獲酬性權利以及不給予作者分配利益。在上述四種利益分配形式中,又以新增專有性權利為主。當前,人工智能技術飛速發展,人工智能系統廣泛搜集、復制和使用已發表作品并進行處理和加工亦成為行業的普遍實踐。人工智能系統對已發表作品的復制及使用與傳統的復制、使用行為相比存在本質差別,前者屬于新型的作品利用方式。對于人工智能系統使用已發表作品行為的定性,必須立足于這種作品利用方式的特征,從版權制度的目的和經濟、科技發展的實際需求出發,才能作出科學、合理的分析。本文在對歷史上作品利用方式所生之利益如何分配進行系統梳理的基礎上,認為對于人工智能系統使用已發表作品的行為不應再囿于版權侵權與合理使用這種非黑即白、零和博弈的分析和研究路徑。當前的科技進步已經發展到支撐版權權利人、作品使用者、消費者等多方實現更高水平合作共贏的臨界點,因此,至少有必要在作品使用方式上按照貢獻原則對相關當事方的利益進行再平衡,以激勵作品的創作和傳播,促進科技進步和經濟發展。
關鍵詞:作品利用;人工智能;已發表作品;利益分配;貢獻原則
版權制度與作品利用技術的發展密不可分,并隨著版權利用技術的創新而不斷調整和完善。從作品利用方式的歷史演進過程來看,現代版權制度的核心在于對作品的利用所生之利益以市場的方式進行合理分配。當前,隨著人工智能技術的迅猛發展,人工智能系統廣泛搜集、復制和使用已發表作品并進行處理和加工亦成為行業的普遍實踐。關于人工智能系統使用已發表作品的法律性質,當前學術界和實務界多有討論,但是基本上并未脫離版權侵權與合理使用二分法的臼窠。但筆者認為,當代科技進步已經發展到了足以支撐版權權利人、作品使用者、消費者等多方實現更高水平合作共贏的臨界點,從版權史角度梳理作品利用所生之利益的分配形式和原則,對于探討人工智能使用作品等版權問題具有重要鏡鑒作用。本文在進行歷史回顧和梳理的基礎上,提出自己的觀點,認為對于人工智能系統使用已發表作品的行為不應再囿于版權侵權與合理使用這種非黑即白、零和博弈的研究和分析路徑。在作品利用方式方面,對相關當事方的利益進行再平衡,對于激勵作品的創作和傳播、促進科技進步和經濟發展而言,均具有重要意義。
一、技術創新與作品利用所生利益分配的歷史梳理
技術的創新與發展既有可能引起新類型作品的產生,也有可能引起已有類型作品利用方式的產生。無論哪種情況,都會產生新增長的利益,當然,也會致使各利益相關方圍繞新增利益而展開爭奪。在經過一定時期的實踐之后,通常就需要版權法以一定的方式介入,在各方之間合理分配上述新增利益。通過分析技術創新與版權法發展之間的歷史關系脈絡,可以看出,在版權領域圍繞技術創新所帶來的新增利益的分配形式主要有以下幾種。
(一)在版權法中新增版權客體,并使該版權客體創作者擁有完整的版權權利
版權通常被認為是人們對其作品的一種排他性的專有權利。因此,版權的基礎是作品,版權內容圍繞作品而生發。版權法的發展史,首先是技術創新導致的作品種類的成長史。世界上第一部現代意義上的版權法是1709年英國的《安娜女王法令》,當時該法規定的版權保護客體只有“圖書”。之后,隨著技術的發展,特別是電磁技術的發展,人類創作內容的技術手段不斷豐富,版權保護客體也不斷增加。
比如,隨著照相技術的革新和普及,人類利用照相機拍攝的照片越來越多,照片的市場價值越來越大,照片是否屬于版權客體的問題就成為一個富有爭議的法律問題。在1884年美國沙樂尼與伯羅·賈爾斯平版印刷公司(Sarony v.Burrow-Giles Lithographic Co.)案中,攝影師沙樂尼用照相機拍攝了一幅名為“Oscar Wilde No.18”的照片,該印刷公司未經攝影師沙樂尼許可在出版物中使用了該照片,故攝影師向法院起訴被告版權侵權。該案經美國聯邦地區法院和聯邦巡回上訴法院審琿均認為被告構成版權侵權,但被告抗辯稱:照片是原告利用照相機拍攝,照片拍攝僅是一個機械的過程而非藝術創作,原告不能被認為是“作者”,照片也不屬于美國憲法版權條款規定的“著作”,所以照片不應獲得版權法的保護。該案最終上訴到美國最高法院,美國最高法院在判決中認為:美國憲法版權條款中“著作”的概念應作擴展解釋,“著作”應該包括作者所有思想的可見的表達方式,如著述、印刷品、雕刻、蝕刻等形式。同時,法院還認為,雖然普通照片的拍攝過程可能僅是一個簡單的機械程序,但該案情況并非如此。在該案中,拍攝者讓被拍攝者在鏡頭前擺出了特殊的姿勢,選擇并布置了服裝、帷幔和其他各種配飾,還設置了優美的背景輪廓,選擇了光線和陰影,暗示并喚起了所需的表情,通過這些完全由原告進行的布置、安排或表現,可以認為原告創作出了該案中的照片。故此,美國最高法院判決該案中的照片可以構成版權保護客體,拍攝者可以作為作者獲得版權保護。
與照相技術相伴而生的還有錄音技術及之后的攝像技術,這些技術的創新和不斷發展完善,使版權客體的范圍從文字作品、音樂作品擴展到攝影作品和視聽作品,相應地,版權主體也由文字作品、音樂作品作者等擴展到攝影師和電影、電視劇制片人等。20世紀中后期,隨著計算機技術的發展,在經過激烈的爭議之后,計算機軟件也被納入版權保護客體范圍。通過版權客體從文字作品、美術作品、音樂作品向攝影作品、視聽作品、計算機軟件擴展的過程可以看出,每次版權客體的擴張,都是相關當事方重大利益的調整,需要有充分的依據和理由才能做此擴張。
(二)在版權法中新增專有性權利
很多情況下,技術創新不僅會引起版權客體的擴張,也會引起已有版權客體類型利用方式或傳播方式的變革,進而引起版權內容的發展變化。例如,攝影技術、錄音技術、攝像技術的創新與發展,不僅使版權法增加了攝影作品、視聽作品等版權客體;同時也使文字作品有了新的利用方式,如把文字作品拍攝成電影、電視劇。
20世紀初,攝影與攝像技術的成熟以及將文字作品攝制成電影情況不斷增多,助推了各國版權法和版權保護國際公約的變革。《保護文學藝術作品伯爾尼公約》(以下簡稱《伯爾尼公約》)1907年柏林文本,不僅增加了作品的種類,將攝影作品和電影(以及以類似攝制電影的方法獲得的作品)納入其中,還專門為文學藝術作品增加了一項權利,即攝制權。該文本第14條第1款規定,文學、科學或藝術作品的作者享有使用電影方法復制其作品以及以這種方式公開表現其作品的專有權。
隨著無線電廣播技術的發展,作品利用方式又有了新的增加,即通過無線廣播傳播作品并使聽眾欣賞作品。因此,《伯爾尼公約》1928年羅馬文本為文學藝術作品作者增加了廣播權。該文本第11條之二第1款規定:“文學藝術作品的作者享有授權通過廣播向公眾傳播其作品的專有權。”之后,隨著電視廣播技術的發展,無線廣播不僅能夠通過聲音傳播文學藝術作品,還可以通過圖像、聲音等方式傳播作品,因此,《伯爾尼公約》1948年布魯塞爾文本特別規定了“以無線傳播標志、聲音或圖像的方式向公眾傳播作品”也屬于作品作者能夠控制的行為。
20世紀末,互聯網興起,通過互聯網傳播作品成為作品利用的一種主要方式。應對互聯網版權挑戰,國際社會也主要是通過為作者增設專有權利的方式解決此問題。如1996年締結的《世界知識產權組織版權條約》第8條規定:“文學和藝術作品的作者享有授權通過有線或無線方式向公眾傳播其作品的專有權,包括向公眾提供其作品,使公眾可以在自己選定的時間和地點獲取這些作品。”我國在2001年修改《著作權法》時,針對作品的互聯網利用方式,也專門在該法第十條第一款第(十二)項規定了信息網絡傳播權。
(三)在版權法中不新增專有性權利但新增獲酬性權利
在國際版權公約和各國版權法的發展進程中,除了對作品利用方式或傳播方式規定專有權利之外,也可以僅規定作者對作品利用方式的獲酬權。
版權制度的一項重要目af290726516102a6147549c7be31a5dc標是以市場的方式給予作者經濟上的回報。僅給予作者就作品利用方式的獲酬權,雖然看上去可能不如給予專有權那樣更對作者有利,但是也能夠實現版權制度的基本價值目標。同時,這種做法也是作者與作品利用方式使用者之間的利益折中之道,在國際版權條約中多有體現。例如,《伯爾尼公約》1928年羅馬文本為了應對無線電廣播技術的發展,除了在該文本第11條之二第l款為作者規定了廣播權這一專有性的權利之外,同時在該文本第11條之二第2款特別規定:“各締約國國內立法可以對作者的廣播權規定限制性條件,但不得損害作者的精神權利,也不得損害作者獲得公平報酬的權利。”質言之,該條款允許各締約國對作品的廣播行為僅給予作者獲得報酬的權利。
我國《著作權法》第十條第一款第(十一)項雖然規定了廣播權,但同時該法第四十六條第二款又規定:“廣播電臺、電視臺播放他人已發表的作品,可以不經著作權人許可,但應當按照規定支付報酬。”這樣,在我國就已發表的普通作品而言,作者對作品的廣播也是僅享有獲酬權。
另外,我國在2020年修改《著作權法》時為錄音制品制作者新增了廣播獲酬權。該法第四十五條規定:“將錄音制品用于有線或者無線公開傳播,或者通過傳送聲音的技術設備向公眾公開播送的,應當向錄音制作者支付報酬。”由此可見,《著作權法》第四十五條為錄音制品制作者新增的廣播獲酬權,也不是專有性權利,而只是一種獲酬權。同時,值得注意的是,《著作權法》第四十五條雖然為錄音制品制作者新增了廣播獲酬權,但是并未規定該權利的保護期限。電臺、電視臺在多長期限內使用錄音制品需要向制作者支付報酬、在多長期限之外使用錄音制品不需要向制作者支付報酬?由于法律沒有規定錄音制品廣播獲酬權的保護期限,故此,對上述問題尚沒有明確答案,因此筆者建議,在修改《著作權法實施條例》或下次修改《著作權法》時可對錄音制品廣播獲酬權保護期限問題作出明確規定。
(四)不在版權法中新增權利,由相關利益主體在市場中博弈,根據市場規則進行利益分配
20世紀六七十年代,隨著家用錄像機快速進入千家萬戶,電影、電視劇等版權權利人就受到了私人復制行為的直接困擾。如何在版權權利人、家用錄像機廠商和使用者之間分配家用錄像機所帶來的電影、電視劇復制的便利收益,就成為當時一個富有爭議的版權話題。
由于索尼公司生產的家用錄像機的購買者通過電視廣播錄制了環球影視公司和迪士尼公司享有版權的節目,環球影視公司和迪士尼公司作為原告于1976年在美國聯邦地方法院提起了針對被告索尼公司的訴訟,向法院控告索尼公司售賣的錄像機構成版權幫助侵權。在該案的審判中,地方法院作出了有利于被告的判決,然而,上訴法院的判決則主要支持了原告的訴求。當案件進入美國最高法院的審理程序當中時,美國最高法院再次支持了被告的主張,認定被告的行為并沒有構成幫助侵權。
美國最高法院在裁判該案件時主要是從合理使用的角度出發討論該案件,但并沒有從根本上解決技術創新與權利保護之間的矛盾。在該案中,持不同意見的法官布萊克曼曾言:“可以認定被告構成幫助侵權,但是可以通過判給損害賠償金或權利金的方式維持被告的生產與售賣行為,這樣,購買者也可以繼續使用錄像機而不受打攪。”當然,截至目前,世界上大多數國家的版權立法或司法實踐對此類行為也持有與美國最高法院索尼案判決的類似觀點,即認為此類行為不構成侵權,應由相關利益主體根據市場規則對此類行為所產生的利益加以分配。
二、技術創新與作品利用方式新增利益分配的基本原則
對作品產生的經濟利益在各相關主體之間進行合理分配,是版權制度設計的核心問題。通過前述對技術創新與作品利用方式新增利益的分配形式的梳理,可以看出:對于作品產生的經濟利益的分配原則正在從以作者為中心的分配原則向以作者和使用者并重、充分考慮新增利益來源與貢獻的分配原則轉變。
(一)歸屬作者原則
無論技術如何創新、如何先進,作品都是版權產業經濟利益的第一源泉。作品是作者創作的,作者是版權產業經濟利益的原始來源。因此,版權制度讓作者獲取適當比例的作品利用和傳播所產生的經濟利益,不僅公平正當,而且有利于促進新作品的創作,實現文化產業的可持續發展。
如前文所述,在版權制度發展歷史過程中,讓作者獲取作品利用和傳播所產生經濟利益的主要方式是賦予作者對其作品利用的專有性權利。作者根據版權法擁有的對作品某些方式利用的專有性權利,如復制權、發行權、廣播權、攝制權等,至少在理論上獨占了通過這些方式利用作品所獲得經濟利益。
以圖書出版為例,由于作者對其圖書享有復制、發行的專有性權利,因此,如果沒有作者的許可,出版者就無權出版作者的圖書。這樣,面對出版者之間的市場競爭,作者就可以依據其復制發行權通過與出版者的談判,分得出版該圖書所產生的經濟利益。關于作者從出版者處分得出版圖書所獲經濟利益的份額到底是多少,則主要由作品的市場稀缺程度、出版圖書所獲經濟利益的多寡、出版市場的競爭環境、作者與出版者談判地位的對比等因素決定。但是,無論如何,作者由于享有對其圖書復制、發行的專有性權利,作者就可以不授予出版許可為談判籌碼,要求獲得百分之百的圖書出版利益。當然,作者依據其圖書出版的專有性權利獲得百分之百的圖書出版利益,僅僅是一種理論上的可能性,而非實踐中的普遍情況。實踐中,由于作為個人的作者與作為組織的出版者在市場經濟地位上的懸殊差距,出版者通常會獲得圖書出版利益的大部分份額,而作者則只能獲得圖書出版利益的很少的一部分份額。
也正是考慮到作者在市場經濟中的相對“弱小”地位,現代版權制度就作品利用而給予作者的權利絕大部分是專有性權利。如果不給予作者這種專有性權利,作者通常很難在市場經濟中通過作品的利用獲得經濟利益,那么作者所謂的“權利”也就會成為“鏡中花,水中月”。所以,雖然法律賦予作者專有性權利看似將作品利用所產生的經濟權利全部給予了作者,但還應該看到問題的實質:這種專有性權利僅僅給予作者從作品利用中獲得一定經濟利益的可能,在某種程度上體現了版權立法與現實的折中和妥協。
(二)作者與作品傳播者、使用者并重的貢獻原則
版權法賦予作者對作品某種方式利用的專有性權利,就意味著至少在理論上將該種方式利用所產生的經濟利益全部給予了作者。版權法之所以如此安排,除了考慮到作者在市場經濟中的弱勢地位之外,還有一種觀點認為,作品是作品利用所產生經濟利益的原始來源,作者是作品的創作者,從公平正義的角度出發,作者就應當享有作品利用所產生的全部經濟利益。同時,該觀點還進一步認為,如果因為技術創新產生了作品新的利用方式,那么就應當如同物權規則那樣——由物權客體(物)而生發的新的利益應由物的所有人享有,所以,作者也應擁有因技術創新所產生的作品新的利用方式而新增的全部利益。
筆者認為上述觀點值得認真加以分析。首先,需要分析每個要求版權法保護的具體作品與在先作品之間的關系。與發明創造的形成過程類似,作者創作的作品不是憑空而來的,而是“站在巨人的肩膀上”,有意識或無意識地借鑒前人作品的思想和表達的基礎上而創作的。雖然受版權法保護的作品要求“獨創性”,但此處的“獨創性”僅指作品不是復制他人作品而是由作者獨自創作并且要求至少有一定創新性。這樣,作者獨自創作的內容只要與在先的作品存在一定的差異,并且這個差異能夠在一定程度上體現作者的獨立的智力貢獻,那么作者創作的內容就可以作為作品受到版權法的保護。有些作品與在先作品的差異有大有小,但無論哪種情況,只要滿足上述“獨創性”要求,都可以獲得版權法的保護。既然受保護的作品都是或多或少地利用或使用在先作品而創作的,那么從這個角度而言,將作品利用所產生的經濟利益都給予當前作品的作者,也是不公平、不合理的。
其次,需要分析作品與作品利用所產生的利益之間的關系。作品確實是作品利用所產生利益的源頭,但還應看到作品僅是作品利用所產生經濟利益的貢獻來源的其中之一。在實踐中,該經濟利益的產生,除了作品這個必要條件之外,還需要有對該作品的加工、傳播、宣傳、推廣等各項工作的支持,如果沒有這些支持,作品利用所產生的實際經濟利益可能就會微乎其微,甚至就沒有實際的經濟利益。因此,作品利用所產生的經濟利益除了作者的貢獻之外,還有作品利用者的貢獻,甚至在某些特殊情況下,作品利用者對于上述經濟利益產生所做出的貢獻可能會大于作者的貢獻.所以,從這個角度而言,將作品利用所產生的經濟利益全部給予作者,并不公平也不合理。于是,現代版權法越來越重視作者與作品傳播者、使用者之間的利益平衡。特別是在作品傳播者、使用者對作品新利用方式的新增利益的貢獻更大的情形中,國際條約或各國版權法不再僅是一味地授予作者對作品利用的專有權利,而是轉向考慮僅給予作者對作品某些利用方式的獲酬權;在某些更特殊的情況下,甚至不給予作者獲得相關經濟利益的權利。
上述立法趨勢體現了圍繞作品利用所產生經濟利益進行分配的新原則,即貢獻原則。貢獻原則就是根據自然法和財產法原理,誰對作品的利用所產生的經濟利益有貢獻,誰就應該獲得利益。各貢獻者獲得經濟利益的份額,應與各貢獻者對作品利用所產生經濟利益的貢獻程度相當。2020年,中共中央、國務院發布的《中共中央國務院關于新時代加快完善社會主義市場經濟體制的意見》明確提出要“健全勞動、資本、土地、知識、技術、管理、數據等生產要素由市場評價貢獻、按貢獻決定報酬的機制。”在分配作品利用方式所新增的利益時,認真權衡作者的創造性勞動、作品使用者的勞動和資本、技術、管理等各方的貢獻,并以此為基礎對版權制度進行完善,這對優化版權經濟資源配置、暢通版權要素流動、促進我國版權經濟高質量發展,均具有重要意義。
三、使用費收取技術對版權制度設計的影響
作者創作完成作品后,對該作品進行各種方式的利用,到底能獲得多少經濟價值?在這些經濟價值中,作者貢獻的份額是多少?各方作品利用者貢獻的份額分別是多少?無論是作者、傳播者還是作品的利用者、消費者,甚至是中立的第三方裁決機構,通常都難以對上述問題作出相對合理的回答。也就是說,作品利用所能產生的經濟價值難以評估。因此,雖然按照貢獻原則對作品利用所產生的經濟利益在作者和利用者之間進行分配會更加公平合理,但是,在實踐中大多數情況只能通過版權制度給予作者專有性的權利,進而使作者可以憑借其專有權利與作品利用者進行談判,從而使作者獲得其認可的經濟回報。
如果作品利用者對于作品特定方式的利用所獲得的經濟利益可以進行比較準確的計算,而且社會對于作者在該作品特定方式的利用所產生經濟利益的貢獻份額或比例也有比較一致的觀點,那么作者對該作品特定方式的利用所應收取的許可使用費就是該作品特定方式利用所獲得的經濟利益與作者貢獻比例之乘積。在實踐中,上述數值(作品特定方式的利用所獲得的經濟利益以及作者的貢獻比例)有時可以比較準確或比較合理地進行計算或確定;但在很多情況下是難以進行比較準確計算或合理確定的。
如果上述數值可以進行比較準確地計算或比較合理地確定,那么對于絕大多數作者而言,無論是給予其專有性權利,還是僅給予其獲酬性權利,并沒有本質區別。而且如果給予作者的僅是獲酬性權利,作品的使用者不必與作者談判就可以使用該作品;在使用作品后,使用者按照規定的比例從其獲得的經濟利益中分配給作者即可。另外,考慮到作品獲酬性權利可以使作品使用者節省搜索成本和交易談判成本,進而可以大幅降低作品使用和消費的邊際成本,從而進一步擴大作品使用的范圍和頻率;而作者也可以在作品的廣泛和高頻使用中獲得更多的利益分成。這樣就形成了一個圍繞作品利用的各方共贏的良性循環。
當然,實現上述良性循環的前提是必須有可信的作品使用收益采集、計算技術或者版權使用費收取技術。否則,版權使用者應該按照什么基準、什么比例向作者支付多少使用費,作者可以收到多少使用費,這些問題就都不會有客觀的答案。在這種情況下,如果作者僅有獲酬權而沒有專有權利作后盾,對于絕大多數處于相對弱小經濟地位的作者而言,他們就會很難僅根據法律上的獲酬權通過和處于經濟強勢地位的作品利用者進行談判,并通過談判把法律上的獲酬權轉變為真實的經濟利益。這也是在作品使用收益采集計算技術或者版權使用費收取技術成熟、可信之前,各國版權法和版權國際公約仍將專有權作為版權主體內容正當性基礎的主要原因。
隨著信息網絡技術特別是人工智能技術的快速發展,作品的數字化利用越來越普遍,作品利用情況、收益情況的發現和統計的全面性、便捷性、準確性越來越高,發現和統計的成本越來越低,當代版權制度就有必要隨著技術創新的發展而作出理性的轉變。其實,這種轉變的趨勢不僅在版權領域有所體現,而且在其他知識產權領域也已有所昭示。如在當前專利領域影響最大的紛爭就是手機標準必要專利問題,而手機標準必要專利問題的訴訟爭議核心就是專利使用費率標準。當前,標準必要專利糾紛主要內容已經不再是許可使用或不許可使用問題,因為一部手機上使用的標準必要專利就可能有幾千、幾萬、幾十萬個,所以再討論是否許可或不許可使用這些專利的問題對于大多數案件而言已經沒有實際意義。同時,由于各手機廠商的出貨量、售價都是比較透明的,所以標準必要專利使用費率的標準問題就成為核心問題。質言之,當前手機標準必要專利權在實質上已經與獲酬權沒有顯著區別了。同樣,在版權領域,特別對于作品利用方式所產生的新增利益的分配而言,在針對作品此種利用方式設計版權相關權利時,就應充分考慮到版權使用費收取技術的發展狀況和未來可能,直接根據貢獻原則在作者與作品利用者之間對新增利益進行分配。探索人工智能使用已發表作品所產生的相關問題,就可遵循以上的原則。下文將對此進行探討。
四、人工智能系統使用已發表作品的行為類型化梳理
先來看人工智能系統對已發表作品的使用情形。人工智能系統在開發、運行和商業服務過程中以各種方式使用已發表的作品,既是一個客觀事實,也是人工智能產業發展的必要前提。在人工智能使用已發表作品過程中,有相當一部分人工智能使用行為與傳統的作品復制、使用行為具有明顯而本質的區別,屬于新型的作品利用方式;當然,也有一部分人工智能使用行為與傳統的作品復制、使用行為沒有明顯的差異,仍可沿用傳統的分析路徑對其進行版權分析。因此,有必要對人工智能系統使用已發表作品的行為進行類型化梳理,并根據前述作品利用所生之利益的分配原則對人工智能系統的作品利用方式進行版權分析。目前,人工智能系統使用已發表作品的方式主要有以下幾種。
(一)將已發表的作品作為機械學習的素材加以使用
當代人工智能系統的核心及本質在于其具有機械學習能力。人工智能系統主要是通過模擬人類大腦的神經細胞和神經突觸等神經網絡結構而設計的具有機械學習能力的軟件系統。在人工智能系統設計完成并進行初始設置后,人們需要對其進行機械學習訓練。機械學習訓練的步驟主要有三:其一,搜集、整理人類認為正確的各種輸入信息和對應結果的數據庫;其二,輸入上述某條信息并驅動人工智能系統輸出結果;其三,將此輸出結果與人們認為正確的對應結果進行對比,如果二者之間差異大于設定的閾值,則由人工智能系統根據一定規則對人工智能系統中的參數或神經網絡結構進行微調,并重復執行第二步工作,如果二者之間差異小于設定閾值,就認為對該條信息學習完畢,則在數據庫中調取下一條信息,繼續從第二步開始進行學習,直至數據庫中的信息都學習完畢。
人工智能系統在進行大量數據的機械學習之后,人類再向人工智能系統輸入信息并驅動人工智能系統輸出的結果就會越來越符合人類的預期。由此可見,為了使人工智能系統更“好用”,就必須搜集、整理盡可能多的經標注的結構化訓練數據。當前,各個人工智能系統使用的機械學習訓練數據絕大部分來自于互聯網已發表的作品或數據;當然,也有相當一部分數據是人工智能系統公司搜集并掃描紙質作品而形成的數據。無論是線上數據,還是線下紙質材料中的數據,有相當一部分是已發表的且尚在版權保護期之內的作品。在人工智能系統將已發表的作品作為機械學習的素材加以使用的過程中,人工智能系統對作品的使用主要涉及三類具體的方式:一是通過網絡下載或紙件掃描等方式對作品進行復制,以備機械學習;二是對作品電子復制件進行標注,以適于機械學習;三是將標注好的資料輸入機械學習系統進行機械學習。
(二)人工智能系統根據用戶的指令生成并輸出新的內容
人工智能系統在進行初始的機械學習并通過一定的測試之后,即可投入商業或非商業性的使用。用戶在向人工智能系統輸入指令之后,人工智能系統即可根據之前已經學習并調整后的參數向用戶輸出相應的內容。根據人工智能系統輸出的內容與已發表作品之間關系,又可以分為四種情況。
第一種情況是人工智能系統輸出的內容與已發表的作品相同或實質相似。雖然當前的人工智能系統通常會采取一定的措施,避免輸出內容與他人已發表作品相同或實質相似,但由于作品版權歸屬的復雜性和技術能力、技術實現的可行性等方面的限制,在當前,人工智能系統根據用戶指令輸出的內容仍然存在與他人已發表作品相同或實質相似的可能性。根據廣州互聯網法院迪迦奧特曼案判決,在該案中原告是“迪迦奧特曼”形象美術作品的版權獨占被許可人,被告是一家人工智能系統服務提供者,向用戶提供人工智能圖片生成服務。原告在向被告的人工智能系統輸入“生成奧特曼”的提示詞后,被告系統即輸出與“奧特曼”美術作品構成實質相似的圖片。在被告收到原告起訴的案件材料后,被告采取了技術措施以避免發生侵權問題。在該案庭審過程中,工作人員在被告人工智能系統中輸入保護“奧特曼”的提示詞,被告系統就自動彈出“您發送的信息包含不合規的內容”,并且也不會輸出圖片;但是,如果向被告系統輸入“迪迦”,那么被告系統輸出的圖片仍然與原告奧特曼作品高度相似。由此可見,由于各種條件的限制,確實很難完全避免人工智能系統輸出內容與已發表作品相同或實質相似現象的發生。
第二種情況是人工智能系統輸出的內容與已發表的作品雖然不相同,但輸出內容含有已發表作品的若干片段。人類作者創作作品使用已發表作品的若干片段,可以分為兩種情形。一是下意識地、不自覺地l9d11VFH0BfQlfM/1pQnpFQ8yaJat40KEDw3YTx+vq8=使用。人類作者通過學習已發表作品,有可能把該作品的某些內容完全內化到其大腦或思維體系之中,并且,隨著時光的流逝,作者有可能會忘卻上述內容的原始來源,這樣作者在進行獨立創作時,就可能把上述內容信手拈來,作為作者自己的內容來使用。二是有意識、自覺地使用。人類作者在完成作品時,為了介紹、敘述、評論、說明或論證等目的,經常會有意識地、自覺地使用他人已發表作品的片段,甚至在某些特殊情況下,會使用到一些短小作品(如詩歌)的全部內容。既然當代人工智能系統主要是在模擬人類大腦神經網絡的工作機制,那么人工智能系統輸出內容與被學習的已發表作品的片段之間的關系,從理論上而言,似乎也應具有人類作者創造作品與被人類作者學習作品的片段之間的關系;并且在事實上,也確實有很多人工智能系統輸出內容包含著被學習的已發表作品的片段,或者在人工智能系統輸出內容中可以看到被學習的已發表作品片段的相似內容。當然,由于人工智能系統沒有有意識、無意識或自覺、不自覺之說,人工智能系統輸出內容包含已發表作品片段的問題,是人工智能系統機械學習的客觀結果,至少不能像對待人類作者那樣從主觀上對上述問題進行評價。
第三種情況是人工智能系統輸出的內容與已發表作品雖然不相同,但輸出內容與已發表作品的風格存在相似之處。從人工智能技術的科學原理和歷史發展來看,當前人工智能系統最擅長的仍然是模式識別和模仿輸出。人工智能系統通過大量的、有針對性的機械學習,之后就可以輸出與人類行為或成果高度相似的內容。這種相似,不僅體現為表達內容的相似,也可以體現為表達模式、表達風格的相似。由于人們對人工智能系統輸出內容版權保護問題的關注度的提升,當前主流的人工智能系統公司已經在采取措施避免輸出與已發表作品構成表達實質相似的內容。根據版權法原理,版權保護僅延及到思想的表達,而不保護思想,因此,人工智能系統公司通常并不會限制生成或輸出具有與已發表作品相似表達風格的內容。
第四種情況是人工智能系統輸出的內容與已發表作品既不相同,也不能從輸出內容之巾看到任何已發表作品的痕跡。與人類創作的作品類似,人工智能系統某些輸出的內容在表達上確實可能看不出任何與已發表作品片段相同或相似的痕跡。人類作者通過學習已有作品,可以創作出與之前被學習作品的表達完全不同的作品,并不意味著人類作者之前所學習的作品對其創作沒有任何價值。同樣,人工智能系統輸出內容與之前機械學習的已發表作品片段不相同、不相似,也并不代表被機械學習的已發表作品對于人工智能系統的上述輸出內容沒有任何貢獻。
(三)將已發表作品用于搜索服務或者其他典型產品化服務,并輸出相應的服務成果
由于當前人工智能機械學習能力的大幅提升,人工智能系統利用已發表作品面向市場開發了很多典型的產品化服務。這些典型的產品化服務主要包括自動摘要服務、搜索服務、論文查重服務、科技查新服務、AIGC檢測服務、智能輔助寫作服務,等等。
自動摘要服務是通過人工智能系統對已發表作品進行分析,提煉出作品的關鍵信息并形成簡明摘要,以使用戶能夠快速了解和把握作品的主要內容。自動摘要服務涉及人工智能系統對已發表作品全文的分析,明顯是對作品的一種新興利用方式。
搜索服務對于快速查詢和定位相關信息及作品至關重要。搜索服務技術的底層邏輯是關鍵詞檢索,如何為被搜索的海量作品、電子資料標注準確的關鍵詞以及如何為用戶輸入的搜索需求設計關鍵詞,均是向用戶提供符合其需求的搜索結果的關鍵。當前主流的大語言模型人工智能技術也正是搜索公司技術專家為了解決上述問題、提升搜索效率而開創的。目前的智能搜索服務或推薦服務,有相當一部分涉及對被搜索作品的全文分析使用。
論文查重服務是人工智能系統將被查重的論文與其數據庫里已發表作品進行比對,從而查找出被查重論文中與已發表作品相同或相似的部分,以用于相關學術問題或法律問題的判斷。雖然在人工智能技術勃興之前,市場就已經有論文查重服務,但由于技術的限制,之前論文查重服務的準確性、可用性并不高。廣泛引入人工智能技術后,論文查重的質量有了很大改進。雖然之前的論文查重服務也會用到已發表的論文全文,但由于其市場價值較小,故之前論文查重服務使用已發表作品的版權問題并未引起多少關注或討論;而隨著人工智能技術的引用,當前論文查重服務創造的市場價值越來越大,論文查重服務使用已發表作品的版權問題已經越來越引起作品作者的重視。與論文查重服務類似的還有科技查新服務、AIGC檢測服務等。
智能輔助寫作服務是指人們在創作過程中由人工智能系統根據作者的指令在寫作大綱、文章內容、案例資料、文字風格與潤色等方面提供咨詢服務,以幫助作者完成作品的創作。智能輔助寫作服務既可以涉及內容的全新創作,也可以涉及對已有內容的改編或再創作。無論是哪一種智能輔助寫作服務,都需要以人工智能對大量的已發表作品的機械學習為基礎。
五、人工智能使用已發表作品版權規范完善路徑
上述梳理表明,人工智能系統使用已發表作品的行為已經深入到多個領域、多個環節。其中的相關版權問題特別是收益按什么原則分配,就成為一個繞不開的現實話題。筆者認為,面對人工智能技術迅猛發展的新形勢,立法和司法機關在完善版權立法或適用版權法解決人工智能系統使用已發表作品的爭端時,應充分考慮人工智能系統使用已發表作品的特點,關注版權使用費收取技術的發展趨勢和可能,探索保護作者合理利益、促進人工智能技術和版權產業發展的版權規范完善路徑。具體而言,主要有以下幾點。
(一)宜做增量改革,已有的版權利益平衡不宜輕易變動,要重點圍繞人工智能等新興技術帶來的作品利用方式所產生的經濟利益進行分配和規范
根據前述分析可以看出,在人工智能系統使用已發表作品的各種方式中,有些屬于版權法已有規范的使用方式,有些則屬于版權法尚未規范的使用方式。
對于版權法已有明確規范的使用方式,如人工智能系統生成內容與已發表作品相同或實質相似問題,由于立法機關對此類使用方式所產生利益的分配問題在之前已經進行反復權衡,作者、使用者和消費者已經達成共識,因此,在沒有特別問題出現的情況下,就沒有必要對相關規則進行調整。
對于版權法尚未進行明確規范的作品使用方式,按照版權法定的基本原則,在沒有明確法律規范的情況下,就這些方式使用作品的行為,原則上不應向作者分配經濟利益。但是,如果上述方式使用作品的行為確實能夠產生較高的經濟利益,并且可以明確確定已發表的作品對于這些經濟利益的產生確實作出重要貢獻,那么就應在立法層面根據作品對上述經濟利益的貢獻程度,對版權權利進行適當擴展。與此同時,在立法之前,司法機關也可根據版權法的原則,參考廣播電視技術、互聯網技術發展初期的相關實踐,考慮給予作者就作品方式的利用以適當的經濟回報。
(二)宜跳出專有權利與合理使用二分法的臼窠,考慮直接按照貢獻原則對利用方式所新增經濟利益在各相關當事人之間進行合理分配
當前,大多數人工智能使用已發表作品版權糾紛的解決方案仍然是秉持專有權利與合理使用二分法的思考路徑。在21世紀初美國作家協會起訴谷歌公司一案(Authors Guild v.Google,Inc.)中,谷歌公司對包括原告作家在內的大量圖書進行掃描并制作圖書索引供其搜索引擎搜索使用。谷歌搜索引擎用戶輸入檢索詞后,搜索引擎就會給出包括該檢索詞的圖書列表,以及該檢索詞在每本書中出現的次數;用戶還可以看到包含該檢索詞或術語的圖書片段,當然該片段只有三行;谷歌公司通過技術手段防止用戶通過變化檢索詞或多次搜索的方式看到一部圖書關于該檢索詞的三個以上不同的片段。原告認為被告的行為侵犯了其圖書的版權,被告則主張合理使用,不構成版權侵權。最終,美國法院裁判支持了被告合理使用的主張。
美國作家協會起訴谷歌公司案雖然并非人工智能系統使用已發表作品的案件,但是二者之間有很大相似性。因此,當前人工智能系統開始大規模地通過機械學習方式使用已發表作品之后,作品版權人與人工智能系統公司在版權問題上的博弈也基本上采取侵權指控與合理使用抗辯路徑。例如,在美國作家協會起訴OpenAI案中,原告主張被告未經許可使用了其享有版權的作品進行機械學習訓練侵犯了其版權;而被告則主要利用合理使用等制度進行抗辯。
侵權指控與合理使用抗辯路徑雖然是解決傳統版權糾紛的常規做法,但是在新的形勢下,可能越來越不適宜作品機械學習、人工智能新產品服務等人工智能對作品的利用方式。例如,美國作家協會在其發表的起訴OpenAI新聞稿中就表示:作家的作品應該得到公平的報酬;原告并不反對開發生成式人工智能,但被告應支付合理的許可費來使用受版權保護的作品。由此可見,即使作家協會作為作者的代表,也并非想禁止人工智能系統公司使用已發表作品,而僅是要求獲得“公平合理”的報酬。
進一步看,事實上用版權侵權與合理使用二分法的思路來解決人工智能使用已發表作品的糾紛,已經越來越困難。人工智能系統在機械學習過程中使用已發表作品或者人工智能系統在提供搜索服務、論文查重、科技查新等服務過程中使用已發表作品,所使用作品的數量不是一部或幾部作品,而是幾百萬、幾千萬甚至數以億計的海量作品。如果版權法對作品的此類使用賦予作者專有性權利,人工智能系統公司如要以上述方式使用這些海量作品,就必須事先一一獲得版權人的授權。這種制度設計是否可行?顯然是不可行的。因為無論是從成本上來說,還是從現實可行性來說,讓人工智能系統公司在機械學習之前就一一獲得海量版權人的授權,都是不能做到的;如果法律真的這么要求,那么顯然會嚴重阻礙作為當代經濟發展重要引擎的人工智能產業的發展。
與此同時,很多人工智能系統公司通過使用已發表作品確實獲得了巨大經濟利益,這些作品的使用與上述經濟利益之間確實存在直接的聯系,并且人工智能系統公司以使用已發表作品為基礎提供的服務也確實在一定程度上擠占了人類作者的創作空間和相關市場利益。綜合考慮上述各種因素,如果將人工智能使用已發表作品視為合理使用,這樣作者就無權從上述人工智能系統使用作品而產生的利益中獲得一定的份額;這樣的結果顯然是不公平的,也不利于作者的可持續創作。
綜合以上分析可以看出,對于人工智能需要大規模使用已發表作品進行機械學習并以此為基礎提供服務的行為,既不應給予作者對此類作品使用行為的專有控制性權利,也不應不給予作者任何經濟回報。對于此類使用,應根據具體情況給予作者獲酬性的權利,即作者應有權從此類使用中獲得一定的利益分成,但無權禁止此類使用。
(三)宜建立有利于保護作者和促進版權產業、人工智能技術協同發展的作者獲酬路徑和基礎設施,實現文藝創作、技術創新、經濟社會的綜合可持續發展
版權法賦予作者獲酬性質的權利,僅僅是使作者有了從人工智能使用已發表作品過程中獲得一定經濟利益的可能性,但作者是否可以真正地從中獲得經濟利益,還需要取決于其他現實條件。由于人工智能需要使用數量龐大的海量作品,人工智能使用作品的情況對于每位作者而言并不透明,這樣,作者真正實現其獲酬權就必須解決兩個現實問題:一是特定人工智能系統在一定時期內應向作者群體支付的使用費總額應是多少;二是每位作者應從上述使用費總額中獲得的個人利益是多少。
關于上述第一個問題,可以從以下兩個角度考慮。第一,應只對市場上的大型人工智能系統收取作品使用費。當前的人工智能系統千差萬別,對所有的人工智能系統都收取作品使用費,既不現實,也無必要。為了促進人工智能技術的創新和人工智能產業的發展,同時考慮到此種人工智能作品使用費是作者傳統版權權利的增量,所以,應該只對大型的具有較高營業收入(比如年營業收入1億元人民幣及以上)的人工智能系統收取版權使用費;而營業收人在此之下的人工智能系統則應豁免支付版權使用費。第二,人工智能版權使用費應按照作品使用方式的不同類型分別按照不同的提成比例計算。人工智能使用已發表作品的方式的不同,作品對該使用方式所生經濟利益的貢獻份額也不同。例如,作品對于機械學習所產生經濟利益的貢獻份額顯然會遠小于作品對于論文查重服務、科技查新服務所產生經濟利益的貢獻份額。因此,按照貢獻原則,作品不同使用方式的使用費提成比例就應有所不同。例如,人工智能系統機械學習使用費提成比例可以考慮以該系統年營業收入為基礎,在十萬分之一到萬分之一之間確定;而論文查重服務或科技查新服務的提成比例則可以考慮以該服務年營業收入為基礎,在百分之一到百分之十之間確定。
關于上述第二個問題,即每位作者個人應獲得利益份額計算問題,應至少考慮兩個方面的因素。第一,該作者作品的類型、篇幅、時長等。為了確定每位作者人工智能使用費的具體份額,可以將作品分為文字作品、音樂作品、美術作品和視聽作品等幾類。文字作品、視聽作品又可以根據其篇幅和時長分為若干檔。第二,作品被人工智能使用的性質。在人工智能使用已發表作品的各種方式中,有的屬于對作品均等性的使用。比如機械學習對作品的使用,這種類型的使用除了與作品的篇幅、時長等有一定的關系之外,與作品的其他要素基本上沒有特別關聯,即被使用的各個作品對機械學習的貢獻基本上是平等的。有的則屬于對作品非均等性地使用。比如論文查重服務,人工智能系統除了要將論文與其數據庫巾的全部作品進行對比之外,還要摘出被論文使用的已發表作品片段;而被論文使用的已發表作品對于論文查重服務的貢獻,顯然要遠遠大于那些沒有被論文使用的,但被人工智能系統檢索的作品。因此,論文查重服務的版權使用費就應分為兩部分:一部分給予其數據庫中仝部作品的作者;另一部分給予被論文使用的那些已發表作品的作者。
由上述人工智能版權使用費的實現路徑分析可以看出,計算、收取、分配版權使用費絕不是單個作者或者某個企業能夠單獨完成的。除了要有科學合理的制度規則之外,還特別需要建立相應的基礎設施。該基礎設施應全面搜集、登記和存儲作者和作品的有關信息,并可在作者同意提供的情況下存儲作品的全部數據;該基礎設施的主要目的在于:便利人工智能對已發表作品的使用,監測和統計人工智能對已發表作品的使用情況,甚至計算、收取和分配人工智能版權使用費。建立該基礎設施需要有作者、版權登記機構、集體管理組織、人工智能公司甚至版權主管部門的共同參與。只有作者、人工智能系統公司、相關使用者和消費者與版權主管部門等各方面多向善意奔赴,才能在人工智能使用已發表作品問題上實現既保護作者合理利益,又促進人工智能創新和經濟社會發展的多方合作共贏。
(作者系中國科學院大學知識產權學院副教授,北京知識產權法研究會副會長)