999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

生成式人工智能機器學習中的著作權風險及其化解路徑

2024-01-12 04:20:12詹愛嵐田一農
電子知識產權 2023年11期
關鍵詞:人工智能

文 / 詹愛嵐 田一農

近年來,人工智能,尤其是生成式人工智能(Generative Artificial Intelligence,下文簡稱“生成式AI”)的快速發展,給文學、繪畫、音樂、計算機編程等領域帶來了巨大的沖擊。生成式AI 技術更是入選了世界經濟論壇(World Economic Forum, WEF)“2023 十大新興技術”,成為未來三到五年內對世界影響最大、推動第四次產業革命的新興核心技術之一。1. World Economic Forum: Top 10 Emerging Technologies of 2023, at https://www3.weforum.org/docs/WEF_Top_10_Emerging_Technologies_of_2023.pdf, last visited on September 4,2023.與此同時,當“創作”開始變得普羅大眾,這種智能型“創作”給傳統著作權理論帶來的挑戰也日益凸顯。完善生成式AI 的監管和法律規制已迫在眉睫,如何平衡好產業發展與權利保護問題,已成為當下的重點。作為一種基于機器學習的人工智能技術,生成式AI 通過大規模數據集的學習訓練生成新的內容。因此,生成式AI 的“創作”,“前端”涉及機器學習所使用訓練素材(即文字、音樂、繪畫等作品)的著作權保護問題,“后端”則涉及“創作”成果(即人工智能生成物)的可著作權問題。隨著“ChatGPT”和“文心一言”等國內外生成式AI 產品的相繼面世和快速迭代,AI 大模型已然成為各國競爭的戰略“高地”。然而,當產業界在為生成式AI 的“超車”發展積極添柴加火的時候,客觀認識和分析機器學習所涉訓練素材中面臨的著作權風險,努力尋求應對和化解的路徑同樣具有重要的理論價值與現實意義。

一、風險源起:生成式AI 中機器學習的著作侵權風險高

生成式AI 的工作原理是通過大量數據學習總結出規律與結構,進而通過固定模型與操作者指令生成新的內容。在能夠產生成果之前,從大量的數據運算中總結規律的過程便是機器學習環節。“機器學習之父”Arthur Samuel 將機器學習定義為“在不直接針對問題進行編程的情況下,賦予計算機學習能力的研究領域(Field of Study That Gives Computers the Ability to Learn Without Being Explicitly Programmed)”。2. See Samuel, Arthur L:Some Studies in Machine Learning Using the Game of Checkers, IBM Journal of Research and Development, Vol.3:210, pp.210-229(1959).因此,作為人工智能科學的一個分支,機器學習利用數據和算法,通過模型訓練學習、模仿人類學習的方式來逐步提高自身決策的準確性。3. 參見汪榮貴、楊娟、薛麗霞:《機器學習及其應用》,機械工業出版社2019年版,第2 頁。機器學習的過程簡單分為三個階段:(1)數據收集輸入階段,收錄其他作品數據并編輯成自身的數據庫;(2)機器學習階段,選擇最優算法搭建模型并進行模型質量評估,以便判斷是否固定該模型;(3)輸出階段,最終模型會根據使用者輸入的數據及指令產出人工智能生成物。具體過程如圖1 所示。

圖1 機器學習流程圖

數據的獲取是機器學習的開端,人工智能通過大量分析獲取數據的過程被稱為機器閱讀。4. 參見焦和平:《人工智能創作中數據獲取與利用的著作權風險及化解路徑》,載《當代法學》2022年第4 期,第128-140 頁。此階段人工智能開發者可以通過開源數據庫、他人合法授權、使用進入公共領域的作品等方式避免著作權糾紛,本文便不再贅述。而目前以下幾種能獲取受著作權保護的作品方式因未經原作者許可,極易侵犯他人著作權:(1)通過網絡爬蟲協議爬取;(2)網絡平臺企業通過服務協議條款取得用戶的授權許可;(3)未經授權將他人非數據作品數字化;(4)未經許可直接扒竊數據庫或個人數據。

數據收集完成進入學習階段后,人工智能會逐一分析素材的所有元素,包括類型、布局結構、內在的思想情感、作者的表達風格等。就如同在人腦中構思反饋的過程延伸到電腦之中。電腦提取這些作品中的用詞、排版、結構、主題等分為不同大類小類并標注關鍵詞,再不斷完善循環這一過程,做到自我更新、迭代升級。而在這一過程中又會對他人享有著作權的作品進行無數次的拆解、排列、重新組合,這涉及了對作品的改編、翻譯、匯編等行為,要視具體情況分析是否侵權。如果未經著作權人許可,則一定會對其改編權、匯編權等合法權利產生侵犯。

綜上可見,沒有獲得著作權人授權的版權素材,無論是在數據錄入階段還是后續的機器學習階段,都具有極高的侵權風險。實踐中,美國已經發生了多起針對生成式AI 在機器學習中涉嫌侵犯訓練素材著作權的糾紛,包括:2023年1—2月,針對AI 圖像生成平臺Stable Diffusion;Midjourney和DreamUp的著作權集體訴訟、5. Andersenv. Stability AI Ltd. et al, 3:23-CV-00201;Getty Images (US), Inc. v. Stability AI, Inc.1:23-cv-00135..2023年6月,針對AI 文本生成平臺ChatGPT 的多起著作權集體訴訟。6. Tremblay, P.& Awad, Mv. OpenAI, Inc., 3:23-cv-03223.

二、侵權分析:機器學習中的具體著作權風險

人工智能的著作權風險貫穿了從機器學習階段到作品產出階段的始終,在這一過程中涉及了對素材作品復制、改編等權利的妨害,即便該數據是合法獲取的。7. 參見劉友華、魏遠山:《機器學習的著作權侵權問題及其解決》,載《華東政法大學學報》2019年第2 期,第73-75 頁。

(一)機器學習在數據收集過程中對作品復制權的侵犯

機器學習對于他人作品復制權的侵犯可以分為兩個階段,首先是在數據收集階段的侵權,也就是機器閱讀環節的復制行為,這一環節往往牽涉到大量收錄他人未授權的作品。根據《中華人民共和國著作權法》(以下簡稱《著作權法》)第十條第五款規定,8. 《中華人民共和國著作權法》第十條第五款:復制權,即以印刷、復印、拓印、錄音、錄像、翻錄、翻拍、數字化等方式將作品制作一份或者多份的權利。已明確將數據爬取、文本作品轉化等收集素材的方式都列入《著作權法》的規制。一方面,人工智能在建立自己的數據庫時需要對他人作品的數據進行復制,如果這些輸入的數據中涵蓋了原作者未授權的作品,那么該復制行為就侵犯了受著作權法保護的原作品的復制權。另一方面,除去對原作品素材的直接復制之外,人工智能開發者還會將紙質版作品的內容掃描轉化成電子介質儲存到數據庫當中,且未經過其作品的著作權人許可或支付報酬。以上行為都已經構成了侵犯復制權的組成要件,侵犯了原作者的復制權。

其次,對于機器學習環節的復制,即作品產出前的行為是否構成侵權。學理上主流觀點認為機器學習階段的模型建立是伴隨著服務器內的數據轉碼產生的,是一種臨時的、不具有侵害性的客觀行為。并不是所有的復制行為都會侵犯復制權,必須結合復制后的行動來判斷。如果在復制后產生了出售、展覽等變現行為獲取收益,才屬于《著作權法》所明令禁止的復制行為。立法上,我國在起草《信息網絡傳播權保護條例》時,臨時復制的法律性質也是焦點問題之一,最終對該行為的侵權定性也并未出現在正式官方文本中。9. 參見萬勇:《人工智能時代著作權法合理使用制度的困境與出路》,載《社會科學輯刊》2021年第5 期,第93-102 頁。其他國家,如美國的Cablevision 公司侵權案中,法院也認為被告對于原告影像數據的復制在存儲器內停留的時間只有十秒,且該時間也符合當時此項技術運行的合理時間,根據合理使用四要素法判斷不構成對他人著作權的非法妨害、不干涉他人著作權的行使。綜上,臨時復制不構成對復制權的侵害,故本文所提到的機器學習的復制權侵權行為僅僅針對生成式人工智能在數據收集及數據庫建立時的復制行為。

(二)機器學習在數據處理過程中對作品改編權的侵犯

改編權即改變作品,創作出具有獨創性的新作品的權利。改編權的構成要件有兩個:其一,行為上利用了原作品的獨創性表達;其二,結果上創作出具有獨創性的新作品。就生成式AI 而言,判斷機器學習是否侵犯原作者改編權的關鍵,是考察其對原作品表達的“利用程度”。即如果最終生成物保有原作品的獨創性表達較高時,便構成對原作品的改編。

改編權的侵權分析,需從機器學習的方式入手。根據機器學習素材的錄入、抓取是否具有針對性、唯一性,可將機器學習分為一般機器學習和特殊機器學習。10. 參見李安:《機器學習作品的著作權法分析——非作品性使用、合理使用與侵權使用》,載《電子知識產權》2020第6 期,第60-70 頁。

一般機器學習,是指在已收集的龐雜的信息庫中進行分析挑選,根據使用者的指令對照數據進行生成,不會是在某個藍本上直接完成修改。其產出作品的風格、外觀也是五花八門,并非使用者能嚴格控制的。這類作品往往都帶有很強的創新性,即使屬于改編范疇也缺乏比對目標,所以一般的機器學習對改編權幾乎沒有影響,除非生成物中保留了某些作品的基本獨創表達。

特殊機器學習,是指使用特定素材庫進行的訓練,如加州大學教授戴維·柯普設計的EMI(Experiments in Musical Intelligence),專門投喂巴赫的音樂作品,模仿巴赫的風格創作。該程序創作出的作品在音樂節上使得80%以上的聽眾認為這就是巴赫的作品。但由于巴赫的音樂作品早已進入公共領域,不會引發著作權糾紛。不過如果巴赫還在世的話,那么根據該程序所模仿的巴赫獨創性風格所占其生成物的比重以及對原有市場可能產生的替代性來判斷,勢必會侵犯原作者的改編權。作品的獨創性表達是作者思想的延伸,特殊的機器學習本質上就是在不碰觸獨創性表達的同時最大程度去接近原作者的思想范疇,并用自己的方式進行表達。但原作者的思想和表達往往是緊密相連的,并且特殊機器學習由于其素材的限定也決定了必然要受到原作者表達的約束。因此此類生成物基本上都會因與原作品過度相似而產生替代性,存在侵犯原作者改編權的風險。

三、理論探源:生成式AI 中的“非表達性使用”與“轉換性使用”

各國為緩和人工智能發展與著作權保護之間的矛盾,試圖突破原有的著作權合理使用框架,為人工智能使用他人版權作品的免責性尋找新的法定依據。其中既有法律上的調整,如歐盟的“文本與數據挖掘例外”的明文規定,11. 歐洲議會和歐洲理事會2019年4月17日關于數字單一市場版權和相關權的指令,歐盟官方網站https://eur-lex.europa.eu/eli/dir/2019/790/oj,最后訪問日期:2023年10月25日。也有理論上的突破,如美國的“轉換性使用原則”的現實適用。12. 例如2010年的甲骨文公司訴谷歌公司案:Oracle America, Inc. v. Google Inc.,3:10-cv-03561、2015年的作家協會訴谷歌圖書館案:Authors Guild v. Google, Inc., No. 13-4829、2019年的新思科技公司訴英韌科技公司案:Synopsys, Inc.v.InnoGrit, Corp.,5:19-cv-02082,都是法官通過“轉換性使用”及“四要素”法判斷被告是否構成合理使用。考慮到目前我國司法實踐中法官依靠“三步分析法”并結合實際自主裁判較多,13. 例如2014年上海美術電影制片廠訴新影公司案:(2014)普民三(知)初字第258 號、2016年向佳紅訴樂視影業公司《九層妖塔》字體侵權案:(2016)京0105 民初50488 號、2021 天津字節跳動網絡有限公司訴天津啟閱科技有限公司等著作權侵權案:(2021)津03 民初4293 號,法官都是采用判斷是否構成“合理使用”的“三步檢驗法”,結合是否影響到著作權人的利益判斷是否構成合理使用。故若能從理論方面論證人工智能使用作品的合理性,則會比法律改制節約更多的司法成本。對此,筆者從合理使用的兩個基礎理論,即“非表達性使用”“轉換性使用”出發,嘗試能否為生成式AI 合理使用他人作品提供理論支持。

(一)“非表達性使用”對于機器學習的免責分析

根據薩格教授的觀點,所謂“表達性使用”是指使用者的目的就是利用原作品獨創的表達方式,既包含了原作的藝術價值也會威脅到原作品的市場價值,14. See Matthew Sag.The New Legal Landscape for Text Mining and Machine Learning, Journal of the Copyright Society of the USA,Vol.66:291,p.291-367(2019).會產生對原作者權利的侵犯。“非表達性使用”則是指人工智能并非利用原作品的獨創性表達,而是為了方便檢索、數據分析以及其他采取皆非傳統著作權法意義上的復制、改編、傳播、匯編的使用方式,15. 參見徐小奔、楊依楠:《論人工智能深度學習中著作權的合理使用》,載《交大法學》2019年第3 期,第32-42 頁。不可能生成對原作具有市場替代性的新作品,也不會威脅到原著作權人的合法利益。例如人臉智能識別系統對不同攝影作品人臉特征的采集,包括五官形狀、膚色等生理特征進行數據模型構建來優化人臉素材庫,對于其他具有獨創性的拍照角度、姿勢等元素則不會觸及。故人工智能對他人作品的“非表達性使用”是基于其作品的“工具性”價值而非“表達性”價值,其存在作用對于新作品整體而言也只是讓他人能獲得更好的實用性體驗。

實踐中,此理論的難點在于如何判斷是否利用了原作品的獨創性表達。如美國作家協會訴谷歌圖書館項目案,16. 谷歌將大量由原作者享有著作權的圖書通過文字掃描錄入數據庫的方式建立起了一個網上的數字圖書館,并將這些已經數字化的作品的名稱、關鍵詞以及標識性的片段輸入搜索系統方便游客瀏覽檢索。美國作家協會認為谷歌未經許可為數字圖書提供的掃描及檢索方法構成了對著作權的侵權,此案經過十年的爭議最終維持了谷歌圖書不侵害著作權的判決,并經過聯邦最高法院不予受理原告上訴后徹底結束。該案法官認為圖書館復制圖書部分內容的目的并非產生替代原作品的市場價值而是方便群眾檢索圖書信息,不會對原作者的利益造成“本質性的”損害(這里不能以完全不存在損害為訴的利益,因為也可能會存在通過檢索部分內容就讓讀者失去了購買的欲望或讀者已經通過閱讀該部分內容得到了足夠的信息)。綜上,人工智能的“非表達性使用”不屬于著作權法規制的侵權事項,所以目前規制的應是根據“三步檢驗法”可能會對原作品產生關聯或替代,可能侵害原作者合法利益、產生市場替代性威脅的“表達性使用”。

(二)“轉換性使用”對于機器學習的免責分析

“轉換性使用”是一個衍生于美國四要素判斷標準的概念,17. 美國著作權法第107 條將合理使用制度規定為:包括為了批評、評論、新聞報道、教學、研究等目的使用作品復制件、錄制品或以其他任何手段使用作品。在確定在特定情況下使用某一作品是否合理時,應考慮以下因素:(1)使用的目的和性質;(2)受版權保護的作品的性質;(3)使用部分占原著作權作品的量和實質程度;(4)使用對作品潛在市場或價值的影響。于1990年由美國法官皮埃爾·勒威爾首次提出,并將其定義為“如果二次使用為原作增加了新的價值——即如果被引用的原作品被用作原材料,轉換性地創作出新的信息、新的美感、新的視角和理解,那么這種行為是合理使用制度試圖保護的”。“轉換性使用”首次被正式采用是在1994年美國聯邦法院審理的Campbell 訴 Acuff-Rose 音樂公司案中,聯邦最高法院判定被告2 Live Crew 的滑稽模仿作品構成美國著作權法第107 條意義上的合理使用。這里筆者認為聯邦最高法院判斷的基礎是新作品已經達到了讓群眾能夠輕易感受到其區別于原作的獨創內容,使得與原作品之間的聯系因轉換性的提高而減弱。此種減弱不僅體現在受著作權法保護的表達方面,也體現在不受保護的思想情感方面,屬于“內容上的轉換性使用”。因此如果具有“內容上的轉換性使用”的作品,當他們的獨特性表達或內容不具有足夠的創新性時,即使新作品因市場流通所具有的價值遠遠超過了原作品本身的價值,也不能代表該作品沒有侵犯原著作權人的利益。18. 參見楊書林:《作品轉換性使用規則研究》,西南科技大學2022年碩士學位論文。是否具有獨創性,是法官判斷生成物是否屬于“轉換性使用”的重要標準。

“轉換性使用”的本質并沒有脫離四要素分析法的范圍——確保在原作者市場份額不受影響的情況下盡可能保證他人通過“轉換性使用”創作出更多優質產品、開發更多新客戶。其中新作品所表達內容、目的、功能的“新”在哪里,“新”到什么程度難以一言以蔽之。哪怕是其發源地美國也僅僅是將該理論作為一塊很好的“磚頭”,哪里需要堵哪里。如果所有問題第一步都能通過“轉換性使用”來判斷的話,那么實則是在淡化法律的作用。所以目前筆者認為不應該將“轉換性使用”視為解決一切問題的萬能法寶,或許將其作為一項兜底性條款是最好的選擇。研究中的優先級也應后置于“合理使用”“法定許可”的可行性分析以及我國三步檢驗法判斷標準。

四、中國:生成式AI 的立法監管進展

(一)我國生成式AI 立法現狀

鑒于人工智能產業發展的“雙刃劍”屬性,各國對人工智能的立法規制基本持審慎的態度。如何在促進產業發展的同時有效規制風險是立法者最為關注的問題。我國在大力推進生成式AI 產業發展的同時,對相關立法持同樣態度。截至2023年,我國針對生成式AI 機器學習規則在立法上尚無明確法條。無論是《著作權法》中第二十四條的合理使用規定,還是先后頒布的《中華人民共和國網絡安全法》《網絡信息內容生態治理規定》《中華人民共和國個人信息保護法》等法律法規,都只是對人工智能技術和算法濫用問題規定了較為詳細的法定義務和監管體系,其重心更多是放在社會利益的保護方面。而關于人工智能學習階段內對個體作者享有的著作權的侵權保護、利益補償等仍未涉及。2023年被稱之為“生成式AI 的爆發之年”,我國立法者開始逐漸重視生成式AI 的行為規制。2023年1月10日正式實施的《互聯網信息服務深度合成管理規定》標志著我國首次對生成式AI 的深度合成技術進行規制。其中第十四條第二款規定:深度合成服務提供者和技術支持者提供人臉、人聲等生物識別信息編輯功能的,應當提示深度合成服務使用者依法告知被編輯的個人,并取得其單獨同意。在此規定下,一方面保證了被編輯者的知情權,確保其人格權不受侵犯,為日后可能行使的權利救濟夯實基礎;另一方面令生成物在相關權利人許可的前提下產出,避免了“前端”權利瑕疵帶來的后續侵權風險。但從生成式AI 整體發展的角度來看,僅對深度合成技術進行法律規制所產生的輻射范圍遠遠不夠,還需要更具前瞻性的立法為產業發展護航。為此,進一步制定的《生成式人工智能服務管理辦法》于2023年8月15日起正式實施,作為我國甚至于全球首部針對生成式AI 的專項立法,無疑為日后的進一步立法和司法實踐提供了重要的基礎。

(二)最新立法:《生成式人工智能服務管理辦法》仍舊存在漏洞

《生成式人工智能服務管理辦法》(以下簡稱《管理辦法》)相比于前述相關立法的成效更加顯著。如第七條規定人工智能提供者應當對生成式AI 產品的預訓練數據、優化訓練數據來源的合法性負責。用于生成式AI 產品的預訓練、優化訓練數據,應滿足使用具有合法來源的數據和基礎模型。涉及知識產權的,不得侵害他人依法享有的知識產權。采取有效措施提高訓練數據質量,增強訓練數據的真實性、準確性、客觀性、多樣性等。此外,該《管理辦法》還規定了安全等級評估、算法模型備案、數據信息來源公開等制度,明確使用者、開發者等不同主體的法律責任,確保生成式AI 在遵循創新與尊重著作權的原則下健康發展。

但是,在《管理辦法》中還是能發現許多缺漏。如對第七條的解讀,只要是合法作品,并獲得原作者授權的,就可以納入機器學習的數據庫之中。我國也尚未明確機器學習是納入合理使用制度、法定許可制度或以其他方式提供保護。在上位法態度尚未明確時,《管理辦法》基于現行法律規定將機器學習素材的使用局限于“原作者許可”模式,未曾考慮到未來一段時間內因“原作者許可”模式運行效率較低,以及可能造成的算法偏見導致對生成式AI良好發展勢頭的遏制。本質上其實是淡化了知識產權制度的利益平衡原則在人工智能領域的適用。其次,第七條只針對合法作品的保護,忽視了機器學習對違禁、違法作品的使用問題。違禁、違法作品,系指“依法禁止出版、傳播的作品”19. 參見金耀:《淺析違禁作品的內涵與保護》,載《中國版權》2011年第6 期,第30-32 頁。,對于違禁、違法作品,我國依舊承認其享有著作權。且第二項規定“不能含有侵犯知識產權的內容”將復雜問題簡單化。產業實踐中機器學習無論是通過網絡爬蟲技術,還是對他人享有的合法數據的直接使用,都是在侵犯著作權的邊緣行走。因此,迫切需要選擇合適的路徑來規制這些行業中盛行的行為。

(三)司法實踐對立法需求依舊迫切

綜上,我國對于生成式AI 機器學習的立法現狀雖在進步但進展速度緩慢,仍然無法依靠成文法來緩解當下其可能侵犯著作權的燃眉之急。這導致目前我國的司法實踐中針對此類問題還是多依靠法官的自由心證,甚至可能引發“同案不同判”的后果。如2018年北京菲林律師事務所訴北京百度網訊科技有限公司一案中,法院認為涉案的文章是通過人工智能軟件分析獲得的報告,不具有獲得《著作權法》保護的屬性,20. 參見北京互聯網法院(2018)京0391 民初239 號民事判決書。而在2023年11月27日北京互聯網法院卻認可了人工智能生成圖片的作品屬性以及著作權歸屬。21. 參見北京互聯網法院(2023)京0491 民初11279 號民事判決書。雖然兩起案件在作品類型方面有所差異,但在說理部分北京互聯網法院均是引用《著作權法》及其實施條例作為法律依據。相同的法條卻引申出不同的解釋,既無益于日后的司法裁判,又有損法律的準確性、權威性。雖然我國目前尚無關于生成式AI 在機器學習過程侵犯他人著作權(即“前端”)的判例,但根據司法實踐中對“后端”的裁判過程也可管中窺豹。如此,在后端的裁判結果尚且有分歧的狀態下,對前端的侵權行為尋求判斷標準、保護措施、救濟渠道等似乎是無稽之談。故筆者認為當下我國已經嚴格規制了生成式AI 使用者的應盡義務,但缺少明確對原著作權人保護與補償的條款,應盡快明確生成式AI 使用者依法使用他人作品數據的法律依據,究竟是采用美國的“轉換性使用”理論,還是“合理使用”等制度模式,方可明晰接下來的立法方向。對此,下文的國外立法模式或許能給予我們一些新的啟發。

五、歐盟:生成式AI 的立法監管進展

(一)《單一數字市場版權指令》:“文本數據與挖掘的例外”

歐盟一直致力于引領全球數字立法治理,早在2016年歐盟委員會就以營造服務于互聯網發展的環境為目的公布了《單一數字市場版權指令》草案,并于2019年正式頒布《單一數字市場版權指令》。該指令以適應互聯網時代的發展和變化為首要目的,對機器學習的前提條件“文本數據與挖掘”進行了規制。指令第2 條對適用主體進行了定義和限制:“研究機構”應當符合:以非營利為基礎,或將所有利潤再投資于其科學研究;或者出于為成員國所承認的公共利益而進行研究。在此基礎上第3 條明確允許了科研機構和文化遺產機構為科學研究目的進行文本和數據挖掘,對其合法獲取的作品或其他內容進行復制與提取的行為。可見該法主要目的是服務于科研人員,而忽視了版權人和商業主體的利益。一方面該法案對非商業主體利用他人作品的行為劃定了標準,包括復制品應當妥善存儲,確保研究結果準確性和完整性等;另一方面它的“狹隘性”忽視了基于商業目的而投入研究的主體的重要性。盡管指令第4條從行為方式角度進一步闡明:任何主體“以文本和數據挖掘為目的,對合法獲取的作品或其他內容進行復制與提取的行為”,隱晦地表達了對以商業營利為目的的主體的許可,但仍被人詬病不能滿足歐盟的科技企業在新興的人工智能化浪潮之中取得相對于其他國家企業的優勢地位。因為該條第三款規定了作品權利人可以用適當方式對作品的使用進行保留的權利,這可能會導致在實踐中出現原創作者聯合聲明保留權利以抵制生成式AI 學習及創作的尷尬局面。綜上可以看出早期歐盟對人工智能立法方向還是以促進科技發展為主,在立法態度上格外謹慎,并不認可商業性主體的使用行為,同時也禁止將通過利用他人作品產生的生成物或復印件提供給公眾。最后,該指令也并未對如何使用受版權保護的文本和數據訓練基礎模型的行為做出明確規定,難以適應新一輪人工智能發展規制。

(二)《數據治理法》:“數據中介機構”與“數據流通共享”

2022年4月6日歐洲議會通過《數據治理法》,力求促進不同經濟參與者之間的數據共享(包括商業秘密、個人數據和受知識產權保護的數據)。相比于2018年公布的《通用數據保護條例》對個人數據的嚴格保護,該法將數據視為一種可供流通的財產加以規制。其中企業或者個人對他人數據進行使用必須通過數據中介服務提供者加以實現。該法規定:明確數據共享服務商業務范圍并實行登記制,規定從事數據持有者和潛在數據用戶之間中介服務或者數據合作社服務的,為該法規定的數據共享服務商,并要求其向主管部門提交登記。同時數據服務商要確保服務的程序和價格公平透明和非歧視性,可見歐盟立法態度逐漸開始兼顧保護與流通兩種屬性。人工智能企業可以在數據中介機構上通過數據交易使用他人數據或是素材且不必經過他人同意,同時數據提供者又能獲取合理的經濟補償,形式上符合我國法定許可制度的模式。但一方面,該法案的經濟補償機制尚未完善,數據持有人的補償落實困難;另一方面,在缺少強制命令或激勵政策的支持下,數據持有人缺少加入共享平臺的意愿。本法案的目的還是在各主體“自愿”“共享”的基礎上設立義務來促進數據流通,但目前看來若無額外激勵,數據持有者并不具有分享的意愿。22. 《歐盟數據治理的新發展》,https://www.chinacourt.org/article/detail/2022/11/id/6994275.shtml,最后訪問日期:2023年10月1日。

(三)《人工智能法案》草案:生成式AI 供應者作為義務主體下的合理使用

對此,歐盟委員會于2023年6月14日正式通過了《人工智能法案》草案,該法案立足于人工智能領域技術應用,有望成為全球首個關于人工智能的法案。該法案進一步限定了生成式AI 產物供應者的義務,其中第28 條規定:人工智能系統中使用基礎模型,專門用于以不同程度的自主性生成復雜的文本、圖像、音頻或視頻等內容(“生成式人工智能”)的供應者,以及將基礎模型專門用于生成式人工智能系統的供應者還應當:(a)遵守第52 條要求的“透明度義務”23. “透明度”是指人工智能系統的開發和使用方式應允許適當的可追溯性和可解釋性,同時使人類意識到他們與人工智能系統的交流或互動,以及適當告知用戶該人工智能系統的能力和限制,并告知受影響的人他們的權利。。(b)訓練,并在適用的情況下,設計和研發基礎模型,以確保有足夠的保障措施,防止產生違反歐盟法律的內容,符合普遍公認的行業先進實踐,并不損害基本權利,包括言論自由。(c)在不影響國家或歐盟版權立法的情況下,記錄并公開提供受版權法保護的訓練數據使用情況的足夠詳細的摘要。可以看出該法案的態度從法定許可主義又偏向到了合理使用主義,在行為主體使用生成式AI 的過程中只要盡到了上述義務即可將該產出的基礎模型向市場提供或自己使用。本次立法在一定程度上保證了原作者的著作權,通過公示其作品元素在人工智能運作中的作用,全程記錄任何用于本次訓練AI 系統所使用的文本、圖像、視頻和音樂的版權材料,并且通過技術手段保障本次訓練素材的隱私性和安全性。這樣可以使得原作者知曉自己的作品被哪些AI 進行模型訓練,以保有自身是否決定維權且獲取收益的權利。

縱觀歐盟的整個人工智能立法進程可以看出立法者在“合理使用”和“法定許可”之間徘徊不定。筆者認為造成這一結果的原因是“非商業性主體”原則與人工智能發展之間的矛盾難以調和。單憑科研機構等非商業主體進行人工智能的研發困難重重,它需要大量的流通數據以及市場反饋來優化升級。商業性主體可以憑借其市場占有份額及龐大的客戶量滿足上述需求,若將商業主體排除在外或是對其加以繁瑣的鐐銬,都會限制人工智能的發展。但同時商業性主體本身的盈利性必然會損害其他著作權人的合法權益,是盡量確保二者間的利益平衡,又或者為保障我國人工智能發展而暫時降低著作權上的保護力度,這需要立足于我國人工智能產業與科技創新的現實需求,在借鑒國外立法的同時也要正視本國國情。

六、生成式AI 機器學習中著作權風險的化解路徑

為了順應國家發展戰略考量,必須給予人工智能技術研發一定政策上的支持,要確保此類制度安排盡可能簡潔、高效。筆者贊同目前的兩種制度方案,即法定許可制度和合理使用制度,下面將逐一展開具體分析。

(一)法定許可:理想主義的選擇

法定許可的贊同者認為要想確保優質作品的產出,就必須優先考慮創作者的利益。24. 參見劉友華、魏遠山:《機器學習的著作權侵權問題及其解決》,載《華東政法大學學報》2019年第2 期,第68-79 頁。人工智能創作本身并不具備產生“新作品”的能力,如果任憑人工智能剝奪作品權利人的應得利益,那么就會磨滅人類創作者的激情,等同“殺雞取卵”。法定許可制度可以在保證著作權人利益的同時服務于推動人工智能發展的國家政策,較合理使用制度來說更具有合理性。支持該理論的學者對于該制度的初步構想是,25. 參見高陽、胡丹陽:《機器學習對著作權合理使用制度的挑戰與應對》,載《電子知識產權》2020年第10 期,第13-25 頁。建立一個類似于歐盟在《數據治理法》中設想的“個人數據共享中介機構”,要求使用主體將其欲使用的作品進行登記付費,讓企業與個人在此機構的指引和幫助下合理使用他人享有著作權的作品數據。正如前文所說機器學習所需要的作品是一個龐大的數量,每一個作品都代表一位著作權人,如果單憑企業去進行協商聯絡,帶來的時間、經濟上的壓力是不言而喻的。因此通過官方的平臺進行作品登記,并向權利人支付報酬既可以提升交易效率、降低成本,又可以保證機器學習在獲得大量素材的同時兼顧原著作權人利益。

但筆者認為雖然從模式構建上法定許可制度可以完美地解決目前人工智能機器學習和著作權人沖突的問題。但立足于實際,無論是起步階段還是后續的維護都存在著難以克服的困難,比如:一、著作權人登記是否強制?沒有著作權人的“孤兒作品”如何處理?二、目前的區塊鏈技術不足以支撐保證數據的絕對安全,技術的桎梏暫時無法滿足框架的搭建。三、法定許可的利益分配方案如何劃定且由誰監督執行?如果缺少高效公平的分配體系與監督體系,著作權人應得的利益仍舊難以保障。綜上,筆者認為至少根據我國現狀來看,法定許可制度還只是一個理想型的方案,缺少實施的可能性。

(二)合理使用:現實主義的選擇

相對于法定許可制度,合理使用最大的優勢就在于其實施的現實可能性以及不必支付報酬的屬性。目前除了科研院所、研發機構等國家財力支撐的主體,還需要其他商業主體承擔技術開發、研究等工作。商業性質的大型科技研發企業已經成為人工智能研發主力。對此,參考歐盟許可商業性主體在不損害著作權人合法權利的情況下對數據加以利用,并不禁止以營利為目的的使用方式或許是當下最好的選擇。在兼顧滋養人工智能創作產業的土壤肥沃的同時也確保以人為核心的著作權理念不被破壞。由于我國的人工智能技術尚處于起步階段,基于合理使用制度下的免費使用無疑能為人工智能技術的研發節約更多的成本,滿足人工智能開發主體的研發需求。同時若能借鑒歐盟在《人工智能法案》草案中規定的生成式AI 創作者的“素材公示義務”,則在人工智能產出時也有助于將原著作權人的作品與口碑推向其他市場,為原著作權人帶來潛在的收益。此外我國的合理使用制度還有著良好的立法與實踐基礎,不但在新通過的《著作權法》中明確了“三步檢驗法”的模式,且在實踐中也支持商業性主體以營利為目的的使用。如上海美術電影制片廠訴新影公司案中,新影公司以“黑貓警長”等卡通作品中的人物形象完善電影海報吸引顧客觀看,從而達到獲利的目的,法院也并沒有因為其商業性行為而認定其侵權。故運用合理使用制度來解決機器學習的著作權問題有著良好的現實基礎。最后,從著作權法追求“利益平衡”的角度來看,達成原作者“個人利益”與社會“公共利益”之間的平衡是雙方矛盾和解的前提。但現有《著作權法》從文本上看對生成式AI 大規模使用他人數據的行為仍持一種抵觸態度,其規定更加偏向于著作權人一方。具體表現為,生成式AI 在機器學習中稍有不慎就會觸碰到“個人利益”的邊界(如前文所提到的具體侵權風險),若只是機械地保護原作者的權益,顯然不利于該技術在“公共利益”方面帶來的效益,有悖于“利益平衡原則”。所以有必要對利益平衡的雙方價值重新進行考量,避免因版權或成本問題使得生成式AI 缺少成長的養分而引發“算法歧視”“非法剽竊信息”等惡劣行徑。故相比于法定許可制度的“等價交易”方式,在當下生成式AI 的“發展起步階段”合理使用制度的免費使用屬性更有利于“私人利益”與“公共利益”之間達成平衡。

當然,合理使用制度也存在著缺陷,一方面,《著作權法》第二十四條第十三項關于合理使用的兜底條款仍然存在問題。因為其規定的是“法律法規規定的其他情形”,這一前置條件使得合理使用的范圍急劇縮小,只有在其他法律法規中確定了相關合理使用的條款時,才可以適用第十三項的要求并結合三步檢驗法進行判斷。而我國目前法律法規中具有相關規范的數量較少,26. 參見高陽、胡丹陽:《機器學習對著作權合理使用制度的挑戰與應對》,載《電子知識產權》2020年第10 期,第13-25 頁。且都是依照《著作權法》中的合理使用內容做出的相似規定,如果沒有在后續新頒布的法律法規中滿足生成式AI 機器學習的這種“其他情形”,就會陷入“先有雞還是先有蛋”的困境,故只依靠這些重復內容來進行判斷無法達成目的。另一方面合理使用制度無論再怎樣設定傾向于著作權人的條款在本質上都是侵害其著作權的。不但原作者的復制權、改編權、傳播權等均有被侵權的風險,且依靠其作品產出的產品一定程度上還會對原有作品產生替代作用,會極大地損害著作權人的合法權益,消磨其創作的熱情。不但不利于我國文化市場的長期穩定發展,還會反作用到人工智能領域,使得人工智能開發企業陷入無素材可用的尷尬境地。

七、結論

當前大模型競爭時代,在各界呼吁平衡人工智能產業發展與著作權保護之時,亟待探索化解機器學習中的著作權風險的最優路徑。雖然法定許可無論從長遠發展,還是合理性上均優于合理使用制度,但是現階段尚不具備實踐基礎。知識產權制度的工具屬性與利益平衡宗旨,使其天然具備利益衡量下的社會總體福利最優路徑選擇。合理使用路徑便是當下人工智能發展戰略下的最優解,歐盟的選擇亦是如此。未來,待區塊鏈技術發展到一定階段,且我國人工智能產業已奠定良好的競爭基礎時,機器學習訓練素材的使用規則可以逐漸轉向法定許可。

猜你喜歡
人工智能
我校新增“人工智能”本科專業
用“小AI”解決人工智能的“大”煩惱
汽車零部件(2020年3期)2020-03-27 05:30:20
當人工智能遇見再制造
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
AI人工智能解疑答問
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
基于人工智能的電力系統自動化控制
人工智能,來了
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
人工智能來了
學與玩(2017年12期)2017-02-16 06:51:12
主站蜘蛛池模板: 亚洲成人精品| 干中文字幕| 国产夜色视频| 精品无码人妻一区二区| 亚洲三级a| 99性视频| 国禁国产you女视频网站| 亚洲欧美精品日韩欧美| 亚洲码一区二区三区| 国产av剧情无码精品色午夜| 91成人在线免费观看| 乱系列中文字幕在线视频| 国产经典免费播放视频| 亚洲第一香蕉视频| 黄网站欧美内射| 亚洲天堂网在线播放| 2021国产精品自拍| 国产精品理论片| 日韩欧美一区在线观看| 成人免费视频一区二区三区 | av在线手机播放| 视频二区亚洲精品| 国产高清在线丝袜精品一区| 高清久久精品亚洲日韩Av| 毛片网站在线播放| 日本不卡在线| 亚洲欧美一区二区三区图片| 国产系列在线| 免费观看欧美性一级| 熟妇人妻无乱码中文字幕真矢织江 | 亚洲综合精品香蕉久久网| 天天综合色天天综合网| 丰满的熟女一区二区三区l| 福利视频一区| 国产小视频网站| 少妇精品网站| 精品久久久久久中文字幕女 | 国产精品久久自在自2021| 天天做天天爱天天爽综合区| 国产亚洲一区二区三区在线| 久久国产精品娇妻素人| 88国产经典欧美一区二区三区| 久久久久久高潮白浆| 国产经典免费播放视频| 97精品久久久大香线焦| 无码中字出轨中文人妻中文中| 亚洲浓毛av| 久精品色妇丰满人妻| 国产一级毛片在线| 国产精品人成在线播放| 97青草最新免费精品视频| 国产成人乱无码视频| 国产第二十一页| 免费国产高清视频| 欧美中文字幕第一页线路一| 亚洲人成色在线观看| 国产乱肥老妇精品视频| 国产又粗又爽视频| 日韩欧美国产精品| 亚洲第一极品精品无码| 国产欧美日韩在线一区| 亚洲欧美日本国产综合在线 | 日本欧美一二三区色视频| 久久久久国产一级毛片高清板| 97视频精品全国免费观看| 国产精品30p| 亚洲人成网18禁| 午夜a级毛片| 青草视频久久| 欧美性爱精品一区二区三区| 国产福利免费视频| 干中文字幕| 啪啪永久免费av| 国产原创自拍不卡第一页| 国产麻豆精品在线观看| 欧美乱妇高清无乱码免费| 国产黄色免费看| 国产在线精品网址你懂的| 国产Av无码精品色午夜| 午夜激情婷婷| 久草性视频| 亚洲Aⅴ无码专区在线观看q|