中圖分類號(hào):D923.4 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1003-5168(2025)14-0117-05
DOI:10.19968/j.cnki.hnkj.1003-5168.2025.14.023
Research on Fair Use of Copyright in Generative AI Pre-training
HOU Xianjie (Law School/Intellectual Property School, Zhongyuan University of Technology, Zhengzhou 45ooo7,China)
Abstract: [Purposes] The pre-training process of generative artificial intelligence involves large-scale utilization of copyrighted works. Under China's current Copyright Law and related legal framework,entities engaged in such utilization face prohibitive transaction costs and potential copyright infringement risks.This paper aims to explore feasible solutions that align with the developmental requirements of China's generative AI industry while addressing these legal challenges.[Methods] Through an examination of technological principles underlying generative AI pre-training phase,this study deconstructs data processing workflows and systematically categorizes potential infringement types in data transcoding, tagging, organization, and aggregation phases using an input-side infringement analysis framework.A comparative legal analysis evaluates the operational eficacy of three regulatory approaches: licensing agreements,statutory licensing,and fair use provisions.[Findings] The findings demonstrate that conventional licensing agreements and statutory licensing mechanisms inevitably incur substantial transaction and administrative costs.While fair use provisions struggle to provide effective copyright infringement defenses for generative AI trainers,the open-ended provisions under Article 24 of China's current Copyright Law preserve implementation flexibility through its residual clause.[Conclusions] This study recommends China capitalize on the ongoing amendments to the Implementing Regulations of the Copyright Law to establish a \"Fair Use for Generative AIPre-training\" clause,explicitly defining its subject qualifications,protected objects,permissible purposes,and behavioral criteria. Keywords: generative artificial intelligence; data training; copyright; fair use
0 引言
近年來,生成式人工智能(GenerativeArtificialIntelligence,GAI)發(fā)展迅猛,其強(qiáng)大的學(xué)習(xí)能力、交互能力和創(chuàng)造能力,給人類社會(huì)生產(chǎn)和生活方式帶來了巨大改變,也標(biāo)志著人工智能時(shí)代的到來。作為全球高度關(guān)注的重點(diǎn)前沿產(chǎn)業(yè),GAI已經(jīng)成為我國(guó)新質(zhì)生產(chǎn)力的典型代表。GAI預(yù)訓(xùn)練在生成式人工智能技術(shù)體系中占據(jù)核心地位,是實(shí)現(xiàn)高質(zhì)量?jī)?nèi)容生成和廣泛應(yīng)用的基礎(chǔ),然而GAI預(yù)訓(xùn)練涉及海量作品的使用行為,給我國(guó)著作權(quán)法律制度提出了新的議題。例如,在GAI預(yù)訓(xùn)練過程中作品使用行為是否構(gòu)成侵權(quán)、GAI所生成內(nèi)容能否給予著作權(quán)保護(hù)等問題。目前,學(xué)界針對(duì)GAI生成物的可版權(quán)性和版權(quán)歸屬問題研究較多1],但針對(duì)GAI預(yù)訓(xùn)練過程中的作品使用行為的著作權(quán)問題探討較少,并且現(xiàn)有理論和實(shí)務(wù)界也存在較大爭(zhēng)議[2。通過匯集現(xiàn)有研究,不難發(fā)現(xiàn),該爭(zhēng)議主要集中體現(xiàn)在如何面對(duì)GAI使用海量作品預(yù)訓(xùn)練行為可能侵犯著作權(quán)的風(fēng)險(xiǎn),以及我國(guó)應(yīng)選擇何種路徑來適應(yīng)GAI產(chǎn)業(yè)發(fā)展的需要。學(xué)界較多觀點(diǎn)主張適用合理使用規(guī)則3解決以上問題,其次是法定許可方案[4]和授權(quán)許可模式[5]。可見,針對(duì)該問題學(xué)界并未達(dá)成共識(shí)。
有鑒于此,本研究探究GAI預(yù)訓(xùn)練過程中可能存在的著作權(quán)侵權(quán)風(fēng)險(xiǎn),針對(duì)當(dāng)前學(xué)界主流觀點(diǎn)進(jìn)行詳細(xì)闡述并分析各觀點(diǎn)實(shí)踐效能,得出合理使用是最為理性的路徑選擇。并且,從實(shí)際與發(fā)展、平衡與效率的角度出發(fā),以《中華人民共和國(guó)著作權(quán)法實(shí)施條例》以下簡(jiǎn)稱《著作權(quán)法實(shí)施條例》修改為契機(jī),提出合理使用規(guī)則的完善建議,以期為我國(guó)GAI產(chǎn)業(yè)競(jìng)爭(zhēng)發(fā)展提供有力的法律保障,
1GAI預(yù)訓(xùn)練中著作權(quán)侵權(quán)風(fēng)險(xiǎn)
在介紹GAI預(yù)訓(xùn)練可能引發(fā)的著作權(quán)侵權(quán)風(fēng)險(xiǎn)之前,有必要厘清GAI預(yù)訓(xùn)練的基本原理,總結(jié)出可能涉及侵權(quán)的原因,以便更好地明晰這一過程中最有可能侵犯著作權(quán)的具體種類。
1.1 GAI預(yù)訓(xùn)練的基本原理
通俗來講,GAI預(yù)訓(xùn)練本質(zhì)上是讓大模型通過“學(xué)習(xí)\"海量數(shù)據(jù),自行總結(jié)數(shù)據(jù)分布規(guī)律(如語言規(guī)則、圖像及音頻結(jié)構(gòu)等)。隨后,經(jīng)過微調(diào)(SFT)和強(qiáng)化學(xué)習(xí)(RLHF),結(jié)合特定的任務(wù),生成新的內(nèi)容。數(shù)據(jù)預(yù)訓(xùn)練離不開對(duì)海量數(shù)據(jù)的獲取,機(jī)器學(xué)習(xí)是數(shù)據(jù)預(yù)訓(xùn)練的核心技術(shù)[6]。
以ChatGPT為例,其數(shù)據(jù)獲取來源廣泛,包括但不限于語料庫(kù)、期刊、書籍、論壇、維基百科、社交網(wǎng)絡(luò)、開源數(shù)據(jù)庫(kù)等。獲取方式主要依賴于網(wǎng)絡(luò)爬取技術(shù),部分?jǐn)?shù)據(jù)是向語料庫(kù)所有者購(gòu)買或通過許可授權(quán)獲得。由于數(shù)據(jù)來源和獲取方式的開放性,GAI企業(yè)可能會(huì)爬取并使用未經(jīng)授權(quán)的盜版作品,進(jìn)而侵犯作者的著作權(quán)。在機(jī)器學(xué)習(xí)領(lǐng)域,數(shù)據(jù)處理流程復(fù)雜多樣,核心是通過轉(zhuǎn)碼、標(biāo)記、整理、匯總等環(huán)節(jié),將數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化、高質(zhì)量的訓(xùn)練語料庫(kù),以支撐GAI學(xué)習(xí)復(fù)雜的生成能力。首先,轉(zhuǎn)碼是將非數(shù)字化數(shù)據(jù)(如文本、圖像和音頻等)轉(zhuǎn)換成模型能處理的統(tǒng)一格式,該階段包括格式標(biāo)準(zhǔn)化(如統(tǒng)一編碼、調(diào)整圖像分辨率)結(jié)構(gòu)化處理(如提取純文本,保留段落、表格等邏輯結(jié)構(gòu))、多模態(tài)對(duì)齊(如圖文、視頻字幕對(duì)齊)等3個(gè)程序。其次,標(biāo)記是將數(shù)據(jù)轉(zhuǎn)化為模型可以學(xué)習(xí)的語義單元,并附加元信息(即數(shù)據(jù)的數(shù)據(jù),描述性信息)。此階段主要是將文本、圖像等信息轉(zhuǎn)化為數(shù)字ID、圖像塊等,并添加控制標(biāo)記、標(biāo)簽。再次,整理旨在提升數(shù)據(jù)質(zhì)量并拓展數(shù)據(jù)多樣性,包括數(shù)據(jù)清洗去重、去噪、標(biāo)準(zhǔn)化、數(shù)據(jù)增強(qiáng)(如同義詞替換、拓展數(shù)據(jù)多樣性)等。最后,匯總是將經(jīng)過上述階段處理過的數(shù)據(jù)整合成高質(zhì)量、平衡的訓(xùn)練語料庫(kù),并保障質(zhì)量。
通過上述原理分析,GAI預(yù)訓(xùn)練中所使用的數(shù)據(jù)很可能涉及眾多具有獨(dú)創(chuàng)性、尚在著作權(quán)保護(hù)期限內(nèi)的作品,在機(jī)器學(xué)習(xí)過程中可能會(huì)面臨著作權(quán)侵權(quán)的風(fēng)險(xiǎn),如復(fù)制權(quán)、改編權(quán)、翻譯權(quán)和匯編權(quán)侵權(quán)等。
1.2GAI預(yù)訓(xùn)練中著作權(quán)侵權(quán)類型
根據(jù)吳漢東提出的區(qū)分方法,GAI數(shù)據(jù)訓(xùn)練可分為輸人端和輸出端[7]。本研究主要聚焦于GAI數(shù)據(jù)訓(xùn)練的輸入端,即GAI預(yù)訓(xùn)練行為。基于上文所剖析的機(jī)器訓(xùn)練特性及原理,GAI預(yù)訓(xùn)練過程中對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)碼、標(biāo)記、整理、匯總的行為,很可能會(huì)侵犯諸多著作權(quán)(見表1)。但事實(shí)上還需具體問題具體分析,逐一分析各行為會(huì)侵犯哪些著作權(quán)有助于下文路徑的選擇及構(gòu)建。

在GAI對(duì)非數(shù)字化數(shù)據(jù)進(jìn)行轉(zhuǎn)碼前,其獲取的數(shù)據(jù)會(huì)先被復(fù)制,而后轉(zhuǎn)存到數(shù)據(jù)庫(kù)[8]。數(shù)據(jù)轉(zhuǎn)碼的本質(zhì)是對(duì)非數(shù)字化數(shù)據(jù)的數(shù)字化重現(xiàn),這一過程必然涉及對(duì)數(shù)據(jù)的數(shù)字化復(fù)制,若該復(fù)制行為未經(jīng)授權(quán)或數(shù)據(jù)來源非法,則極有可能侵犯原作品復(fù)制權(quán)。相應(yīng)地,標(biāo)記、整理和匯總等行為同樣不可避免地會(huì)對(duì)原作品進(jìn)行復(fù)制,可能構(gòu)成復(fù)制權(quán)侵權(quán),但這些行為并不會(huì)侵犯著作權(quán)人的翻譯權(quán)、匯編權(quán)和改編權(quán)[9]。
首先,轉(zhuǎn)碼屬于復(fù)制行為,并非翻譯行為,因?yàn)檗D(zhuǎn)碼是將異構(gòu)數(shù)據(jù)轉(zhuǎn)化為模型可處理的格式,而非語言文字的一種,與翻譯權(quán)無關(guān)。其次,轉(zhuǎn)碼、標(biāo)記和整理等行為并未改變?cè)髌返膶?shí)質(zhì)內(nèi)容,也未產(chǎn)生新的作品,無須討論獨(dú)創(chuàng)性,因而不會(huì)侵犯改編權(quán)。再次,匯編權(quán)是指將作品或作品片段進(jìn)行選取、編排匯集成新的作品,匯總行為旨在構(gòu)建高質(zhì)量、平衡的訓(xùn)練數(shù)據(jù)集,供機(jī)器學(xué)習(xí)內(nèi)部使用,并非對(duì)匯編數(shù)據(jù)編排為新的作品的行為[10],故而不會(huì)侵犯匯編權(quán)。最后,轉(zhuǎn)碼、標(biāo)記等行為不會(huì)侵犯修改權(quán)和保護(hù)作品完整權(quán)。修改權(quán)和保護(hù)作品完整權(quán)屬于著作人身權(quán),旨在保護(hù)原作不遭受實(shí)質(zhì)性改動(dòng)或歪曲篡改,以保證作品與原作者本意的同一性。而構(gòu)成侵權(quán)的前提在于是否因修改后的內(nèi)容的傳播讓讀者在一定程度上從該內(nèi)容中聯(lián)系到原作者的思想、感情和性格。對(duì)于GAI預(yù)訓(xùn)練而言,數(shù)據(jù)轉(zhuǎn)碼、標(biāo)記等行為,未對(duì)數(shù)據(jù)內(nèi)容進(jìn)行實(shí)質(zhì)性改動(dòng),也未將處理后的內(nèi)容進(jìn)行傳播。因此,并不會(huì)侵犯修改權(quán)和保護(hù)作品完整權(quán)[1]
2GAI預(yù)訓(xùn)練侵權(quán)問題的解決路徑分析選擇
如前所述,GAI預(yù)訓(xùn)練過程中存在著復(fù)制權(quán)侵權(quán)風(fēng)險(xiǎn),為消除該風(fēng)險(xiǎn),當(dāng)以《中華人民共和國(guó)著作權(quán)法》(以下簡(jiǎn)稱《著作權(quán)法》為基礎(chǔ),探索解決問題路徑。下文將逐步分析事前授權(quán)許可、法定許可及合理使用規(guī)則的適用及障礙,以期探尋最佳解決方案。
2.1 授權(quán)許可路徑分析
在當(dāng)前的《著作權(quán)法》框架下,使用他人受著作權(quán)保護(hù)的作品,需要通過許可使用合同授權(quán)。這就要求GAI企業(yè)在獲取他人作品時(shí),需要事先獲得著作權(quán)人授權(quán)許可,通常情況下也需支付相應(yīng)的報(bào)酬。在以往的實(shí)踐中,授權(quán)許可模式無疑是一種最安全、風(fēng)險(xiǎn)較低的路徑。然而,GAI預(yù)訓(xùn)練需要投入海量數(shù)據(jù),若所有數(shù)據(jù)都經(jīng)過事前許可,一方面,GAI企業(yè)在尋求授權(quán)許可的過程中,需要識(shí)別大量作品的來源、確定權(quán)屬,進(jìn)行多次且復(fù)雜的交易磋商,最后不得不支付遠(yuǎn)超自身收益預(yù)期的高昂成本,這極有可能導(dǎo)致市場(chǎng)失靈[12]。另一方面,從發(fā)展的眼光來看,GAI作為新興產(chǎn)業(yè)和新質(zhì)生產(chǎn)力的典型代表,傳統(tǒng)的授權(quán)許可模式很大程度上會(huì)抑制企業(yè)投身于GAI創(chuàng)新的積極性,甚至?xí)苯酉拗埔恍┲行⌒虶AI企業(yè)的發(fā)展。
綜上,傳統(tǒng)的授權(quán)許可模式已經(jīng)無法支撐海量數(shù)據(jù)學(xué)習(xí)模式的需求[13]。后續(xù)可從著作權(quán)侵權(quán)豁免視角一法定許可和合理使用,尋我可行性路徑,以掃清GAI企業(yè)高質(zhì)量發(fā)展路上的阻礙。
2.2 法定許可路徑分析
法定許可是指在特定情況下,使用他人作品可以不經(jīng)著作權(quán)人許可,但需要支付相應(yīng)報(bào)酬,并尊重作者的其他權(quán)利。我國(guó)法律規(guī)定了6種法定許可情形,包括: ① 報(bào)刊轉(zhuǎn)載摘編; ② 錄音制作者使用音樂作品; ③ 編寫出版教科書; ④ 廣播電視、電臺(tái)播放作品; ⑤ 制作課件并通過網(wǎng)絡(luò)發(fā)布; ⑥ 農(nóng)村網(wǎng)絡(luò)扶貧。法定許可在一定程度上免去了GAI主體尋求授權(quán)許可過程中的交易成本,避免了一些不必要的費(fèi)用支出。相應(yīng)地,有學(xué)者提出運(yùn)用法定許可機(jī)制,解決GAI企業(yè)尋求授權(quán)許可難的問題,簡(jiǎn)化作品獲取流程[14]。但是,法定許可制度仍然面臨著適用主體不適格和成本較高等問題。首先,我國(guó)《著作權(quán)法》及相關(guān)法律中明確規(guī)定法定許可適用主體為特殊主體,包括報(bào)刊報(bào)社、廣播電臺(tái)、錄音制作者等。而GAI企業(yè)與這些特殊主體的性質(zhì)不同,因此在主體方面不符合法定許可設(shè)立目的。其次,雖然法定許可不要求使用者事先獲取授權(quán),但仍需支付一定報(bào)酬,然而數(shù)據(jù)訓(xùn)練需要海量作品特性并未改變,依然會(huì)陷人和授權(quán)許可同樣的困境。最后,由于市場(chǎng)的靈活多變,法定許可定價(jià)難以及時(shí)響應(yīng)市場(chǎng)的發(fā)展需求。法定許可部門在對(duì)GAI企業(yè)大量作品使用行為進(jìn)行管理和收取費(fèi)用時(shí),面臨著極其高昂的運(yùn)行成本。綜上所述,法定許可制度不但無法解決GAI企業(yè)難以支付大量使用費(fèi)的現(xiàn)狀,還需要法定許可部門投入巨大的人力、物力和財(cái)力。
2.3 合理使用路徑分析
在技術(shù)中立視角下,讓GAI企業(yè)通過合理使用制度利用作品成為一個(gè)可行選擇。當(dāng)前,為推動(dòng)人工智能發(fā)展,各國(guó)在立法政策上偏向于采取合理使用制度為人工智能訓(xùn)練主體提供便利條件,這顯著降低了GAI企業(yè)著作權(quán)合規(guī)成本。例如,歐盟的“文本與數(shù)據(jù)挖掘例外規(guī)定”、日本“提供新的知識(shí)或信息\"的合理使用情形和美國(guó)通過“轉(zhuǎn)換性使用”認(rèn)定合理使用等[15]
根據(jù)我國(guó)《著作權(quán)法》規(guī)定,合理使用采取“列舉 °+ 兜底”的方式,人工智能數(shù)據(jù)訓(xùn)練可能適用的情形包括個(gè)人使用、適當(dāng)引用和科研研究等。第一,數(shù)據(jù)訓(xùn)練難以適用個(gè)人使用。個(gè)人使用僅是為了個(gè)人的學(xué)習(xí)、研究或欣賞,具有非商業(yè)性,屬于純粹的個(gè)人目的行為,因此數(shù)據(jù)訓(xùn)練不滿足個(gè)人使用的主體要件及非商業(yè)性目的。第二,適當(dāng)引用不宜擴(kuò)大解釋。首先,根據(jù)三步檢驗(yàn)法,引用僅限于評(píng)論、介紹或說明問題等特殊情形[16。其次,GAI數(shù)據(jù)訓(xùn)練中使用作品的行為,并非引用行為,更無須討論適當(dāng)性。此時(shí),若將適當(dāng)引用規(guī)則擴(kuò)大至數(shù)據(jù)訓(xùn)練使用作品行為,背離了規(guī)則的立法目的,故而無法適用。第三,根據(jù)我國(guó)《著作權(quán)法》第24條第6款,科研研究主體僅限于科研機(jī)構(gòu)或教學(xué)人員,目的限于科研和教學(xué)用途,使用數(shù)量限于少量復(fù)制。而GAI預(yù)訓(xùn)練可能涉及大量甚至全文復(fù)制作品行為,且人工智能主體并非都是以科研或教學(xué)為目的的公立學(xué)校、科研機(jī)構(gòu)等,因此也很難適用該規(guī)則來抗辯著作權(quán)侵權(quán)風(fēng)險(xiǎn)。
綜上所述,三種可供解決問題的途徑均存在現(xiàn)實(shí)適用上的障礙。然而,根據(jù)現(xiàn)階段人工智能的發(fā)展需求,通過成本與效益分析,合理使用避免了企業(yè)面臨的高昂許可費(fèi)用,為人工智能行業(yè)鋪下“快速道”,符合現(xiàn)階段發(fā)展的需要,是最有可能解決問題的路徑。但值得說明的是,合理使用規(guī)則并不會(huì)當(dāng)然排除授權(quán)許可和法定許可的適用,反而更有利于優(yōu)化資源配置。例如,GAI企業(yè)并不排斥對(duì)那些掌握著高質(zhì)量的作品的作者或組織尋求付費(fèi)授權(quán)。鑒于當(dāng)前合理使用規(guī)則在適用上還存在一定障礙,接下來將探討如何構(gòu)建適合我國(guó)國(guó)情的人工智能數(shù)據(jù)訓(xùn)練合理使用條款,以期解決當(dāng)下人工智能數(shù)據(jù)訓(xùn)練涉及的著作權(quán)問題。
3GAI預(yù)訓(xùn)練合理使用規(guī)則的構(gòu)建
3.1增設(shè)GAI預(yù)訓(xùn)練合理使用新類型目前,針對(duì)我國(guó)GAI數(shù)據(jù)預(yù)訓(xùn)練中作品使用的著作權(quán)問題,還不能從現(xiàn)行《著作權(quán)法》中找到適配的合理使用情形。為適應(yīng)數(shù)字時(shí)代需求,2020年我國(guó)《著作權(quán)法》進(jìn)行了第3次修正,短期內(nèi)再次修改已然不太現(xiàn)實(shí)。但《著作權(quán)法》合理使用條款的“列舉 + 兜底”的模式,為人工智能合理使用作品的構(gòu)建提供了新的思路。相對(duì)于法律,具有相對(duì)靈活性的行政法規(guī)可以更快地響應(yīng)數(shù)字時(shí)代的高速發(fā)展和變化,以有效彌補(bǔ)法律的滯后性。因此,為滿足人工智能產(chǎn)業(yè)的發(fā)展需求,解決作品許可市場(chǎng)失靈現(xiàn)象,應(yīng)當(dāng)以《著作權(quán)法實(shí)施條例》修改為契機(jī),增設(shè)“GAI數(shù)據(jù)訓(xùn)練合理使用條款”。
3.2 GAI預(yù)訓(xùn)練合理使用的具體要件
首先,在適用主體方面,立法時(shí)不宜嚴(yán)格限定適用主體。例如,歐盟“文本數(shù)據(jù)挖掘”版權(quán)例外制度規(guī)定了科研機(jī)構(gòu)和文化遺產(chǎn)機(jī)構(gòu)兩類適用主體,在實(shí)踐中飽受批評(píng)[17]。在我國(guó),GAI訓(xùn)練主體既包括公立研究機(jī)構(gòu),又有社會(huì)機(jī)構(gòu)和企業(yè)。其中,企業(yè)在推動(dòng)人工智能技術(shù)發(fā)展中扮演著舉足輕重的角色。例如,杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司開發(fā)的DeepSeek,通過技術(shù)創(chuàng)新,極大降低了AI模型的訓(xùn)練和推理成本,打破壟斷壁壘,推動(dòng)了全球AI技術(shù)發(fā)展。基于此,不宜對(duì)適用主體進(jìn)行過于嚴(yán)格的限制。其次,使用目的應(yīng)當(dāng)包含商業(yè)性合理使用。在實(shí)踐中,多數(shù)GAI企業(yè)及投資者對(duì)人工智能領(lǐng)域的投入,本質(zhì)上以預(yù)期商業(yè)價(jià)值和經(jīng)濟(jì)效益為目標(biāo)。若嚴(yán)格限制合理使用目的為非營(yíng)利性目的,其實(shí)際效果等同于嚴(yán)格限制主體。從長(zhǎng)遠(yuǎn)利益來看,這種限制不利于人工智能產(chǎn)業(yè)的發(fā)展。再次,在使用行為方面,應(yīng)當(dāng)僅限于GAI預(yù)訓(xùn)練過程中對(duì)作品的使用行為,包括轉(zhuǎn)碼、標(biāo)記、整理、匯總等。根據(jù)前文分析可知,預(yù)訓(xùn)練行為僅存在侵犯復(fù)制權(quán)的可能性,且該階段的數(shù)據(jù)使用僅限于機(jī)器學(xué)習(xí)模型的內(nèi)部訓(xùn)練,并不會(huì)造成著作權(quán)人更多的權(quán)益損害,應(yīng)以最低程度犧牲著作權(quán)利益為原則,平衡預(yù)訓(xùn)練中的版權(quán)問題。最后,在獲取作品方面,應(yīng)當(dāng)嚴(yán)格限定于合法來源的作品,諸如非法盜取、破壞性爬取等手段獲取的數(shù)據(jù),顯然不能納入合理使用范疇。
4結(jié)語
GAI預(yù)訓(xùn)練中的著作權(quán)侵權(quán)問題,本質(zhì)上是人工智能時(shí)代的飛速發(fā)展與智能行為模式的出現(xiàn)所引發(fā)的一場(chǎng)制度挑戰(zhàn)。在數(shù)據(jù)預(yù)訓(xùn)練場(chǎng)景中,傳統(tǒng)的授權(quán)許可、法定許可和合理使用,難以解決作品使用問題。本研究通過分析GAI預(yù)訓(xùn)練的運(yùn)行邏輯,明晰數(shù)據(jù)訓(xùn)練中潛在的侵權(quán)風(fēng)險(xiǎn),并對(duì)比評(píng)估了三種法律適用路徑的可行性。研究表明,合理使用制度是當(dāng)前應(yīng)對(duì)這一挑戰(zhàn)最為理性的解決路徑。作為新質(zhì)生產(chǎn)力的典型代表,人工智能產(chǎn)業(yè)的發(fā)展需要制度創(chuàng)新。我國(guó)應(yīng)當(dāng)及時(shí)完善相關(guān)立法,為GAI產(chǎn)業(yè)清除發(fā)展障礙,從而提升在全球人工智能競(jìng)爭(zhēng)中的優(yōu)勢(shì)。
參考文獻(xiàn):
[1]吳漢東.論人工智能生成內(nèi)容的可版權(quán)性:實(shí)務(wù)、法理與制度[J].中國(guó)法律評(píng)論,2024(3):113-129.
[2]謝宜璋.生成式人工智能作品訓(xùn)練的版權(quán)爭(zhēng)議與解決[J].中國(guó)編輯,2024(11):38-46.
[3]林秀芹.人工智能時(shí)代著作權(quán)合理使用制度的重塑[J].法學(xué)研究,2021,43(6):170-185.
[4]張潤(rùn),李勁松.利益平衡視角下人工智能編創(chuàng)使用行為的法律定性與保護(hù)路徑研究[J.出版發(fā)行研究,2020(11):72-79.
[5]馬忠法,肖宇露.論人工智能學(xué)習(xí)創(chuàng)作的合理使用[J].山東科技大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2020,22(5):32-38,47.
[6]吳漢東.人工智能生成作品的著作權(quán)法之問[J].中外法學(xué),2020,32(3):653-673.
[7]吳漢東.著作權(quán)合理使用制度研究[M].4版.北京:中國(guó)人民大學(xué)出版社,2020.
[8]周千惠.生成式人工智能數(shù)據(jù)預(yù)訓(xùn)練的著作權(quán)法規(guī)制[J].傳播與版權(quán),2025(2):103-107.
[9]曹新明,范曄.生成式人工智能數(shù)據(jù)訓(xùn)練的合理使用規(guī)則研究[J].中國(guó)版權(quán),2024(4):20-35.
[10]魏遠(yuǎn)山.生成式人工智能訓(xùn)練數(shù)據(jù)的著作權(quán)法因應(yīng):確需設(shè)置合理使用規(guī)則嗎?[J].圖書情報(bào)知識(shí),2025,42(1):78-88.
[11]姚葉.論“文本與數(shù)據(jù)挖掘”的合理使用規(guī)則建構(gòu)[J].科技與法律(中英文),2024(1):32-42.
[12]劉禹.機(jī)器利用數(shù)據(jù)行為構(gòu)成著作權(quán)合理使用的經(jīng)濟(jì)分析[J].知識(shí)產(chǎn)權(quán),2024(3):107-126.
[13]張平.人工智能生成內(nèi)容著作權(quán)合法性的制度難題及其解決路徑[J].法律科學(xué)(西北政法大學(xué)學(xué)報(bào)),2024,42(3) :18-31.
[14]吳漢東.知識(shí)產(chǎn)權(quán)法學(xué)[M].8版.北京:北京大學(xué)出版社,2022.
[15]熊琦.著作權(quán)轉(zhuǎn)換性使用的本土法釋義[J].法學(xué)家,2019(2):124-134,195.
[16]張濤.生成式人工智能訓(xùn)練數(shù)據(jù)集的法律風(fēng)險(xiǎn)與包容審慎規(guī)制[J].比較法研究,2024(4):86-103.
[17]劉云開.人工智能訓(xùn)練作品的著作權(quán)合理使用進(jìn)路[J].東北大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2025,27(1):117-126.