□ 文 田林川 杜 薇
2022年11月,OpenAI發布生成式預訓練語言模型ChatGPT,這一技術在國內外社交媒體上被廣泛討論。AI在內容生產領域的應用更進一步從技術理想走向商業現實,有些機器生成的“作品”在外觀上已經非常接近甚至不輸人類作品。以ChatGPT為代表的AIGC(生成式人工智能)生產出的“作品”是否具備創造性?未來AI生成的大量文章、小說、繪畫作品是否應該像人類作品一樣被法律保護?傳統的著作權法體系以保護人類智力成果為中心,尚無法很好回答AI生成內容的相關版權問題,而探討生成內容是否具備獨創性是解決問題的關鍵。
隨著深度學習技術的進步,AI的算法邏輯越來越趨近人類智力活動,在內容生產領域AI算法的作用也由單純的輔助性工具向具有獨立自主性的創造機器進化。司法領域就面臨AI創作帶來的版權保護方面的新問題,在國內為數不多的案例中都傾向于肯定對AI算法生成內容的著作權保護。北京菲林訴某平臺的科技案,法院認為涉案文章(原告利用威科先行庫選定關鍵詞后使用“可視化”功能自動生成的分析報告)符合文字作品的形式要求,具有一定獨創性,但同時否認了軟件研發者(所有者)和軟件使用者在文章自動生成過程中存在用戶思想、感情的獨創性表達,進而否定涉案文章為自然人創作的作品。從判決上看,法院認可了原告涉案文章系法人作品的主張,最終以侵害信息網絡傳播權為由判決被告敗訴。不得不說該判決雖然認可了AI生成的文字內容為法人作品,但在判斷文章是否具有獨創性這一關鍵要素上的邏輯是矛盾的。另一則被稱為全國首例認定人工智能生成的文章構成作品的生效案例中,法院認為涉案文章的特定表現形式及其源于創作者個性化的選擇與安排,并由Dreamwriter軟件在技術上“生成”的創作過程均滿足著作權法對文字作品的保護條件。最終法院認為文章是由原告主持的多團隊、多人分工形成的整體智力創作完成的法人作品,不但承認了AI文章的獨創性,還解釋了法院判斷其具有獨創性的內在邏輯。可見盡管關于人類智力在AI算法生成內容創作過程中是否存在獨創性表達上存在爭議,法院最終都肯定了作品本身的獨創性,并將涉案文章認定為法人作品,保護了AI算法投資者和使用者的利益。

從學理上來說,這種判斷方式認為AI雖然不能是權利主體但現有著作權法體系可以兼容對AI算法創作物的保護。當前的著作權法是以人類智力為中心來構建起保護對象的,但借鑒成熟的法人作品制度可以將AI機器使用者或投資者視為著作權人,既規避了將AI視為權利主體的風險,又支持了AI生成內容可以受到現有法律體系的保護。其出發點是考慮權利制度設計要如何激勵更多的、有價值的創造性成果的產生。
獨創性是判斷一部作品受著作權保護與否的關鍵,不過作為一個重要實質要件,其判斷標準卻是模糊可變,有高低之分的。不同法系和不同國家因立法價值各異對獨創性的判斷存在明顯差別。英國版權制度側重保護作品的商業價值和作者的經濟權利,采用“額頭出汗”(Sweat of the Brow)原則判斷作品是否享有版權。英國很早經歷計算機技術對傳統版權制度的沖擊,也最早從立法層面明確計算機創作物的法律地位和權利歸屬問題。在其司法實踐中則一直采用類似“勞動、技能和判斷”(labour, skill and judgment)的較低衡量標準,只要求作品必須是獨立完成而非復制抄襲,不要求作品是新穎有創造力的。同為普通法系的美國最初也采用“額頭出汗”原則,后又在司法實踐中衍生出了少量創造性(modicum of creativity)這一新的獨創性判斷標準,即要求作品滿足“獨立完成”和“最低限度的創造性”兩個要素,因此美國對于獨創性的判斷標準要高于英國。而以法國和德國為代表的大陸法國家著作權制度深受康德和黑格爾哲學思想的影響,側重作者與作品之間的人格聯系,認為作品是作者人格的延伸,既保護作者的財產權利也重視作者的精神權利,因此對于獨創性的要求也更加嚴格。法國著作權法將作品規定為智力作品,強調作品要反映出“作者個性”才受到著作權保護。德國對獨創性要求界定則更高,不僅要求創作應當體現作者的個性和創造性還要求創作要有一定水準,即超出一般人平均水平的智力創作水準。伴隨科技不斷發展德國的司法實踐也開始對一些較低創造性的作品給予著作權保護,嘗試使用“一枚小硬幣的厚度”標準對數據庫、計算機程序等進行保護,認為此類作品創造性的高度只需要一枚硬幣那樣的高度。

可以說AI算法技術的出現對更注重作者人格權的大陸法系國家的法律體系帶來的沖擊更大。我國面對這一新挑戰在實踐中選擇采用法人作品制度解決是具有突破性的嘗試,但在AI作品獨創性這一關鍵要素的判斷上還應該更加審慎。無論從法理基礎還是傳統的法律價值取向上看都不宜將AI作品的獨創性判斷標準放得過于寬松,避免使著作權制度淪為資本保護自身利益的工具。關于如何考量AI算法生成內容的獨創性判斷標準,筆者認為應該堅持以“人”為核心的原則,一方面要衡量AI創作過程中所投入的人類精神含量的多少,另一方面要考慮作品呈現出的人類智力水平的高低,甚至還需要一定程度的考慮到內容受眾的感受。
“人工智能”的概念雖然早在1956年Dartmouth學會上就由約翰·麥卡錫提出,但時至今日我們依然處于弱人工智能時代。伴隨機器學習或深度學習理論(deeplearning)的提出和在語音圖像識別領域取得的成功,人工智能技術在各個領域取得較大進展。機器能夠具備邏輯和思維是模仿人類大腦機制處理數據的結果,其“智力”是依賴于較強的人工干預和不斷“投喂”的大量數據,因此在內容創作領域,AI創作又被稱之為“數據驅動的創作”(Data-DrivenCreativity)或者算法創作(AlgorithmforAuthorship)。AI算法的創作是無法脫離既定的程序和算法的,其本質就是人類賦予的一段代碼,僅從創作過程看,甚至不符合英國較低要求的“獨立創作”標準。未來AI是否可以進化到自行收集、判斷和學習數據并獨立創作出“作品”尚未可知。從現有的嘗試來看完全排除人類在內容生成過程中提供數據和編造程序、算法后產生的成果,無論從技術層面還是受眾觀感上都無法達到人類創作水準。就像現實中無監督學習(unsupervised learning)的算法模式在大多方面都難以達到理想結果。當然有學者主張對于“獨立完成”的要件我們不能單純考慮是否由AI主體獨立自主完成,而只需客觀地考察其生成物是否區別于已有作品,只要與現有作品有所不同便可以認定其符合該要件。
AI算法能夠進行內容創作是建立在機器對數據庫的學習的基礎上的。前述案例中涉及的某平臺開發的Dreamwriter自動化新聞寫作機器人就是由專門的技術人員通過算法設計和數據分析技術讓機器去理解和學習數據及其對應的寫作模板。其寫作的流程分為五個環節:數據庫的建立-機器對數據庫的學習-就具體項目進行寫作-內容審核-分發,其中關鍵環節是數據庫的購買和建立。沒有數據機器就無法進行數據的分析與學習,也無法自動量化生成生動的文章。這里的數據庫就是大量人類生產的行業稿件的合集,Dreamwriter機器對數據庫內的各項數據進行分析,得出字、詞在某個句子中相互匹配的概率,接著在寫作時選用最有可能匹配的字、詞、句進行匹配,生成一篇完整的文章。因此AI算法創作內容的過程實際是在對現有人類作品的重新排列組合,其本質是一種模仿和重復性行為,而并非創造性行為。因此AI算法生成內容的過程是一種創造性極低的行為,其生成內容的創造性不能與人類文學作品中展現創造力相提并論,假設人類文學藝術領域內的作品總量不變,無論AI的算法如何優化,算法種類的數量如何增加,其組合搭配最終結果總是有限的。
在內容創作的某些領域,如體育、天氣、財經等資訊性較強的新聞報道領域,AI工具的運用可以很好地幫助人來抓取熱點信息或解決繁瑣、重復的工作。如果將其運用在其它創造性較強的人文社科領域,結果將是災難性的。以小說創作為例,高質量的內容創作需要投入創作者大量的想象、時間和精力,其作品是作者智力成果的集中體現,蘊含高度的人類智慧和精神力,經典的小說作品可以流傳百年,讓讀者回味無窮。AI難以創作出這樣優秀的作品,相反,市面上各類泛濫的AI輔助寫作工具讓網絡寫手們在寫作過程中能夠借其投機取巧,結果就是生產出大量雷同的低質的內容。假如對這種“摻水”作品給予和人類創作作品同等程度的著作權保護,將不斷拉低內容創作領域的作品質量,降低創作者獨立創作的熱情,甚至影響著作權保護體系的平衡。

從著作權法目標價值來看,著作權保護體系建立旨在通過賦予作者權利,同時維護各主體間的利益平衡,進而激勵科學藝術文化領域的創新與傳播。著作權體系的特殊性在于它盡可能保護作者的私權利并且為公眾留出充足的公共領域,正如洛克于《論出版自由》中提出的,作者權利應當受促進知識增長與傳播的社會性目標限制。隨著經濟和科技的快速進步,著作權呈現出不斷擴張的趨勢,著作權的雙重屬性決定了盲目擴張容易導致現有制度淪為資本逐利的工具。如果參照現有法人作品制度承認AI算法生成物的著作權,未來將有數量龐大的AI生成內容獲得法律保護,其著作權將歸屬于軟件研發者(所有者),往往就是那些互聯網巨頭公司所有,長此以往就有可能產生版權壟斷。
AI創作的前提是對海量數據的理解和學習,涉及對已有作品的二次創作,但因為來源過于廣泛往往難以鑒別這些被二次創作的作品是否屬于受版權保護的作品還是來源于公共領域抑或是二者兼有。假設其來源或部分來源于已經屬于公共領域的作品,那生產出的內容是否可以完全受到著作權法的保護。另外,AIGC模型依靠從網絡上收集的海量數據進行訓練,整個過程通常未得到素材創作者的知情或同意。那些被作為訓練數據的作品來自于“眾多創作者”的創作成果,他們數量龐大但他們的權益將很難被保護。因此即便在以后的立法和司法實踐中明確AI算法生成內容受著作權法體系保護,也應考慮及時增設新的合理使用制度來維護原有著作權法體系的利益平衡。
在了解AI創作工具背后的技術邏輯后會發現其實踐方式是帶著掠奪和剝削性質的。想訓練出高水平的AI創作工具必須依靠強大的大數據平臺,而有能力購買和建立如此龐大數據庫的只有類似chatGPT背后微軟那樣的互聯網巨頭公司,這些寡頭公司在未來的AI開發和應用過程中有可能會毫無顧忌地抓取全球數據用于訓練。如果法律的天平過分傾向于這些寡頭公司會加劇利益集團對公共領域和私人權益的掠奪性使用,最終損害公共利益和社會創新。
從著作權法目標價值來看,著作權保護體系建立旨在通過賦予作者權利,同時維護各主體間的利益平衡,進而激勵科學藝術文化領域的創新與傳播。
AI生成內容迄今為止大都高度依賴應用、算法、規則和模板,隨著深度學習技術的進步AI算法生成物中人的意志和智慧能夠更加靈活自然的體現。我們不能完全否認AI生成內容的創造性和可版權性,但AI創作本身還存在諸多問題,過度保護會帶來潛在風險。未來應該在不損害原有著作權法體系的基礎上兼容對AI算法生成內容的法律保護,同時把握好各主體之間的利益平衡,堅持著作權法的立法價值和目標。面對AI創作這一數字經濟時代的全新生產方式,法律在為其發展保駕護航的同時也要時刻警惕,不要讓創作和創新被資本過分綁架。■