周文婷?劉瑩
【摘要】結(jié)合學(xué)業(yè)界已有研究和實(shí)踐,對(duì)生成式出版的開(kāi)放性內(nèi)容生產(chǎn)、低成本高效率、一站式出版流程、個(gè)性化用戶服務(wù)等內(nèi)涵特征進(jìn)行深入分析,并從生產(chǎn)可供性、行動(dòng)者網(wǎng)絡(luò)對(duì)生成式出版的實(shí)踐進(jìn)路進(jìn)行客觀總結(jié),同時(shí)從技術(shù)層面和行業(yè)層面作出必要反思,以期為新時(shí)期出版業(yè)布局新賽道、新領(lǐng)域,以科技賦能出版新興業(yè)態(tài),加速轉(zhuǎn)型升級(jí)和實(shí)現(xiàn)高質(zhì)量發(fā)展提供有益啟示。
【關(guān)? 鍵? 詞】AIGC;生成式人工智能;生成式出版;科技賦能;新興業(yè)態(tài)
【作者單位】周文婷,東北大學(xué)出版社;劉瑩,東北大學(xué)出版社。
【基金項(xiàng)目】上海出版?zhèn)髅窖芯吭赫袠?biāo)課題“生成式AI時(shí)代圖書(shū)編輯繼續(xù)教育模式的創(chuàng)新性探究”(SAYB2306)階段性研究成果;教育部人文社會(huì)科學(xué)基金青年項(xiàng)目“中小型高校出版社策劃編輯入門培養(yǎng)機(jī)制研究”(19YJC860056)階段性研究成果。
【中圖分類號(hào)】G230.7【文獻(xiàn)標(biāo)識(shí)碼】A【DOI】10.16491/j.cnki.cn45-1216/g2.2024.03.010
2023年被稱為AIGC“元年”。這一年,以出版業(yè)為代表的內(nèi)容行業(yè)積極進(jìn)軍生成式人工智能技術(shù)領(lǐng)域,不斷加大AI研發(fā)及應(yīng)用力度,以期將高新技術(shù)嵌入行業(yè)生產(chǎn)全流程,開(kāi)啟生成式出版新征程。2023年12月,中國(guó)音像與數(shù)字出版協(xié)會(huì)發(fā)布《出版業(yè)生成式人工智能技術(shù)應(yīng)用指南》團(tuán)體標(biāo)準(zhǔn)并宣布自2024年1月20日起正式實(shí)施,為AIGC時(shí)代的行業(yè)轉(zhuǎn)型和產(chǎn)業(yè)升級(jí)指明了方向。未來(lái),在新一代人工智能技術(shù)的強(qiáng)勢(shì)賦能下,生成式出版必將成為行業(yè)發(fā)展新興業(yè)態(tài)。在此背景下,積極了解和把握生成式出版的內(nèi)涵特征,不斷摸索和進(jìn)一步完善其實(shí)踐進(jìn)路,并作出科學(xué)、及時(shí)、有效的技術(shù)反思,是出版業(yè)高質(zhì)量發(fā)展和轉(zhuǎn)型升級(jí)的關(guān)鍵。
一、生成式出版的內(nèi)涵特征
生成式出版作為AIGC時(shí)代的新興業(yè)態(tài),是科技賦能出版的有力體現(xiàn),也是數(shù)字出版向智能出版甚至智慧出版過(guò)渡的必然階段,其本質(zhì)是利用新一代生成式人工智能技術(shù)驅(qū)動(dòng)出版業(yè)的內(nèi)容、流程和服務(wù)創(chuàng)新,從電子出版、互聯(lián)網(wǎng)出版、數(shù)據(jù)出版等發(fā)展階段邁入更高級(jí)的智能出版發(fā)展階段。在這一過(guò)程中,基于新一代人工智能技術(shù)優(yōu)勢(shì),我們可分析和總結(jié)生成式出版的四大發(fā)展特征。
1.開(kāi)放性內(nèi)容生產(chǎn)
從內(nèi)容生產(chǎn)角度來(lái)看,開(kāi)放性是生成式出版的核心特征,主要表現(xiàn)在兩個(gè)方面。一是內(nèi)容規(guī)模和生產(chǎn)方式層面。生成式出版借助AIGC強(qiáng)大的技術(shù)優(yōu)勢(shì)和爬取能力,能夠開(kāi)放獲取海量數(shù)據(jù)資源(包括無(wú)標(biāo)注文本數(shù)據(jù)和人工標(biāo)注數(shù)據(jù)),經(jīng)由專業(yè)大模型的反復(fù)訓(xùn)練后,可根據(jù)用戶指令生成或創(chuàng)造新的出版內(nèi)容。二是內(nèi)容模態(tài)和呈現(xiàn)形態(tài)層面。生成式出版利用AIGC同時(shí)支持生成文字、圖片、音頻、視頻等多模態(tài)內(nèi)容的機(jī)制,可為不同用戶群體定制多元出版產(chǎn)品,并實(shí)現(xiàn)不同模態(tài)內(nèi)容的同時(shí)輸出和相互關(guān)聯(lián),真正實(shí)現(xiàn)“一種內(nèi)容,多次開(kāi)發(fā)”的理想目標(biāo)。未來(lái),隨著AIGC開(kāi)放獲取和生成能力的進(jìn)一步增強(qiáng),生成式出版的內(nèi)容生產(chǎn)必將涵蓋文字、音視頻等多個(gè)領(lǐng)域,甚至“可以面向增強(qiáng)現(xiàn)實(shí)出版物提供3D模型、面向虛擬現(xiàn)實(shí)出版物提供數(shù)字化虛擬環(huán)境”,實(shí)現(xiàn)跨越式發(fā)展。
2.低成本高效率
低成本高效率是生成式出版的另一大重要特征。得益于AIGC強(qiáng)大的技術(shù)優(yōu)勢(shì),在內(nèi)容生產(chǎn)過(guò)程中,生成式出版的實(shí)際成本和產(chǎn)出效率得到顯著優(yōu)化,切實(shí)達(dá)到降本增效的目的。
從生產(chǎn)成本層面來(lái)看,生成式出版的成本大大降低,以有聲出版最具代表性。有聲書(shū)以往主要采用真人錄制方式,錄制環(huán)節(jié)冗長(zhǎng),對(duì)軌和審聽(tīng)過(guò)多依賴人工,導(dǎo)致出版成本高昂。利用AIGC賦能,生成式有聲出版的投入成本將大幅降低,如在Reflect Audio打造的有聲讀物制作平臺(tái),AI有聲書(shū)的生產(chǎn)速度超過(guò)500萬(wàn)字/天,錄制成本可降低90%以上。在傳統(tǒng)圖書(shū)出版領(lǐng)域,生成式出版依托AIGC技術(shù)賦能可實(shí)現(xiàn)AI選題、AI生成、AI編輯、AI校對(duì)等目標(biāo),這同樣可以降低出版機(jī)構(gòu)的人力、時(shí)間等成本支出。
從生產(chǎn)效率層面來(lái)看,生成式出版利用AIGC技術(shù)可大幅縮短整個(gè)生產(chǎn)周期,進(jìn)一步提高出版效率?!俄n國(guó)經(jīng)濟(jì)日?qǐng)?bào)》報(bào)道,韓國(guó)出版商Snowfox Books在新書(shū)《找到人生目標(biāo)的45種方法》(45 Ways to Find the Purpose of Life)內(nèi)容創(chuàng)作與生產(chǎn)過(guò)程中利用ChatGPT撰文、Papago翻譯(韓國(guó)科技巨頭Naver研發(fā)的翻譯軟件)以及AI韓語(yǔ)檢查工具(釜山大學(xué)AI實(shí)驗(yàn)室和韓國(guó)新創(chuàng)Nara Info Tech共同開(kāi)發(fā))校對(duì),用時(shí)不到10小時(shí)。未來(lái),隨著AIGC技術(shù)不斷迭代升級(jí),生成式出版的內(nèi)容生產(chǎn)周期和質(zhì)量穩(wěn)定性還將進(jìn)一步優(yōu)化。
3.一站式出版流程
從運(yùn)行流程來(lái)看,一站式是生成式出版的重要特征。所謂一站式出版流程,主要是指在AIGC賦能作用下,生成式出版可實(shí)現(xiàn)從前期內(nèi)容選題、創(chuàng)作、編輯、校對(duì),到后期產(chǎn)品推廣、運(yùn)營(yíng)等的自主運(yùn)作。2023年6月,電子工業(yè)出版社與京東圖書(shū)聯(lián)合舉辦“大模型時(shí)代——AIGC內(nèi)容創(chuàng)作產(chǎn)業(yè)論壇暨《大模型時(shí)代》與《人人都能玩賺AI繪畫(huà)》新書(shū)發(fā)布會(huì)”,其中《大模型時(shí)代:ChatGPT拉開(kāi)硅基文明序幕》一書(shū)便是由司馬華鵬和團(tuán)隊(duì)先勾勒內(nèi)容框架和文稿脈絡(luò),再通過(guò)ChatGPT完成撰稿工作的。此外,該書(shū)的推廣和銷售也有AI參與,真正實(shí)現(xiàn)“一本AI寫的書(shū),且由AI去銷售”的目標(biāo)。
不僅如此,在有聲出版領(lǐng)域,利用“AIGC+TTS”技術(shù)組合,還能將傳統(tǒng)文本無(wú)縫轉(zhuǎn)換為音頻資源,從而實(shí)現(xiàn)從傳統(tǒng)紙質(zhì)書(shū)到AI有聲書(shū)的一站式輸出。由此可見(jiàn),依托AIGC技術(shù)優(yōu)勢(shì),生成式出版在某種程度上已經(jīng)具備了流程再造和自主運(yùn)行能力,其較傳統(tǒng)出版業(yè)態(tài)不僅能達(dá)到降本增效的目的,還能在大幅釋放出版生產(chǎn)力和內(nèi)容價(jià)值的同時(shí),將從業(yè)人員從煩瑣、機(jī)械的工作流程中解放出來(lái),去從事更具挑戰(zhàn)性和創(chuàng)造意義的工作,以此開(kāi)啟行業(yè)的“第二增長(zhǎng)曲線”。
4.個(gè)性化用戶服務(wù)
從用戶服務(wù)來(lái)看,個(gè)性化是生成式出版的又一重要特征。以往的出版業(yè)態(tài)多是出版機(jī)構(gòu)單向進(jìn)行內(nèi)容輸出或知識(shí)傳播,雖有不同的用戶群體定位,但仍較難實(shí)現(xiàn)“千人千面”的個(gè)性化服務(wù)目標(biāo)。在AIGC賦能作用下,生成式出版憑借多模態(tài)內(nèi)容輸出和及時(shí)交互優(yōu)勢(shì),打造的產(chǎn)品不再是單純的圖書(shū)、數(shù)字閱讀物,而是多元內(nèi)容平臺(tái),可供讀者用戶自行檢索并精準(zhǔn)生成其所需的內(nèi)容,從而實(shí)現(xiàn)“千人千面”的個(gè)性化服務(wù)目標(biāo)。2023年10月,喜馬拉雅珠峰實(shí)驗(yàn)室與西北工業(yè)大學(xué)aslp lab合作研發(fā)的珠峰語(yǔ)音生成式技術(shù)正式亮相2023云棲大會(huì),并成功應(yīng)用于喜馬拉雅APP的“爸媽講故事”功能板塊。該技術(shù)具備快速實(shí)現(xiàn)語(yǔ)音音色和風(fēng)格定制功能,同時(shí)支持豐富場(chǎng)景下的實(shí)時(shí)轉(zhuǎn)換,用戶僅需簡(jiǎn)單錄制5段文本交由系統(tǒng)進(jìn)行AI模型訓(xùn)練并定制聲音,便可在海量中外名著、偵探故事、詩(shī)詞國(guó)學(xué)、童話寓言等有聲出版資源的閱讀過(guò)程中充分享受親子共讀的個(gè)性化服務(wù)體驗(yàn)。隨著AIGC技術(shù)進(jìn)一步強(qiáng)化和完善,生成式出版在按需定制、個(gè)性化服務(wù)等方面發(fā)展前景非??捎^,將給讀者帶來(lái)前所未有的體驗(yàn)。
二、生成式出版的實(shí)踐進(jìn)路
生成式出版雖未大規(guī)模落地應(yīng)用,但已成為國(guó)內(nèi)外眾多機(jī)構(gòu)、平臺(tái)新的競(jìng)爭(zhēng)賽道和布局重點(diǎn)。根據(jù)國(guó)內(nèi)外部分出版機(jī)構(gòu)、內(nèi)容平臺(tái)、網(wǎng)絡(luò)企業(yè)等已有實(shí)踐來(lái)看,生成式出版正邁向垂直細(xì)分領(lǐng)域,是新時(shí)代內(nèi)容行業(yè)轉(zhuǎn)型升級(jí)和高質(zhì)量發(fā)展的新驅(qū)動(dòng)。因此,本文總結(jié)已有成功經(jīng)驗(yàn),為更多出版機(jī)構(gòu)進(jìn)入新技術(shù)領(lǐng)域和新發(fā)展階段提供路徑選擇和實(shí)踐參考,以實(shí)現(xiàn)“科技賦能出版”的目標(biāo)。
1.基于生產(chǎn)可供性的生成式出版實(shí)踐進(jìn)路
生產(chǎn)可供性包括專業(yè)出版商信息生產(chǎn)的主體性和大眾讀者群體信息生產(chǎn)的能動(dòng)性兩方面。截至2023年底,AIGC賦能的生成式出版已經(jīng)成為行業(yè)布局重點(diǎn),盡管這一新興業(yè)態(tài)具有開(kāi)放性內(nèi)容生產(chǎn)、低成本高效率、一站式出版流程以及個(gè)性化用戶服務(wù)等優(yōu)勢(shì),但也有觀點(diǎn)表明,技術(shù)可能造成“恐怖谷效應(yīng)”“數(shù)字極簡(jiǎn)主義心理”等問(wèn)題。因此,從生產(chǎn)可供性角度推動(dòng)生成式出版落地發(fā)展,成為不少出版機(jī)構(gòu)、內(nèi)容平臺(tái)、傳媒企業(yè)的首要選擇。
從專業(yè)出版商信息生產(chǎn)維度來(lái)看,生成式出版具有傳統(tǒng)出版難以匹敵的生產(chǎn)能力和規(guī)模效應(yīng),能最大限度地實(shí)現(xiàn)降本增效的目的。但是,規(guī)?;a(chǎn)也容易導(dǎo)致讀者群體對(duì)生成式出版產(chǎn)品的質(zhì)疑,如質(zhì)量能否得到保證、隱私安全問(wèn)題如何解決等。為打破用戶市場(chǎng)的刻板印象,一些專業(yè)出版商付出巨大努力,基于專業(yè)大模型建設(shè)、內(nèi)容資源專業(yè)性與權(quán)威性保障、個(gè)性化服務(wù)成效等考量,啟動(dòng)生成式出版業(yè)務(wù)布局。例如,在2023年9月舉辦的第十三屆中國(guó)數(shù)字出版博覽會(huì)上,中國(guó)新聞出版研究院、北京版上閱動(dòng)科技公司聯(lián)合推出“版閱AI內(nèi)容服務(wù)平臺(tái)”,該平臺(tái)以大語(yǔ)言模型在新聞出版行業(yè)垂直領(lǐng)域的深度應(yīng)用為目標(biāo),以智譜AI自主研發(fā)的GLM-130B大模型為支撐,以中國(guó)新聞出版研究院權(quán)威的基礎(chǔ)研究數(shù)據(jù)為保障,為行業(yè)提供智能、安全、可靠的審校服務(wù)、對(duì)話式AI應(yīng)用以及綜合解決方案,這可視作生成式出版落地應(yīng)用的基礎(chǔ)性嘗試。
從讀者群體信息生產(chǎn)維度來(lái)看,生成式出版具有個(gè)性化服務(wù)優(yōu)勢(shì)和即時(shí)交互特性,能給讀者帶來(lái)前所未有的閱讀服務(wù)體驗(yàn)。因此,以“受眾即市場(chǎng)”為核心追求,將讀者群體的主觀能動(dòng)性納入生成式出版的內(nèi)容生產(chǎn)維度,也是行業(yè)布局與實(shí)踐的重點(diǎn),這在一些內(nèi)容平臺(tái)上表現(xiàn)得尤為明顯。例如,喜馬拉雅APP“爸媽講故事”功能板塊創(chuàng)造性地運(yùn)用珠峰語(yǔ)音生成式技術(shù),利用聽(tīng)眾讀者提供的語(yǔ)音數(shù)據(jù)樣本,為他們量身定制個(gè)性化閱讀方案。為進(jìn)一步增強(qiáng)生成式出版的內(nèi)容互動(dòng)性和用戶體驗(yàn)感,有聲閱讀平臺(tái)“云聽(tīng)”利用AIGC技術(shù)賦能,在聲音出版領(lǐng)域開(kāi)創(chuàng)諸多新玩法,如聯(lián)合農(nóng)業(yè)農(nóng)村節(jié)目中心成功打造集線上聲音采集、用戶互動(dòng)、數(shù)據(jù)可視于一體的科文融合產(chǎn)品——“鄉(xiāng)音博物館”,推出粵、湘、吳等7大語(yǔ)言館,為AIGC時(shí)代的有聲出版發(fā)展提供諸多經(jīng)驗(yàn)啟示。不可忽視的是,無(wú)論是AIGC技術(shù)的發(fā)展程度,還是生成式出版的實(shí)踐應(yīng)用,仍處于初步探索階段,包括專業(yè)出版社、內(nèi)容平臺(tái)等在內(nèi)的行業(yè)機(jī)構(gòu)獲得的實(shí)踐經(jīng)驗(yàn)較有限,面向讀者群體所提供的內(nèi)容服務(wù)和閱讀體驗(yàn)還不足以完全釋放其主觀能動(dòng)性,未來(lái)仍需不斷優(yōu)化和調(diào)整。
2.基于行動(dòng)者網(wǎng)絡(luò)的生成式出版實(shí)踐進(jìn)路
生成式出版從理論到實(shí)踐需要資源、技術(shù)等要素配合,僅靠行業(yè)內(nèi)部驅(qū)動(dòng)難以達(dá)到理想目的,唯有集聚多元行動(dòng)主體的有效力量,才能實(shí)現(xiàn)預(yù)期目標(biāo)。
首先,行業(yè)內(nèi)部合作實(shí)踐,包括出版社與出版社、出版社與內(nèi)容平臺(tái)之間的協(xié)同發(fā)展,聯(lián)合布局生成式出版業(yè)務(wù)領(lǐng)域。例如,入選2023年度出版融合發(fā)展工程名單的“好好嘮科——少兒科普知識(shí)服務(wù)平臺(tái)”項(xiàng)目便由數(shù)傳集團(tuán)與吉林科學(xué)技術(shù)出版社攜手打造。該平臺(tái)主要以數(shù)智技術(shù)為依托,依托專業(yè)出版機(jī)構(gòu)海量的內(nèi)容資源優(yōu)勢(shì),為新時(shí)代的青少年群體提供多元科普百科知識(shí)。以猿輔導(dǎo)為代表的在線教育公司自成立圖書(shū)業(yè)務(wù)線后,與新華出版社、華東理工大學(xué)出版社等多家教育出版機(jī)構(gòu)達(dá)成了戰(zhàn)略合作協(xié)議,目前已推出新一代智能教輔產(chǎn)品《我們的語(yǔ)文》等。華東理工大學(xué)出版社副社長(zhǎng)王雪表示,未來(lái)出版社將在內(nèi)容研究和市場(chǎng)拓展方面繼續(xù)發(fā)揮自身優(yōu)勢(shì),同時(shí)結(jié)合猿輔導(dǎo)在內(nèi)容研發(fā)和技術(shù)賦能教育方面的強(qiáng)大能力,加快教育出版數(shù)字化乃至智能化的發(fā)展速度[1]。
在生成式出版業(yè)務(wù)布局的當(dāng)下,傳統(tǒng)出版社與新興內(nèi)容企業(yè)攜手合作的案例不斷增多,這在教育出版領(lǐng)域尤為明顯:日新月異的技術(shù)發(fā)展和線上教育的旺盛需求,使得智慧教育出版不斷提速,傳統(tǒng)出版社尤其是中小型出版社由于自身技術(shù)短板和成本限制,必然要積極尋求外力援助,而內(nèi)容企業(yè)尤其是在線教育企業(yè)本就具有技術(shù)優(yōu)勢(shì),加上與出版社合作歷史悠久,自然成為生成式出版業(yè)務(wù)落地的主要實(shí)踐進(jìn)路。
其次,行業(yè)外部合作實(shí)踐,具體是指出版機(jī)構(gòu)、高校以及技術(shù)企業(yè)之間就生成式出版業(yè)務(wù)建立跨界合作和協(xié)同發(fā)展關(guān)系。2023年2月,人民交通出版社宣布將接入百度“文心一言”,成為其首批生態(tài)合作伙伴,旨在通過(guò)與頭部科技公司開(kāi)展戰(zhàn)略合作,將AIGC及智能對(duì)話技術(shù)成果創(chuàng)造性應(yīng)用于專業(yè)出版領(lǐng)域,為生成式出版的實(shí)踐落地和快速發(fā)展提供助力。目前,百度“文心一言”已經(jīng)與人民交通出版社、上海辭書(shū)出版社、四川人民出版社、中文在線等出版和文化機(jī)構(gòu)形成合作關(guān)系,是生成式出版從理論走向?qū)嵺`的重要助力。
為進(jìn)一步強(qiáng)化技術(shù)適配性,加快生成式出版的實(shí)踐應(yīng)用速度,一些出版機(jī)構(gòu)與技術(shù)公司、高校達(dá)成合作關(guān)系,旨在以“資源+技術(shù)+人才”的多主體協(xié)同模式助力生成式出版落地發(fā)展。2023年8月,高等教育出版社發(fā)布與浙江大學(xué)、阿里云和華院計(jì)算等單位共同研制,面向教育出版領(lǐng)域的垂直大模型“智?!と龢?lè)”,該模型以阿里云通義千問(wèn)70億參數(shù)通用模型為基座,利用出版社與高校的核心教材、學(xué)術(shù)資源等高質(zhì)量語(yǔ)料和專業(yè)指令數(shù)據(jù)集,建成專注于“人工智能+教育出版”領(lǐng)域的專業(yè)系統(tǒng),從而為教育出版領(lǐng)域的現(xiàn)實(shí)需求提供優(yōu)質(zhì)而高效的技術(shù)解決方案。此外,中華書(shū)局古聯(lián)公司與南京農(nóng)業(yè)大學(xué)信息管理學(xué)院于2023年內(nèi)聯(lián)合研發(fā)“荀子”古籍大語(yǔ)言模型;中信集團(tuán)自2023年5月成立平行出版實(shí)驗(yàn)室后,開(kāi)始嘗試與作者和大模型技術(shù)公司合作進(jìn)行語(yǔ)言訓(xùn)練,開(kāi)發(fā)智能閱讀應(yīng)用產(chǎn)品;中國(guó)知網(wǎng)于2023年9月發(fā)布出版?zhèn)髅叫袠I(yè)大模型和文化遺產(chǎn)大模型,同時(shí)推出AIGC檢測(cè)服務(wù)系統(tǒng),為出版?zhèn)髅叫袠I(yè)提供AI選題策劃、AI增強(qiáng)檢索等各類應(yīng)用工具。上述行業(yè)實(shí)踐表明,隨著多主體行動(dòng)網(wǎng)絡(luò)的形成,生成式出版不僅進(jìn)入實(shí)踐應(yīng)用階段,還向古籍出版、數(shù)據(jù)服務(wù)等行業(yè)細(xì)分領(lǐng)域滲透??梢?jiàn),跨界合作不僅是生成式出版落地實(shí)踐的重要進(jìn)路,也是出版業(yè)深度融合的有效手段。
三、生成式出版的發(fā)展反思
在生成式出版落地實(shí)踐的發(fā)展背景下,我們既要看到高新技術(shù)賦能出版轉(zhuǎn)型升級(jí)的利好機(jī)遇,也要警惕這些技術(shù)可能造成的現(xiàn)實(shí)危機(jī)。作為一種新興出版業(yè)態(tài),生成式出版極可能助力行業(yè)邁入轉(zhuǎn)型升級(jí)的新階段,但同時(shí)也可能引發(fā)諸多新問(wèn)題,帶來(lái)諸多新挑戰(zhàn),為此我們必須作出反思。
1.技術(shù)層面——警惕技術(shù)濫用
AIGC雖能強(qiáng)勢(shì)賦能生成式出版落地應(yīng)用,但也極易導(dǎo)致技術(shù)濫用現(xiàn)象。其一,過(guò)度依賴技術(shù)賦能和算法賦值,導(dǎo)致生成式出版內(nèi)容的真實(shí)性、權(quán)威性較難得到保障。自2023年初以來(lái),《紐約時(shí)報(bào)》等多家外媒多次報(bào)道,AI生成的書(shū)籍正大量充斥于亞馬遜等電商平臺(tái),這些書(shū)籍涉及范圍較廣,且部分內(nèi)容存在“某些錯(cuò)誤信息”。其二,技術(shù)濫用極易導(dǎo)致敏感信息泄露,由此引發(fā)隱私安全問(wèn)題。當(dāng)生成式出版投入使用并與讀者用戶交互,出于獲取精準(zhǔn)用戶畫(huà)像的目的,其往往會(huì)收集、存儲(chǔ)并分析用戶數(shù)據(jù),這可能危及用戶隱私安全,甚至成為生成式出版大規(guī)模普及應(yīng)用的威脅。
對(duì)此,一方面,國(guó)家及行業(yè)相關(guān)部門應(yīng)制定技術(shù)應(yīng)用標(biāo)準(zhǔn)和法律規(guī)范,在鼓勵(lì)行業(yè)技術(shù)創(chuàng)新應(yīng)用的同時(shí),合理預(yù)防和及時(shí)治理生成式出版領(lǐng)域的技術(shù)濫用現(xiàn)象。例如,相關(guān)立法部門可在《中華人民共和國(guó)民法典》《中華人民共和國(guó)個(gè)人信息保護(hù)法》的現(xiàn)行條款里合理納入《生成式人工智能服務(wù)管理暫行辦法》等內(nèi)容,就AIGC技術(shù)應(yīng)用場(chǎng)景、范圍、服務(wù)內(nèi)容等作出細(xì)化規(guī)定,為行業(yè)提供實(shí)踐準(zhǔn)則,避免技術(shù)濫用導(dǎo)致虛假出版等問(wèn)題。出版機(jī)構(gòu)、內(nèi)容平臺(tái)、傳媒企業(yè)等部門需要在《出版業(yè)生成式人工智能技術(shù)應(yīng)用指南》的基礎(chǔ)上進(jìn)一步完善行業(yè)技術(shù)應(yīng)用細(xì)則,確保生成式出版商及相關(guān)服務(wù)商在資源爬取與訓(xùn)練、內(nèi)容生成與公開(kāi)、信息存儲(chǔ)與分析等實(shí)踐過(guò)程中不濫用算法技術(shù)并做到全程可控。
另一方面,相關(guān)技術(shù)商和出版方應(yīng)遵循“技術(shù)規(guī)制技術(shù)”的發(fā)展原則,研發(fā)更高級(jí)、更敏感的技術(shù)解決方案,為生成式出版的實(shí)踐應(yīng)用和長(zhǎng)效發(fā)展保駕護(hù)航。正如人民教育出版社編輯楊凡所言,通過(guò)模型優(yōu)化訓(xùn)練的方式防止再次生成虛假不實(shí)的內(nèi)容雖然通過(guò)一般技術(shù)難以實(shí)現(xiàn),但利用價(jià)值對(duì)齊的算法、采取內(nèi)容過(guò)濾等措施或可實(shí)現(xiàn)[2]。未來(lái)在生成式出版發(fā)展過(guò)程中,出版機(jī)構(gòu)和技術(shù)商應(yīng)針對(duì)技術(shù)濫用可能導(dǎo)致的出版內(nèi)容不實(shí)和隱私安全問(wèn)題聯(lián)合開(kāi)發(fā)更先進(jìn)、高效的智能應(yīng)用工具,制定更科學(xué)的解決方案。
2.行業(yè)層面——規(guī)避侵權(quán)危機(jī)
生成式出版可能造成的內(nèi)容侵權(quán)問(wèn)題亟須重視和解決。生成式人工智能技術(shù)強(qiáng)大的數(shù)據(jù)爬取能力和內(nèi)容生成能力,加之TOC模式帶來(lái)的巨大傳播效應(yīng),極易造成內(nèi)容侵權(quán)危機(jī)。2023年7月,8500多名海外文學(xué)作家聯(lián)合發(fā)表《致生成式人工智能領(lǐng)導(dǎo)者的公開(kāi)信》,并呼吁OpenAI、Meta、Microsoft等技術(shù)研發(fā)商的首席執(zhí)行官在AI內(nèi)容生成領(lǐng)域就版權(quán)保護(hù)問(wèn)題征得所有權(quán)人同意并給予補(bǔ)償。生成式出版主要通過(guò)大量已出版作品訓(xùn)練和生成“新內(nèi)容”,極易出現(xiàn)版權(quán)侵權(quán)問(wèn)題,而當(dāng)存在侵權(quán)問(wèn)題的生成式出版物大量流入市場(chǎng),不僅會(huì)侵害原作者和著作權(quán)人的合法權(quán)益,也會(huì)侵害讀者用戶的知情權(quán),同時(shí)還可能因?yàn)橥|(zhì)化內(nèi)容競(jìng)爭(zhēng)導(dǎo)致“劣幣驅(qū)逐良幣”的現(xiàn)象頻繁發(fā)生。據(jù)《紐約時(shí)報(bào)》和彭博社的一項(xiàng)媒體采訪結(jié)果,不少新聞出版機(jī)構(gòu)的高管表示,以生成式人工智能技術(shù)為代表的AIGC機(jī)制會(huì)顛覆行業(yè)已有運(yùn)行模式,讀者受眾的注意力將被不斷稀釋和轉(zhuǎn)移,而這也容易導(dǎo)致出版機(jī)構(gòu)的市場(chǎng)體量和用戶規(guī)模大幅減少,甚至引發(fā)生存危機(jī)。
針對(duì)上述問(wèn)題,可從以下幾個(gè)方面著手解決。
一是建立行業(yè)聯(lián)盟并制定監(jiān)管原則。目前,以《紐約時(shí)報(bào)》為代表的全球2000多家媒體、出版機(jī)構(gòu)已經(jīng)組成發(fā)展聯(lián)盟并發(fā)布相關(guān)草案,加大版權(quán)保護(hù)力度。據(jù)已披露的草案內(nèi)容,該聯(lián)盟強(qiáng)烈呼吁科技公司為高質(zhì)量、值得信賴的專業(yè)內(nèi)容付費(fèi)。2023年6月,中國(guó)工人出版社、同方知網(wǎng)、中文在線等26家業(yè)界單位共同發(fā)布國(guó)內(nèi)首個(gè)有關(guān)AIGC訓(xùn)練數(shù)據(jù)版權(quán)的倡議書(shū),旨在通過(guò)行業(yè)聯(lián)盟喚醒國(guó)內(nèi)AI企業(yè)關(guān)于大模型訓(xùn)練數(shù)據(jù)的版權(quán)意識(shí),并為AIGC研發(fā)者規(guī)避版權(quán)爭(zhēng)議提供方向性指引。不僅如此,行業(yè)聯(lián)盟還有利于攜手共建專注于出版業(yè)的資源庫(kù)和大模型,在強(qiáng)化版權(quán)保護(hù)力度的同時(shí),以互利共贏為基礎(chǔ)進(jìn)一步釋放版權(quán)價(jià)值效益,利用高質(zhì)量出版資源的共建共享,有效避免生成式出版可能出現(xiàn)的內(nèi)容不實(shí)、非法傳播等問(wèn)題。值得一提的是,在生成式出版模型建立過(guò)程中,無(wú)論出版機(jī)構(gòu)、內(nèi)容平臺(tái),還是技術(shù)商、服務(wù)商,都應(yīng)明確標(biāo)注內(nèi)容來(lái)源,以此保護(hù)版權(quán)方和讀者用戶權(quán)益。
二是深化與第三方技術(shù)供應(yīng)商的合作力度,通過(guò)引入智能審核工具和智慧解決方案,及時(shí)發(fā)現(xiàn)、認(rèn)定和處理內(nèi)容侵權(quán)問(wèn)題,保障版權(quán)所有者的合法權(quán)益。例如,清華大學(xué)人工智能研究院發(fā)起成立的瑞萊智慧(RealAI)便是全球?yàn)閿?shù)不多、專為生成式內(nèi)容檢測(cè)以及給大模型安全系統(tǒng)“挑刺”的人工智能產(chǎn)品。出版機(jī)構(gòu)、內(nèi)容平臺(tái)等在嘗試建立生成式出版業(yè)務(wù)線的同時(shí),可與此類企業(yè)合作,針對(duì)行業(yè)現(xiàn)實(shí)需要聯(lián)合開(kāi)發(fā)先進(jìn)、高效的AI出版技術(shù)應(yīng)用工具,為預(yù)防和解決生成內(nèi)容侵權(quán)問(wèn)題提供有效支撐,確保行業(yè)及市場(chǎng)的長(zhǎng)效發(fā)展和良好運(yùn)行。
|參考文獻(xiàn)|
[1]繆晨霞,賈寧. 繼續(xù)探索圖書(shū)領(lǐng)域,猿輔導(dǎo)與多家出版社簽訂戰(zhàn)略協(xié)議[N]. 新京報(bào),2023-09-03.
[2]楊凡. AI時(shí)代的教育出版研究:以生成式AI為技術(shù)驅(qū)動(dòng)力[J]. 出版廣角,2023(16):27-31.