常莽
2021年以來,由AI續(xù)寫故事作為文本的視頻在B站悄然流行開來,一些UP主利用市面上的AI創(chuàng)作續(xù)寫人們熟知的文學(xué)作品,再將新的作品以人聲演繹,配上BGM后制成視頻。
經(jīng)過AI的一頓操作,名著成了爆款爽文,前有諸葛亮開戰(zhàn)斗機,后有莊子研究“三體”,各種平行世界信手拈來,AI一本正經(jīng)胡說八道的本事,比過去的地攤文學(xué)還強。
其實,對于相關(guān)工具的使用者而言,用AI進行創(chuàng)作并沒有技術(shù)門檻:只需輸入文學(xué)作品的某些片段,AI創(chuàng)作機器就會根據(jù)給定文字的內(nèi)容與風(fēng)格對故事進行續(xù)寫,這些經(jīng)過AI二次創(chuàng)作的故事,往往情節(jié)曲折離奇,與原作的走向大相徑庭,這種內(nèi)容因為反常規(guī)和新鮮感而受到一些網(wǎng)民的追捧。
不過話說回來,藝術(shù)創(chuàng)作這種高度創(chuàng)意化、個性化的工作,原本被視為“人類的最后一片凈土”,是理論上最不可能被人工智能取代的工作之一,可如今人工智能技術(shù)的發(fā)展卻為藝術(shù)創(chuàng)作開辟了一條新的捷徑。
AI寫作
AI創(chuàng)作也就是機器人寫作,這是一種擬人化的說法,實質(zhì)上是指通過一定的計算機程序,對輸入的信息進行自動化的分析、處理和加工,從而生成一篇較為完整的文章。總的來說,今天流行的AI續(xù)寫,其實已經(jīng)算是比較成熟的能力。
隨著人工智能技術(shù)的快速發(fā)展,自然語言生成(natural language generation, NLG)技術(shù)在世界范圍內(nèi)得到廣泛的應(yīng)用。《紐約時報》和美聯(lián)社等新聞機構(gòu)都曾采用NLG技術(shù)來撰寫新聞報道;僅在2014年,技術(shù)公司Automated Insights就實現(xiàn)了以每秒超過2 000篇的速度生成新聞報道,全年發(fā)布新聞共計10億多篇。
AI寫作背后的原理非常復(fù)雜,核心是自然語言處理(natural language processing, NLP)技術(shù),同時涉及到數(shù)據(jù)挖掘、機器學(xué)習(xí)、知識圖譜等多項人工智能技術(shù)。自然語言處理是指讓機器擁有理解并解釋人類語言的能力,目標是讓機器在理解語言上像人類一樣智能,最終彌補人類交流(自然語言)和計算機理解(機器語言)之間的差距。
NLP涉及2個流程,分別是自然語言理解(natural language understanding,NLU)和自然語言生成(NLG)。市面上的寫稿機器人大都是NLG系統(tǒng),目前主要有模板式、抽取式和生成式3種技術(shù)方向。
模板式寫稿機器人主要通過優(yōu)化算法,在預(yù)先存儲的大量寫作模板中,選擇與給定材料相匹配的模板,將信息加以組合生成文本,是目前應(yīng)用最成熟、實現(xiàn)最容易的一種機器寫作方法。
抽取式機器人會對文本進行語義分析,識別冗余信息,抽取重要內(nèi)容,通過摘錄或概括的方法壓縮文本,形成對于既定文字的摘要,再加以計算確保文摘的連續(xù)性,這種技術(shù)廣泛應(yīng)用于新聞內(nèi)容概括和文摘生成。
生成式NLG主要通過深度學(xué)習(xí)和增強學(xué)習(xí)技術(shù)來實現(xiàn),機器通過大量的文學(xué)作品樣本進行訓(xùn)練,學(xué)習(xí)各類寫作風(fēng)格、建立寫作模型,再根據(jù)輸入的文字片段獲知任務(wù)需求,預(yù)測并生成與需求相匹配的文稿,進行輸出。
從現(xiàn)階段來看,模板式和抽取式寫稿機器人的技術(shù)已經(jīng)趨于成熟,在市場上得到了廣泛的應(yīng)用。生成式NLG技術(shù)更加智能,也是當前NLG技術(shù)中更為高級的目標,OpenAI等研究機構(gòu)在這方面做出了嘗試,并在市場上得到了應(yīng)用。
AI寫稿工具人
AI寫作在當今社會早已不是什么新鮮事,早在2011年,《洛杉磯時報》就開始研發(fā)面向地震領(lǐng)域的自動化新聞生成機器人Quakebot。2013年3月,Quakebot因率先報道南加州發(fā)生的4.4級地震引發(fā)關(guān)注,2014年3月,美國洛杉磯發(fā)生4.4級地震,Quakebot用時3分鐘就完成了相關(guān)報道的寫作和發(fā)布。同年7月,美聯(lián)社引進Automated Insights公司開發(fā)的新聞寫作機器人,開始使用自動生成新聞技術(shù)。此后,《紐約時報》《華盛頓郵報》《衛(wèi)報》和路透社等媒體都走上了自動化新聞發(fā)展的道路。
國內(nèi)在自動化新聞領(lǐng)域也有許多嘗試:2016年5月,四川綿陽發(fā)生4.3級地震,中國地震臺網(wǎng)研發(fā)的地震信息播報機器人用6 s寫下560字的速報,報道內(nèi)容翔實;2017年8月,該機器人在第一時間報道了四川阿壩州九寨溝縣的7.0級地震,引發(fā)廣泛的討論和關(guān)注。這條新聞消息約540字,新聞涵蓋了速報參數(shù)、震中地形、熱力人口、周邊村鎮(zhèn)、周邊縣區(qū)、歷史地震、震中簡介以及震中天氣8個方面的內(nèi)容,并配有5張圖片,用時僅25 s。在此后的余震報道中,新聞機器人最快出稿速度僅有5 s。
除了新聞報道以外,AI寫作也在其他文字創(chuàng)作場景得到了廣泛的應(yīng)用。目前,無需人工干預(yù)的機器人寫作可以生成詩歌、廣告、各類行業(yè)分析報告、歌詞、小說甚至劇本。
以詩歌為例,微軟研發(fā)的機器人小冰于2017年出版了詩集《陽光失了玻璃窗》,這是歷史上第一部人工智能詩集,其中包含139首現(xiàn)代詩。
諸如“快把光明的燈擎起來了/那里有美麗的天/問著村里的水流的聲音/我的愛人在哪/因為我的紅燈是這樣的幻變/像是美麗的秘密/她是一個小孩子的歌唱/那時間的距離”等華麗辭藻還頗具美感,只是在邏輯性上有所欠缺。除了現(xiàn)代詩,律詩、藏頭詩、詞等各種風(fēng)格的詩歌創(chuàng)作軟件已然在市場上層出不窮。
相比于新聞,故事、小說等連續(xù)語義的創(chuàng)作會更加困難,但這些也早已不是難題。早在2016年的倫敦科幻電影節(jié)上,紐約大學(xué)研究人員開發(fā)的機器人Benjamin創(chuàng)作了一部長達9 min的科幻電影Sunspring,贏得了大批關(guān)注;MIT媒體實驗室開發(fā)的機器人Shelly專職撰寫恐怖故事,并在Twitter更新;Botnik研究室采用預(yù)測的算法創(chuàng)作了《哈利波特》的續(xù)集。
除了寫稿,AI創(chuàng)作還有其他形式
當AI創(chuàng)作技術(shù)應(yīng)用于寫稿,可以誕生機器版的記者、小說家、詩人和編劇等,而當它應(yīng)用于繪畫、音樂和舞蹈領(lǐng)域時,則可以“培養(yǎng)”出畫家、作曲家和編舞人員。
AI繪畫創(chuàng)作大放異彩
利用機器繪畫早已寫入了人類的夢想清單:早在18世紀70年代,瑞士已經(jīng)有人利用機械臂繪畫;2016年,谷歌研發(fā)的繪畫AI在舊金山拍賣會上大放異彩,作品一度拍出單幅8000美元的高價;2019年,微軟小冰獨立完成的原創(chuàng)繪畫作品在中央美術(shù)學(xué)院美術(shù)館展出,并于2020年推出個人繪畫作品集。
AI音樂創(chuàng)作譜寫別樣樂章
AI在音樂創(chuàng)作中的應(yīng)用比比皆是:2016年,索尼公司計算機科學(xué)實驗室CSL的DeepBach項目仿照巴赫的風(fēng)格創(chuàng)作的合唱曲目,被專業(yè)音樂家誤認為是巴赫的作品。
除了譜曲,AI還可以創(chuàng)作并唱出聲音的歌曲,CSL實驗室的機器人Flow Machine模仿披頭士的風(fēng)格,自主創(chuàng)作了歌曲Daddys car。法國計算機科學(xué)家Pierre Barreau創(chuàng)造的作曲AI應(yīng)用Aiva可以根據(jù)需求創(chuàng)作不同風(fēng)格的音樂,甚至可以根據(jù)圖畫作曲,Aiva也于2017年成為“法國及盧森堡作曲家協(xié)會(SACEM)”的首個非人類會員。
AI舞蹈創(chuàng)作演繹非凡舞曲
有不少團隊開發(fā)了舞蹈創(chuàng)作類的AI:谷歌研究院建立了名為AIST++的3D舞蹈動作數(shù)據(jù)集,據(jù)此訓(xùn)練的AI能夠根據(jù)給定的音樂和一段2秒左右的種子動作生成長序列逼真的3D動作。
目前已有的舞蹈創(chuàng)作AI基本都能根據(jù)目標音樂生成與之匹配的舞蹈動作,并通過3D建模的方式將舞蹈進行表演。經(jīng)過模型構(gòu)建方法的迭代升級,AI生成的3D舞蹈在動作質(zhì)量、動作多樣性和動作與音樂的相關(guān)性方面均有不錯的表現(xiàn)。
OpenAI公司最新推出的GPT-3模型,開放了API服務(wù),申請者可以調(diào)用GPT-3的API,將其進一步開發(fā)為論文翻譯工具、網(wǎng)頁生成工具、前端設(shè)計器、聊天機器人甚至游戲開發(fā)工具。在GPT-3的身上,可以看到AI從某一個領(lǐng)域的創(chuàng)作者成為各方面兼修全才的可能性。
AI作為內(nèi)容生產(chǎn)者還有哪些缺陷
AI創(chuàng)作固然強大,但要想做到大規(guī)模的普及和落地,尚有一些問題橫于面前。
首先就是AI的價值判斷問題。機器學(xué)習(xí)只是提取訓(xùn)練集數(shù)據(jù)的風(fēng)格特征,并對這種加以模仿,機器看似具有“學(xué)習(xí)”功能,實質(zhì)上仍落入了按圖索驥的窠穴。
AI本身對文本創(chuàng)作并沒有價值判斷,所以在AI生成的故事當中,可以讀到諷齊王納諫的鄒忌為了保住權(quán)勢富貴而出賣小妾,讀到為孩子買橘子的父親在月臺摔倒……這些離奇的情節(jié)不僅與邏輯不符,對正常的價值導(dǎo)向也難以判定。如果訓(xùn)練內(nèi)容存在問題,或者某些用戶輸入時刻意引導(dǎo),AI生成的內(nèi)容在倫理道德方面的處境更會雪上加霜。
其次是AI創(chuàng)作的版權(quán)問題。在當前技術(shù)框架下,AI的訓(xùn)練效果在很大程度上取決于語料庫,沒有足夠量的語料庫,AI便無法進行學(xué)習(xí),更無法進行創(chuàng)作。
那么AI產(chǎn)出的作品該歸語料的作者還是歸AI的創(chuàng)作者所有呢?如果歸語料作者所有,那么又如何為龐大的網(wǎng)絡(luò)語料資源劃定作者呢?如果歸創(chuàng)作者所有,又能否將使用了相同技術(shù)線路和算法的創(chuàng)作者視為抄襲?這些問題仍然需要法理和倫理上的探討。
最后便是AI使用者的問題。
AI為內(nèi)容創(chuàng)作提供了一種更加輕松、便利的可能性,但在一些別有用心的人眼中,AI成為了助長抄襲的洗稿工具:輸入一段語句,AI就會對語言結(jié)構(gòu)進行重組,對關(guān)鍵詞加以替換,從而在短時間內(nèi)復(fù)制網(wǎng)絡(luò)爆文……技術(shù)雖為中立,但不良的使用意圖讓技術(shù)成為了幫兇。
自AI誕生之日起,有關(guān)于AI取代人工的憂慮便不絕于耳。顯然,由AI續(xù)寫的故事內(nèi)容雖然有點不靠譜,但終究還是能滿足一部分人的內(nèi)容消費需求,甚至有走紅的潛質(zhì)。至于智能機器與內(nèi)容創(chuàng)作者的關(guān)系,終歸還是會走向人機協(xié)作、共生共進,而不是相互取代、零和博弈。