郭小平 段琳杉
人工智能普及應用的加速,正深刻改變著我們的社會形態與媒體生態。其中,生成式人工智能或智能生成內容(Artificial Intelligence Generated Content,簡稱AIGC)作為人工智能在傳播行業中的代表,正逐漸貫穿于傳媒傳播產業的各個層面,帶來了一系列重大的變革和挑戰。
“技術就其本身而言,并未決定歷史演變與社會變遷,技術(或缺少技術)卻體現了社會自我轉化的能力。”[1]智能技術的應用已經成為媒體產業的一大趨勢,每一次的技術變革都將帶來一次系統重構。自然語言處理技術(NLP)和人工智能技術(AI)的發展,為傳媒產業帶來了新的機遇和挑戰。目前全球擁有生成式AI 初創技術的大型公司有六家,共持有23項生成式AI 模型,主要包括如下幾個類別:文本生成圖像、文本生成視頻、文本生成音頻、文本生成代碼、文本生成3D、文本生成知識段、文本到語言的生成、圖像生成文本等。[2]以ChatGPT 為代表的AIGC 正引領著傳媒產業的變革,推動了內容制作、媒介形態等領域的深度創新和發展。
內容制作是傳媒產業的核心。AIGC 以自然語言處理技術和機器學習技術為基礎,通過對海量數據的分析和學習,對傳媒產業的生產模式進行了“格式化”再造。
AIGC 的發展經歷了AI 輔助內容創作、AI 協助內容創作到AI 自主內容創作的演變。[3]就傳媒內容生產而言,AIGC 技術在信息采集、內容產制與創新等環節發揮了“技術賦能”效應。首先,借助語音識別技術快速將語音轉換成文字,提升新聞時效性。2022 年北京冬奧會期間,記者使用科大訊飛的智能錄音筆,實現跨語種的語音轉寫和數分鐘內發稿。其次,基于算法的自動化新聞生產,實現媒體內容生產更快速更準確。再次,智能視頻剪輯提升視頻采編的工作效率。自動生成字幕、視頻錦集、視頻拆條與超分、任務追蹤等智能化剪輯工具,不僅節約成本,還最大化版權價值。北京冬奧會期間,央視運用“AI 智能內容生產剪輯系統”高效生產與發布冬奧項目的視頻集錦。最后,虛擬主播、虛擬偶像、數字員工、虛擬戀人等數字人的誕生,創新了互聯網產品形態。
1.提升新聞生產效率
早期的人工智能技術在介入新聞生產時,由于算法單一,語言學習水平低,只適用于特定題材的新聞寫作,比如高度依靠數據分析、強調時效性的體育賽事、經濟行情等簡訊類的稿件。隨著技術的更新迭代,以ChatGPT 為代表的AIGC 已經突破了簡單的機器人寫作,不再局限于財經、體育等特定領域的程序化寫作,而是對新聞生產模式、生產效率的全方位提升。
AIGC 高效率表現在以下兩方面:
一是文字編輯的高效性。AI 可自動搜集新聞事件的相關數據和敘述,補充“資料庫”,隨后套用模板生成結構化的文本內容。同時,AI 還可以發揮算力優勢,幫助記者對網絡信息追蹤溯源,減少假新聞的出現。比如,路透社推出了監測社交媒體的工具Reuters News Tracer,可幫助記者和編輯監測社交媒體中出現的新聞信源,并給出信息的可信度數值。[4]
二是輔助記者提升素材搜集的能力。ChatGPT剔除了中介信息或冗余信息的干擾,剔除了人類選擇判斷的時間,提高了問題求解的效率,開創了無中介化媒介時代。在ChatGPT 中,用戶通過對話、詢問來獲取答案。媒介不再作為連接信息發出者和接收者的中介,而是作為一個交流主體。ChatGPT 將算法模型的思維能力、決策能力、泛化能力內化為高速的機器處理過程, 為用戶直接提供答案,以更為簡單的邏輯直達用戶與問題。與AI 對話獲取信息的模式,不僅簡化了搜索引擎時代記者獲取信息的步驟,更是對新聞業態的改變,預示著“對話式新聞”時代的到來。[5]
2.生成全新寫作風格
Web2.0 時代,實時、混雜、龐大的傳播行為與正統的、秩序的以及有限的新聞操作相融合,新聞的各種載體形式、內容格式和分發渠道不斷排列組合,新聞業的邊界不斷向外延伸。[6]新聞生產行動者群體的擴充使得新聞的寫作風格迎來了新的生機。“人工智能正在從檢索者、搬運者和呈現者成為創造者(Creator)或合作創造者(Co-creator)。”[7]隨著生成式AI 使用門檻的降低,任何人都可以為媒介機構服務。那些沒有經過新聞專業訓練的人,表現出風格各異的關注點和表達風格,并通過AI 軟件的持續性具身訓練,最終呈現出五花八門的稿件寫作風格,這將徹底顛覆新聞業的教科書模式。有研究者預言,“作為人工智能,ChatGPT 的強大功能基于大量的文本數據不斷進行模型訓練,它不是簡單抄襲他人成果,其‘心智’在訓練中不斷成熟,未來終有一天它會生成風格迥異于人類的作品”[8]。
在傳媒領域,媒介形態的變化一直是人們議論的焦點。通過對內容素材的挖掘和智能分析,AIGC 技術可以為傳媒提供更加豐富、多元和個性化的內容形態和表現形式。綜合來講,AIGC 的產品形態主要包括AI 寫作、AI 剪輯、AI 配音、數字人以及聊天機器人等多種模態。
1.AI 寫作
AI 寫作目前被應用于在線媒體、廣告公司、金融業、智能教育等領域,涉及自動摘要、文本分類和文章創作等多個場景。通過結合大量閱讀文章和語言處理技術上的優勢,AI 可以生成時長較短的簡明清晰的文章摘要,讓讀者在更短的時間內獲取文章的主要內容,提升閱讀速度。此外,AI 可以分析和分類不同的文本,比如識別不同話題的新聞報道和文章摘要,并將它們分配到相應的類別,從而大大提高了媒體從業者的工作效率。
除了以上這些輔助性功能之外,當前的AI 技術已經能夠實現完整且高質量的文章創作。通過與傳感器等技術的結合,寫作機器人可以突破人類記者的生理局限,快速生成各類低創新性的文字,從而使人類將更多精力用于更具創造性的工作。例如,2017 年8 月,九寨溝地震發生18 分鐘后,國家地震臺網的“地震信息播報機器人”僅用時25 秒便完成新聞稿寫作。
2.AI 剪輯
隨著“視覺時代”的到來,AI 在視頻剪輯領域的應用也越發普遍。借助語音識別和自然語言處理技術,ChatGPT 可以自動解析錄制視頻中的內容,并結合用戶所提出的修剪要求,從而實現視頻的自動剪輯。除了自動化的優勢,AI 剪輯還具有剪輯精度高和自適應能力強的特點。一方面,它可以通過語音與視頻雙向交互來深度分析視頻內容,同時還可以區分出語音中的不同情感和語調,從而更好地抓住視頻的重點,剪輯出優質的視頻。另一方面,AI 對人類語言的理解和學習能力強大,使得用戶可以根據個人需求對視頻進行修剪,使視頻具有個性化的特點。
AI 與視頻的結合,不僅體現在輔助剪輯方面,AI 視頻創作也已進入探索期。比如美國流行搖滾樂隊Linkin Park 近期發布的新MV 作品Lost,就是通過AI 視頻網站Kaiber 創作完成。此外,人工智能公司Runway,此前發布的視頻生成產品Gen-1,宣稱可以把視頻轉換成任意風格,后來發布的Gen-2 模型則可用文字生成類似電影預告片的短片。
3.AI 配音
AI 配音指的是使用語音合成技術,利用計算機模擬人類嗓音和自然語言生成語音來完成配音的過程。這種技術可以使音頻制作更加自動化,提高生產效率和降低成本,同時也可以為某些沒有能力發聲的人提供語音服務,例如喉癌患者等。
近年來,隨著技術的不斷進步,AI 配音應用領域不斷擴大,已經被廣泛使用在廣播電視、電子游戲、動畫配音、電視廣告等領域。AI 配音技術的出現在很大程度上可以替代傳統配音的方式,縮短了音頻制作周期,降低了費用,提高了音頻制作效率。然而,AI 配音也存在音色較為單一、語音質量與人類相比還有差距的缺點。而且,一些技術專家和道德學者也對AI 配音作品未來是否會威脅藝術創作的正當地位提出了質疑。因此,AI 的推廣和應用,需要更加注重技術安全、道德問題和用戶體驗的改進。
4.數字人
數字人是一種AIGC 產品,它是通過計算機生成的虛擬形象,具有逼真的人類特征和行為習慣,由計算機圖形學、深度學習、語音合成等技術實現。當下,數字人被廣泛應用于影視制作、虛擬演唱會、游戲等領域,可用于創建虛擬偶像(洛天依、柳夜熙等)、虛擬主播(央視網小C、新華社小諍、湖南衛視小漾等)、虛擬員工(百信銀行AIYA、哈爾濱啤酒哈醬、OPPO 小布等)等。
數字人在媒體領域的廣泛應用,充分釋放了人力資源,通過騰訊智影等數字人制作平臺,媒體僅需上傳少量圖文及音頻素材,即可定制專屬數字人形象,用于虛擬播報、虛擬主持、直播多種場景。隨著算法升級,數字人早已不是簡單地重現或替代真人,而是發揮其算力優勢。全天候工作的數字人,不僅重塑內容生產流程,還可以為用戶提供個性化定制的服務。以騰訊智影的文本配音功能為例,提供了上百種音色選擇,一段1000 字的文稿,2 分鐘內就能完成配音和發布,同時支持多情感和方言播報。
5.聊天機器人
聊天機器人是一種模擬與人類用戶對話的計算機程序,其技術支持包括語音識別、自然語言處理等。按其設計目的劃分,大體上可分為任務導向和關系導向兩種,任務型聊天機器人一般就事實性問題,通過多輪交互幫助用戶實現特定需求,比如語音助手;而關系導向的聊天機器人,比如微軟小冰等,則面向發散領域,通過模仿人類交流方式,來滿足用戶的情感陪伴需求。從20 世紀Eliza 的出現,到2022 年OpenAI 公司發布的新一代聊天機器人ChatGPT,聊天機器人不斷更新迭代,成為人機交往的新范式。
同其他人工智能聊天機器人相比,ChatGPT 呈現出變革性的優越特征:首先,具有“記憶”功能。ChatGPT 能夠使用自然語言同用戶就部分主題展開連續性對話,激發用戶的表達欲,實現人機“意見互擲”模式。其次,較高的對話質量。ChatGPT 搭載了全球互聯網數據,總體上掌握了人類語言表達習慣,能夠更加精確地理解意圖,并根據用戶輸入的語言特點貼近用戶情感,實現高品質的聊天,使其明顯區別于那些話語風格機械、生硬的聊天機器人。再次,強大的自我修正功能。根據用戶的回復,ChatGPT 會對其疑問及不滿進行標注,修改語言系統,為用戶提供令其更滿意的回答。[9]
傳統的內容篩查和審核工作,人力和時間成本高,而且容易出現疏漏和誤判的情況。而AIGC 技術能夠快速準確地對海量內容進行篩查和審核,可以很好地解決這些問題。
一方面,AIGC 技術可以通過語音識別和語義理解,識別、標記和刪除敏感詞匯和暴力內容。比如在謠言識別和洞察方面,人工智能技術通過對信息源和寫作者信息等的整理、分析,可以有效且快速地判斷出其中內容是否為標題黨、虛假信息或者謠言。一旦確認為謠言,人們便可利用AI 的溯源和攔截能力,對其進行徹底追蹤、粉碎和防控。例如在新冠疫情期間,為對付滿天飛的新冠謠言,Facebook 和全世界60 多個事實核查組織合作標記虛假新聞,當用戶分享假新聞時,AI 就能檢測到這些內容,截至2021 年4 月,大約有5000 萬條與新冠疫情相關的虛假內容被打上了“警告”標簽。另一方面,AIGC 技術通過圖像和視頻分析技術,監測、識別和過濾色情和暴力內容,維護了社會的公序良俗。[10]例如,谷歌母公司旗下的Jigsaw 與美國馬里蘭大學等科研機構合作,發布了一套基于人工智能技術的分析系統Assembler,幫助用戶判斷深度偽造內容,有力打擊了網絡技術造假。
總之,AIGC 技術在內容篩查和審核方面的應用,不斷拓展著其技術和應用的領域,對于網絡和信息安全的維護起到了至關重要的作用。
技術是一把雙刃劍。AIGC 被廣泛應用于傳媒業,促進了傳媒業的更新迭代,但也帶來了一些限制和問題。
1 the Road、《陽光失了玻璃窗》等AIGC 作品的出圈預示著創造性AIGC 的生產成為可能。傳統的內容生產規律被改變,其暗含的知識產權爭議將對現有的著作權制度框架產生沖擊。
首先,在AI 協同創作作品中,自然人的創造性貢獻問題有待厘清。鍵入簡短的文字標簽生成AIGC作品的過程蘊含了自然人的創作因素。這在一定程度上符合作品構成要件的要求,但是對于此類作品,能否進行賦權認定以及認定標準如何制定仍相對空白。另外,當人工智能技術發展至擁有自主意識的階段,AIGC 從組合型內容創造轉向探索型甚至變革型內容創造,其創作過程中的權益收益以及可能導致的侵權責任如何劃分,目前也處于爭論之中。[11]
在AIGC 的技術創新和應用過程中,存在著一系列的技術道德問題,如算法偏見、算法歧視等。一方面,算法設計師的主觀因素會對算法結果產生影響。曾有人用1.35 億條仇恨言論信息訓練 GPT-4chan 語言模型,隨后該AIGC 模型在不到24 小時內發布并傳播了超過15000 條充滿暴力內容的帖子,且最初沒有人識別出這些內容來自AI。[12]另一方面,即使設計師提前對模型進行“非歧視”的技術處理,但在投入社會化使用后,算法模型仍然可能在用戶的誘導下發布不當內容。在工程師的誘導下,ChatGPT 寫出了毀滅人類的計劃書,涉及侵入各國計算機系統、破壞通訊與交通系統、控制武器等。在算法黑箱的技術“封裝”之下,AIGC 的倫理失范問題越發難以洞察,其影響力和破壞力也愈發復雜化和動態化,“數據和算法已經成為一種新的權利生產要素”[13]。樂觀地認為ChatGPT“價值中立”的愿望,只是一個不切實際的幻想。如何實現AIGC 工具理性和價值理性的雙重平衡,是當下人工智能發展亟待解決的難題。
智能媒體時代,技術提升了用戶的感知,使得用戶可以通過遠程在場和虛擬在場感知和體驗新聞現場,即不通過記者的加工轉述,也可以獲得對新聞現場的理解,甚至在虛擬技術的可供性之下,用戶還可獲得“我在現場”的沉浸式體驗。
然而,當前AIGC 技術的應用范圍仍然局限于那些可以用數據分析和統計方法獲得的信息。長期來看,記者缺席的新聞現場呈現容易產生真相遮蔽、公共性弱化、新聞現場的情感傳播阻滯等問題,因此,記者仍需親身抵達現場,回應公眾的關切。[14]
首先,記者身體缺席新聞現場,技術、人、環境不能實現充分的連接,截取的事實容易片段化、碎片化。越是復雜的新聞事件,記者在現場的新聞線索識別和信息挖掘越是不可替代。其次,AIGC 多借由社交媒體等社會化渠道再造新聞現場,存在眾聲喧嘩的問題。平臺用戶對于現場的表述多帶有個人情感,并不具備公共性視角,甚至會存在觀點偏頗、情緒極化的問題。再次,正如彼得斯所言,“身體是所有媒介中最基本、最富有意義的媒介”[15]。記者抵達新聞現場,能夠與采訪對象等建立有情感的聯系,豐富感受,進而做出更具有人文關懷性的情感傳播。
新聞需要記者的具身性在場,而不只是智能機器人基于數據庫和分析的信息輸出。智能傳播取代重復性、程序化的工作,將進一步凸顯隱性采訪、調查報道、現場采訪等需要媒體人具身化“在場”的工作價值。
AIGC 技術在2022 年11 月實現技術突破,挑戰傳媒行業的內容生產、信息傳播,不僅給人們帶來“新工具、新現象、新體驗”,還帶來“信息沖擊、體驗碰撞與認知震蕩”。[16]
1.AIGC:向數據學習和以數據為中心
AIGC 的邏輯是“向數據學習”,涵蓋“數據收集、數據預處理、模型訓練、內容生成,以及評估和細化”幾個主要步驟。[17]AIGC 的倫理困境“以數據為中心”的內容生產邏輯,核心是數據問題。數據多樣性、代表性、公正性等缺陷,導致偏見、觀點霸權、刻板印象、文化片面性等問題,同時,數據集的類型模糊,導致事實與想象不分并加劇錯誤或虛假信息的傳播與擴散。[18]ChatGPT 在回答中國國家形象和發展問題時,延續了西方媒體既有的新聞框架或西方數據集,其非中立的觀點主要源于數據來源局限、訓練方法糾錯有限和把關人的價值導向。[19]
2.人機對話,還是純粹的數據流動?
AIGC 的基本原理是通過深度學習等技術,利用大量的數據集,生成文本、圖像、音頻等多種形式的內容,從而實現多種實際應用。其背后的邏輯是機器可以從數據和模式中學習,從而創建模仿人類行為和創造力的新內容。AIGC 的運作過程中存在著“數據—機器—內容—AI 內容—數據”的循環:生成式AI 通過收集、整理和分析數據,生成文本內容;生成的內容作為新的數據,被AI 納入數據庫,成為寫作素材,即“數據回饋”;AI 不斷地從數據中學習、優化,不斷反饋新的內容,對數據的實時分析和學習,使得AIGC 越來越準確、高效。
在這個循環的過程中,人工智能的自動化寫作始終依賴于語料喂養。與職業記者相比,AIGC 存在著諸多局限。首先,基于數據統計的AIGC 具有較為固定的寫作模式,難以出現人類特有的推理和靈感,總體上內容較為單一,人類有能力理解復雜和抽象的概念,常常能夠在看似無關的內容之間建立聯系,展現出人類特有的“靈韻”。其次,人工智能缺乏原生創造力,只能基于統計學的方法從歷史材料中學習文法規則,而無法應對突發狀況,文稿的實時性較弱,而人類真正的知識來源是實踐,通過廣泛的感官體驗,記者可以自主感知和識別信息,創作出更具針對性的原創內容。再次,智能機器學習的另一局限在于對語境理解遲鈍,難以感知到人類情緒的細微差別,這使得它的應用場景進一步受限。[20]
AIGC 雖能根據現有數據產生“新”的內容,但它缺乏真正原創和創新思想的能力,生成式AI 數據的來源是從社交媒體、互聯網詞匯數據庫中收集的各種文本,始終建立在人類的原始數據之上。另外,AI不是自我體系的存在,它需要人類提供數據的校驗和補充,以確保AI 生成的內容符合人類的期望和需求。AI 本質上仍然是人體的延伸和人類思維的嫁接,其主體性目前尚存疑問。
如果說蘇格拉底式的“對話”是在場者的思想的交流,那么,那些缺乏恰當的、有針對性指令的ChatGPT 則是循環在內部存儲中的純粹數據流動。[21]
AIGC 的出現改變了新聞生產方式,使得記者的傳統工作方式受到沖擊,提高了新聞生產效率,但也增加了記者職業不穩定性。
一方面,AIGC 能更快地處理大量的信息,并自動完成煩瑣的報道任務,從而解放了記者的時間和精力。因此,記者可以將更多的時間和精力用于挖掘深層次的新聞背景和底層信息,并針對問題進行獨特的深入分析和觀察,提高報道的專業性和深度。
另一方面,AIGC 的出現也極大地削弱了記者職業價值,但也凸顯了記者在場的價值。生成式AI 的寫作依賴于互聯網上的海量數據,雖在一定程度上具備勘誤能力,但對于某些虛假信息尚不能達成完全分辨,大量“臟數據”進入AI 的寫作庫后,將對其生成新聞的真實性造成威脅。現在,社交媒體和搜索引擎是人們隨時隨地獲取新聞信息的主要渠道之一,傳統記者的意見領袖身份被取代,新聞的真實性也成為幻影。越發隱蔽化的AI 假新聞在社交媒體上經由用戶的人際渠道不斷傳播擴散,新聞反轉頻頻發生,公眾對媒體的信任程度不斷下降,記者職業進而遭遇危機。同時,介乎宣傳文稿和新聞作品之間的具有固定格式的新聞內容寫作,將被機器人大量替代。在某種意義上,“生成式 AI 將會對新聞報道中文牘主義、形式主義形成沖擊,同時也對僵化的官僚主義、科層制管理模式形成沖擊”[22]。然而,對于突發性的、重大的新聞而言,依賴數據喂養的AIGC 依然無法替代專業記者的在場報道。
在一個媒介化、數字化的現代社會,機器的出現不可避免。人工智能已經在傳媒產業中扮演著越來越重要的角色,AIGC 更是引領著產業變革和人機關系重構的一個重要代表。今天的記者需要不斷適應和學習新技術,發揮自己獨特的專業優勢,持續提升自己的思考深度和分析能力,從而更好地與AIGC 共同推動傳媒行業的發展。作為一項顛覆性的技術,人工智能的應用也存在著很多潛在的風險和挑戰。事實上,在經歷快速的業績增長與難以預測的抵制之后,OpenAI 在公司主頁上將其使命從“形塑未來的技術”調整為“創建安全的、使全人類受益的人工智能”(Creating safe artificial intelligence that benefits all of humanity),兼顧了倫理意義上的“安全”與價值定位上的“使全人類受益”。[23]
2023 年4 月11 日,國家互聯網信息辦公室就《生成式人工智能服務管理辦法(征求意見稿)》向社會公開征求意見,[24]相關政策和法規正逐步完善,這為人工智能技術的健康發展和社會應用提供了政策保障。在國家和產業各方的共同努力下,人工智能會發揮更大的作用,推動傳媒產業創新發展和人機關系的持續演進。