◎戴偉
喻國明教授認為,未來傳媒業的發展很大程度上與人工智能技術的引入和應用關聯在一起。①而AI主播就是人工智能進軍傳媒業的典型例證,并且正在不斷發展完善。在2022年北京冬奧會賽事轉播中,AI主播最新應用產品——AI手語主播就實現了首次亮相。研發公司百度采用語音識別、自然語言處理等人工智能技術,構建出一套復雜而精確的手語翻譯引擎,實現了文字及音視頻內容到手語的翻譯,再通過專為手語優化的自然動作引擎,進行虛擬形象的驅動,將手語實時演繹為數字人的表情動作。這使得AI手語主播具備強大的手語表達能力和精準的手語呈現效果。它所掌握的手語詞匯規范都來自《國家通用手語詞典》標準,長時間的智能學習使其能夠達到準確專業的解說水準。北京冬奧會上,AI手語主播專門為聽障觀眾服務,能夠準確及時且專業地對現場比賽進行手語播報,而且其頭發、皮膚、眼睛非常逼真,與畫面中的真人主播別無二致。AI手語主播的應用無疑為弱勢群體創造了更好的觀賽條件,彰顯我國主流媒體對弱勢群體的人文關懷。這也引起了人們對AI主播人性化的更多關注,它目前擁有哪些現實可行的應用場景,存在什么先天缺陷與發展困境,在未來又有著怎樣的發展前景?本文將從這些問題出發進行進一步探究。
AI主播人性化,即人工智能在播音主持領域的應用中更加符合受眾的期待,更多關注受眾的現實需求,體現出人文關懷。保羅·萊文森在論述媒介人性化趨勢時說過,技術要么提供了心理學上可接受的替代品,要么提供了對人類感官系統的延伸。我們從AI主播不斷進化過程中可以發現,它們的形象從最開始的動畫、卡通發展到真人的“分身”,聲音也從機械化發聲發展到真人主播的標準發音,愈加符合受眾的感官期待,呈現出了“人性化”特征。
早期AI主播形象、動作以及播報效果與真人主播存在很大差異,顏值不在線,感官也不自然。隨著人工智能技術的發展,AI主播已經發展到合成應用階段,這一階段以2018年“新小浩”面世為開端,其原型為新華社記者邱浩。分身技術通過語音智能合成和形象智能合成兩大引擎,從圖像表情、聲音形態、語言習慣和邏輯思維等層面對AI進行擬人化訓練,從而生成高度逼真的AI形象,更容易為受眾所接受,也有效降低了播報成本和失誤率。同時,當下AI主播也擁有媲美真人主播的播報能力以及更為強大的信息分析能力。全國兩會期間,央視頻推出了《“冠”察兩會》AI節目,主播“AI王冠”與真人王冠同框,對新一年國家計劃減稅降費、幫助企業煥發生機等系列政策進行了解讀,表述清晰,手勢自如,毫不遜色。AI主播通過芯片處理數據,可以從海量數據中快速找到有邏輯關系且具備價值的信息,人類大腦難以望其項背。在形象、聲音人性化之外,2022年北京冬奧會賽場AI手語主播的面世也在應用場景層面呈現出“人性化”的特征。這體現出當下AI主播應用已經將目光投射于社會弱勢群體,關注殘障人士的奧運賽事觀看體驗,彰顯人文關懷的暖意。
“傳播是各種各樣技能中最富人性的?!雹谥鞑プ鳛榕c受眾溝通交流的信息傳播方,同樣是大眾傳播活動中最富人性的。只有當主播具備真實、自然的傳者主體人格,才能真正在傳播中與受眾建立“人與人”“面對面”的交往關系,才能拉近傳者和受眾的距離,提升其傳播效果,因此人性化被視為主播的標志與優勢。③AI主播人性化的意義正在于此,作為人工智能在播音主持領域的落地應用,AI主播的人性化主持傳播同樣被視作其高階要求。
AI主播當下主要包括全息模擬真人AI主播、智能采訪對話機器人、虛擬卡通AI主播三類,主要承擔的是訊息播報、節目主持等方面的工作。在這些場景的人性化傳播實踐中,AI主播大有可為。
對于一般的電臺而言,24小時連續播出節目可能不太現實,這需要極高的人力和金錢成本,但是對于AI來說,這一切實現并非什么難事。AI主播通過語音合成技術可以實現自動識別播報,全天24小時逢整點、半點滾動播出固定內容,包括新聞快報、天氣情況等,完全不用休息。例如河北廣播電視臺的廣播節目《今日十萬加》就邀請微軟小冰入駐演播室,小冰依靠強大的數據抓取能力,及時提供當地天氣情況,為駕駛員安全保駕護航。作為電臺廣播的最大受眾,駕駛員群體需要智能語音的協助,電臺AI主播能夠提示司機防范危險,降低事故的發生率。它成功打破了傳統電臺的時間限制,讓駕駛員無論多晚都會多一份安心。
然而,盡管AI主播可以突破時空限制,全天候服務于受眾,但其在播音主持時缺乏情感、模仿痕跡嚴重的問題依然明顯。AI主播目前多半集中于現實主播的“翻版”,諸如“小小撒”“新小浩”,他們的原型分別是撒貝寧和邱浩。節目中,它們也以相同的形象特征承擔著與原型相同的工作。白巖松曾經這樣評價自己的AI分身:“聽他說1分鐘話,這不是白巖松嗎,神了!聽5分鐘,真像!聽了10分鐘,還是跟老白說說話吧,他沒有任何情緒變遷?!雹茉谥袊簥Z冠相關報道中也能發現AI主播與真人主播有著顯著差異,真人主播可以表現出愉悅,并使用輕快的語調,但是AI主播目前尚處于“弱AI”階段,要達到“認知體驗”的“強AI”階段仍需時日。受限于技術,缺乏對內容的理解和判斷,AI主播難以擺脫自身的生硬和機械感,難以傳遞出新聞應有的溫度,自然也無法和觀眾形成情感上的共鳴。日本機器人專家森昌宏在1969年提出“恐怖谷效應”:由于機器人與人類相似,所以人類開始會對其產生正面情感,而隨著機器人發展到一定程度,人類對其的反應會突然變得極度負面和反感,哪怕它們與人類只存在細微差別。高度仿真與真實的差距仍然是真實存在的,公眾對于機器人會存在一定的不適感。相較于真人主播,AI主播常態化主持之路仍舊漫長。
新聞資訊客戶端“今日頭條”利用大數據精準分析受眾喜好,進行內容智能分發,“千人千面”,更好地滿足受眾個性化需求。類似于此,AI主播目前也開始具備為觀眾帶來專屬定制類服務的能力。2018年6月開始,微軟小冰團隊和湖北經典音樂廣播進行合作,推出日播專欄《小冰秀》。小冰憑借全網音樂曲庫瀏覽及音樂鑒賞能力,通過每天專欄向湖北聽眾進行定制的音樂推薦。⑤
但受限于技術,適用于AI主播的個性化定制內容匱乏。同時,我們應注意到,AI主播推廣實質上是“價值理性”向“工具理性”的偏移,AI主播植根于算法、大數據、云計算,而算法技術容易引發新聞偏見,定制化內容易導致受眾陷入信息繭房。哈貝馬斯指出,人類在科技發展中應當追求綜合理性或價值理性,而不是被科學奴役追求工具理性。人們追求工具理性,會忽視倫理、價值、信仰的理性思考以及人存在的意義和價值,導致人的異化,進而引發道德失范的風險。
類似于北京冬奧會上的AI手語主播,疫情期間面世的AI帶貨主播在助力社會弱勢群體方面同樣不遺余力。疫情期間,當一些季節性農特產品出售困難,很多農戶面臨著產品滯銷的困境時,AI主播也迎來了展示才能,緩解農戶燃眉之急的機會。2020年,重慶巴南區融媒體中心舉辦了“暖春助農”——大型全媒體公益行動,并選用AI主播“小晴”作為帶貨主播。小晴在本次直播中給觀眾播報最新鮮、最及時的滯銷農產品信息,為產品打開銷路,減輕了疫情下農戶們的生活壓力,助力當地經濟社會逐步恢復。
在弱勢群體需要的領域加強AI主播的應用,是人機協同創新的體現,也是AI主播人性化發展的必然。但當下AI主播發展尚不成熟,因此加強AI規范,構建人機和諧共生生態系統是迫切需要。然而,目前我國對AI主播的相關法律法規依然欠缺。當AI主播逐漸發揮出越來越重要的作用時,法律的空白就無法界定責任的主體,可能存在的法律糾紛就無從解決,AI主播網絡直播帶貨就容易引發追責困擾。AI犯錯,是追究程序員的責任還是把關人的責任?這是擺在人們面前的現實難題。同時,AI主播人性化應用中難免會接觸到用戶的個人隱私,信息泄露危機暗藏,這也是未來AI人性化應用的隱患所在。早前刷屏朋友圈的“ZAO”換臉App就被指出存在過度收集用戶信息和侵犯版權的嫌疑。
不難發現,當下AI主播受限于技術發展缺陷以及法律條文失位,在人性化道路上存在著諸多不足。但隨著其應用逐漸深化,可以預見,未來AI技術應用情感飽和度會逐步增加,相關法律政策也會日漸完善,從而厘清AI主播責任主體,強化對其的法律束縛,矯正AI的工具理性和功利取向,更好地為人類服務。
2017年11月,新華社推出全球首個人工智能虛擬生命琥珀·虛顏,它已能與他人進行情感交流,并為在場的人們實時播報新聞。雖然當下AI主播尚處于“弱AI”的發展階段,但我們可以預見,AI主播未來必定朝著人性化方向不斷發展,更好地滿足人們情感互動的需求,增進訊息接收的體驗。
孤獨是當下最常見的困擾年輕人的心理問題之一,當他們無法向家人朋友敞開心扉時,電臺AI主播或許就是一個較好的選擇。目前,市場上已經有諸如微軟小冰這樣的AI主播。微軟小冰最初誕生于2014年,通過與受眾對話聊天,積累了大量的訓練數據。到第四代時,它擁有的大數據語料庫級別已經達到十億級,通過分析理解用戶的問題,再從語料庫中找尋答案。2021年,第九代小冰面世,在平均對話長度、上下文一致性、上下文相關性、對話信息含量與話題引導成功率這五項指標中,都實現了全行業領先。
當然,類型單一、眾口難調是小冰目前的瓶頸,但即便如此,它依舊擁有巨大的市場需求。根據微軟提供的數據,小冰與用戶單次對話頻數已經達到了23輪,人們非常樂于同AI進行交流,吐露心聲。2021年,微軟公司發布了全新的超級自然語音技術,將AI語音自然度提升到了與真人聲音幾乎無法分辨的程度。這也讓AI主播能夠在交談、唱歌等場景中進行高度擬人交互??梢灶A見,未來,用戶可以根據個人需求選擇喜好的主播類型,即時進行語音互動。當現實生活中的煩惱無人傾聽,孤單無人陪伴時,人們開始擁有另一種情感交流的選擇,個性化陪伴式聊天將會走進現實。
當下人們生活節奏加快,閱讀習慣也開始偏向于碎片化,在通勤或者睡前會通過資訊聚合類App瀏覽新聞,因此“聽新聞”更符合人們的現實需要。目前,“學習強國”App已經上線AI語音播報版本,其有聲頁面大多數稿件都采用AI播讀,滿足了受眾的個性化需求,并且AI播音的字音標準程度和真人主播已經相差無幾。近期微信也增加了關懷模式,聊天時點擊對話框中的文字,幾秒鐘就可以轉換成語音,為中老年人群提供了便利。
未來,隨著相關技術成熟,AI主播或能實時將手機屏幕文字轉換成語音,并能讓用戶可以根據個人喜好進行語音包挑選,擁有自己的專屬主播。同時,聲音專屬定制也不會影響到用戶的內容獲取偏向,從而杜絕因信息繭房陷入風險。顯而易見的是,這項技術也將為社會中視障用戶群體提供便利,減輕由身體缺陷所帶來的困擾。
如今,以“小小撒”為代表的AI主播已經開始參與到網絡春晚現場錄制中,但它的互動范圍僅限于錄制現場。這也是電視節目的現狀。未來,AI主播可以嘗試突破地域限制,在直播現場與坐在電視機前的觀眾進行有效互動。觀眾通過手機發送彈幕,AI主播在線挑選留言進行回復,這無疑帶給普通人更多的參與感與體驗感。目前,這項技術已經在廣播節目中得以實現,AI主播微軟小冰在湖北音樂廣播頻道可以與聽眾實現實時在線互動。
而在新聞資訊類報道中,AI主播未來同樣可以借助AR、VR、MR等技術在還原現場虛擬場景中帶給觀眾更真實的信息播報。該設想來源于2020年全國兩會期間新華社運用的5G全息異地同屏技術,身處北京的主持人與在武漢的全國人大代表程桔相距千里,卻在同一訪談間完成了節目錄制。節目組首先在武漢演播室采集了程桔代表的全息影像,通過5G信號實時傳輸到北京,再通過全息成像技術以真人等比例大小呈現,實現異地同屏交流的效果。參與式信息播報融入觀眾互動,自然容易引發新聞倫理失范風險,未來也更迫切需要關于AI主播規范的法律條文為信息播報安全保駕護航。
AI主播的人性化是AI技術發展的終極要義。北京冬奧會AI手語主播便是播音主持領域AI人性化應用的典范。它為聽障觀眾創造了更好的觀賽體驗,讓我們看到AI在提升新聞生產效率和產品質量的同時,散發出了屬于人性的溫情。盡管AI主播人性化應用目前存在著生硬機械、缺少相關法律束縛以及倫理失范的潛在風險,但是它依然在很多領域彰顯出人文價值和人文關懷。助力滯銷農戶,24小時為車主播報路況,提供定制的音樂服務,這些場景應用為我們開拓了人工智能當下人性化應用的另一思路,即在技術尚未成熟的階段,讓AI主播的自身劣勢最小化,將其應用在能夠更多彰顯人文關懷的場景中,滿足受眾需求,體現科技善意。未來,隨著人工智能技術的日漸成熟,人們必定能更好地享受到來自AI主播發展的更多福利,越來越多定制、真實而感性的服務以及交流,能夠滿足不同人群的現實需要,創造更多現實生活中未曾遇見的暖意,AI與愛不再分離。
注釋:
①喻國明,蘭美娜,李瑋.智能化:未來傳播模式創新的核心邏輯——兼論“人工智能+媒體”的基本運作范式[J].新聞與寫作,2017(03):41-45.
②[美]威爾伯·施拉姆,威廉·波特.傳播學概論[M].何道寬,譯.北京:新華出版社,1984:4.
③高貴武,楊航.AI主播與主持傳播中的人格進化[J].青年記者,2019(22):51-52.
④張婧.AI合成主播:播音主持行業的“危”與“機”[J].視聽界,2021(04):111-113.
⑤賀萌.廣播電視中的人工智能主播發展現狀思考——以AI主播小冰為例[J].新聞前哨,2021(12):36-37.