□萬杰
AI主播是指通過人工智能與虛擬仿真技術,對特定真人主播的語音、唇形、表情、外貌、動作等進行提取,再結合智能語音、唇形合成等技術克隆出的具備真人主播同樣的媒體內容傳播能力的、脫離“碳基”身體的主播。從2015年至今,AI主播經歷了三次迭代,從最初的離身探索1.0階段人工智能天氣預報機器人“小冰”到2018年2.0階段成功離身的仿真智能合成男主播“新小浩”再到2020年智能具身升級的3.0階段的AI主播“小智”,過去的初代認知科學試圖消解身體在傳播中的必要性,提倡計算主義,但是隨著大腦科學、計算機技術的發展,離身認知開始被質疑和反思,學者劉曉力從G.Chitin的算法信息論出發,認為計算機要想達到對人心本質復雜性的計算還有很大一段距離,“認知可計算主義”遭到挑戰陷入困境。這次反思也推動了第二代認知科學的研究熱潮,具身認知由此興起,身體在人類認知、社會活動以及智能行為中的首要作用被重視起來。同時,離身認知、具身認知也無需陷入對立矛盾,在未來新進路上唯有認知交互融合才有優化的可能性。雖然目前來看人工智能主播的技術水平還處于稚嫩期,對真人播音員、對人的主體性地位尚未有較大威脅,但是人們千萬不能掉以輕心,必須時刻保持警惕。
離身認知是AI主播研發的理論來源,主張認知獨立于身體而存在,并非由身體塑造,身心分離。該主張最早可以追溯至17世紀法國哲學家笛卡爾“我思故我在”的身心二元論。在主流傳播學中,離身性也是一個未經檢驗的基本預設,研究者將身體視作傳播過程中的阻礙。
離身認知解讀。“離身”又稱“無身”,作為20世紀60年代初經典認知科學的核心主張,其方法論特色是:第一,認知在本質上是可以被計算的,崇尚算法之道,正如“圖靈機算法”那般;第二,認知表征主義和機能主義,感官將收集到的外部信息轉化成抽象符號,符號本身沒有意義,而認知根據一定的規則對符號進行解讀、加工和操縱。在這個認知機制中,身體構造不為認知過程帶來任何本質影響。這種方法論也將起源于心理學科的“心”與代表“身”的物理、生物學科區分開來。
電視AI主播的離身認知亦是如此,通過智能提取真人主播的語音、唇形、表情、動作、神態等特征進行離身重組,合成仿真AI,再將所輸入的中英文播報文本通過算法自動生成非線性播報內容,達到脫離以往真人主播的線性播報效果。可以看出,在這個過程中認知被算法程序控制并且脫離身體而存在,身體僅具有信息傳入和輸出的作用,而認知加工的規則也是由算法控制著。
離身認知反思。“離身認知”一經提出,學界便爭辯不斷,以唐納·哈拉維為代表的后人類主義陣營始終堅持離身觀念,認為身體只是我們可利用的假肢;麥克盧漢提出的“媒介是人體的延伸”的觀點對人的身體重要性的強調是堅守反對徹底離身的底線,與基特勒“信息唯物主義”對離身的過度強調觀點形成了強烈的反差;唐·伊徳從人與技術關系出發,認為“在實踐中,具身是我們參與這個生活世界的方式,在此過程中,技術表現為一種文化嵌入性”,[1]從技術哲學視角為反思離身提供參考。后來隨著生物科學、計算機科學的不斷發展,這才掀起了第二代認知科學浪潮前的集中反思:計算機是不能達到對人高級心智的精準計算,人心的本質最是復雜。人的心智隨時在變化,而AI卻是固定程式化的機器,可以說永遠是人在操控著機器。
當前的媒介技術演進試圖消解身體在傳播中的可能性,但是當技術終于擺脫實體、時間、空間的限制以后,人們卻開始對身體產生渴望。第二代認知科學印證了身體的重要性和身體在認知生成過程中的作用,人們陸續認識到將人的認知活動解讀脫離生物學范疇,這是極為片面和唯心主義的。
目前對于具身性研究還沒有形成一個系統而完整的體系,尤其是在新聞傳播學領域理論和實踐涉獵還較少,而其他各界學者對于具身的理解也存在較大差別,但是他們都有著一個基本共識,那就是認知并不能獨立于身體而存在。
具身認知。與離身認知相反,具身認知是指認知的產生對身體有一定的依賴,主張“身體是心智的基礎,身體在人類認知及相關社會活動中具有首要作用”。[2]理論源頭可最早追溯至上世紀法國哲學家梅洛·龐蒂的知覺現象學,其“具身主體性”的理論核心也是對笛卡爾身心二元學說的直接反駁與否定。
相對于離身認知身心分離的二元論,具身不是狹義的身心一元論,而是指“意識-身體-環境”的三元一體,通過身體直接感知到外部事物進而生成意識。可以這樣理解,“從‘具身’的視角來看,人們對于世界的認識并非世界的‘映像’,而是身體構造和身體感覺—運動系統塑造出來的”。[3]
具身性主要是“肯定身體在信息流動與接受過程中的物質論地位”。[4]當前電視AI主播的具身認知主要體現在:先為人工智能新聞主播賦予其能夠自主運動、物質化的身體,然后通過去除離身認知過程中的表征模式,更加注重整個身體系統的交互作用,即主播通過身體傳感設備直接與外部環境互動,而認知和心智也在交互中產生。因此,具身認知帶來的新計算主義浪潮也叫做交互隱喻。3.0階段的AI主播已經初步實現了智能具身,但是在更多具身探索上還有很大的發展空間。
具身探索。在第二代認知科學中,具身是最核心的概念,而情境認知、認知發展和動力系統則與具身性密切相關,都是電視AI主播乃至其他人工智能產品持續升級創新的關鍵要素和突破點。
一、具身性。學者李恒威、黃華新從生物科學角度出發,認為人類的心智其實是一種屬于身體的生物現象,認知和心智并不能獨立于身體而存在,而是相對于身體而言的一種伴隨狀態。認知科學把具身分為弱具身和強具身,弱具身雖重視認知過程與身體的聯系,但是抹去了大腦對認知的意義,并且沒有去除離身認知的計算主義和表征主義;強具身則更為激進,認為身體是實現心智的唯一途徑,身體的特殊構造決定了心智的特殊性和唯一性,不同的身體體驗帶來不同的認知。
對于弱具身和強具身到底孰好孰壞,無法妄下斷言,但是可以看出當前國內學界偏向于強具身觀點,大多數AI主播的形象都是模仿真人外在形象,但是與人類相似的身體構造和肌理結構才是最重要的。例如,采用動物身體結構的AI不可能有人一般的心智,未來AI主播的優化如果朝著更逼真的身體構造方向上下功夫可能會有新的突破。
二、情境認知。具身認知作為“意識-身體-環境”的三元一體,身體與情境互動的變化也導致心智的變化,具身心智受制于情境的約束。正如電視AI主播與真人主播在播報上的區別,雖然AI主播提高了效率,避免了口播失誤,但是在微妙語義的理解和表達上遠不敵真人主播。
在新聞播報的預備期間,通常會有文本的“一度創作”和播報時的“二度創作”。文本是中性客觀的,而播報會帶有個人情感傾向,并可以通過語氣、重音、停頓、音調等表現出來,這也是新聞播報的微妙之處。播報千人千音,不同真人主播對同一文本會有不同的理解,但是不同的電視AI主播卻可能有同樣的播報,這也是目前AI主播需要突破的地方。缺乏共情能力是它們無法回避的弊端,這是困境但或許也是機會。
三、認知發展。科學研究證明,現階段的AI主播無法像真人主播那樣與受眾進行實時互動,現在已有的與人互動功能僅限于程序內設置好的問答,是根據內容指令和程序作出的虛擬反饋,而像真人主播般進行深度對話和做出隨機應變是無法達到的。
AI主播作為人類智慧的成果,自然承襲了人類的些許認知,但是認知能力是在情境中發展的,認知能力的發展必須依賴情境的訓練和理解,AI主播目前或許可以做到模仿人類,但是要想解密人類智慧的其中緣由是絕無可能的,例如對新聞事件中人的復雜性解讀、對采訪對象微表情的解讀和回應。無法自我認知,是AI主播進化的困境還是極限,這有待觀望。
認知產生于具身行動,當前的AI主播沒有實體,自然也就不能生成內聚認知,更別說自我認知進化。學者布魯克斯認為要想使機器人擁有自我認知,變成真正的人工智能,必須使其擁有自己的“物質化”身體。“借助于這具軀體,它能夠自主移動、生存,同這個世界交互,進而感知、思考、生成意識。”[5]正如人類社會,大多數人的心理特征和人格特點都是在參與性交互中被建構的,如果兩個主體能夠通過自身知覺實現互動與耦合,那么AI主播便能從與人的身體知覺互動中模仿和學習到認知,這也再次印證了身體在傳播中的重要性。
四、動力系統。動力系統是指在探索認知活動和情境相互作用的情況下認知發展進化的一種動力機制。當下電視AI主播的動力機制是人類外賦而非內生,即只知做什么不知為何做。認知系統的開閉運行取決于使用者和創造者,這也注定了它們無法在現實世界找尋到自生意義。
在具身性、情境認知、認知發展以及動力系統等諸多因素中,動力系統似乎是關鍵環節。動力系統影響著AI主播是否能具有自主性和能動性,影響著情境與認知的耦合程度、認知發展是否能進化,還對自組織、自涌現高級認知的形成有直接關系。從具身認知的身體互動觀來說,實體化的AI主播或許可以在與人類的互動中得到內生動力的契機,但是否有必要為AI主播打造內生的動力系統和自由意志,屆時它是否會脫離人類預設的發展路徑,這是科學問題,也是倫理哲學問題。
其實,無論是離身認知還是具身認知都存在優點與不足,都需要走向更高階的進化發展,離身認知和具身認知也不需要陷入非此即彼的敵對狀態,可能只有從更全面的雙向視角出發亦此亦彼,才能更好處理人工智能與人類智慧之間的關系。人與技術的關系不單是人創造技術那么簡單,正如電視AI主播,其高效率、零失誤、快速的信息整合能力為全天候新聞播報帶來便捷,但人們卻又要陷入真人主播是否會被AI主播代替的擔憂與恐懼中。如果把AI主播和其他媒介機器人放在整個新聞生產環節中去考慮,大數據分析選題,新聞稿由AI采寫編評,由算法分發,由AI主播播出,那么在新聞的整個生產鏈中人是否會徹底失去對新聞的把關和對技術的控制?
事實上正如離身與具身,人與技術也不必陷入二元對立的恐慌,但在人工智能時代如何實現人機協同共贏?目前最行之有效的方法或許就是最大程度地通過技術將AI主播的優勢無限放大,例如其高效率、零失誤、超長待機等特點,或者說在危險地方如火災現場、地震、臺風等自然災害來臨時,使其成為人類的得力助手;而真人主播自身要不斷提高其在微妙語義的表達、具身互動、共情能力、緊急情況處理上的不可替代性。不僅是AI主播,任何人工智能產品都無法在情感能力上取代人類,這也是長久維持人類主體性地位和堅守自身不可取代優勢的關鍵。
根據西班牙思想家加塞特的說法,人既是“自然的”又是“超自然的”,自然性的人能夠在進化中自行實現,而超自然性需要人類不斷刨根問底,在認知不斷進化下才能得以實現。正如,“人通過使用媒介而使媒介成為‘媒介’,媒介則通過被人使用而使人成為‘人’”。[6]由此可見,人與媒介的意義是雙方互相賦予的結果,即在人類對AI主播的優勢利用上媒介找到了自生意義;在人類自身對真人主播自身不可替代性的加強上,也是媒介技術迅速發展的倒逼作用以及人自身的“超自然性”使人找到自身努力的方向和存在的意義。人與媒介相互協作、共同進步,這才是科技的根本意義。
媒介技術試圖越過身體在傳播中的阻礙,但是隨著身體的“消逝”,人們的焦慮程度也日益增加,身體在傳播中的重要性重新被重視起來。人工智能、虛擬現實、可穿戴設備等實踐體現了人類的具身性探索,新聞行業也不例外。理論基礎源于離身認知的AI主播也正在進行不斷的具身探索,雖然目前大多只能做到外貌、聲音特征的仿真和包括離身、具身認知在內的一定程度上的情境認知和人機交互,但在其身上展現出了諸多的可能性和進步性。
AI主播只是一個領域,人們還應考慮到其他更多人工智能產品在傳媒業的應用。當人們在為技術的進步而歡呼的同時,還要時刻注意技術的應用對整個傳媒行業的顛覆和影響以及對AI主播相關法律法規的完善。不僅是真人主播,每個傳媒從業者都要反思并重視“身體之重”,提高業務能力,充分發揮具身的獨特優勢,明確人的主體性地位,發揮人的“超自然性”和創造性價值。但是,也不能因為害怕威脅自身地位而停止技術的開發和應用,彭蘭教授曾提到的未來媒體三大特征之一的“人機共生”,預示著不僅是新聞主播,乃至整個新聞行業的工作者與智能技術相互協作、共同進步才是主流趨勢。