周舒君 何冬梅 江漢大學人文學院
從手機語音助手到語音地圖,人工智能的語音功能已經深入到我們當代生活的很多方面,以人工智能配音的首部紀錄片《創新中國》也已經面世。
紀錄片《創新中國》的重磅問世不僅為科技狂人們獻上一場“視覺盛宴”,還被稱之為人工智能向藝術致敬的代表。該紀錄片的最大亮點在于通過科大訊飛利用智能語音和人工智能技術,讓已逝的著名配音藝術家李易老師的聲音重現熒幕,這也是全球第一部全篇采用人工智能配音的紀錄片。
“人工智能配音技術稱為‘TTS’(文本到語音)。簡單地說,這種合成技術將用戶輸入的文本轉換為流暢自然的語音輸出,并支持語速、音調、音量和音頻設置。其打破了傳統的人機交互方式,使人們更加自然地溝通。在此技術基礎上,結合頂級聲學模型和語言模型,結合韻律處理,情感語音合成等技術,最終呈現出自然而富有張力的配音。”[1]由此可知,人工智能配音技術幾乎全程使用計算機來完成一系列合成輸出工作。新興科技的出現必然要先從自身的條件作為基礎,再進行下面的每一個步驟。傳統的紀錄片配音,往往受到設備、配音演員、后期制作、場地等因素的制約而不能如期進行或完成。但人工智能配音的出現就減輕了很多煩瑣的環節。相比真人真聲為紀錄片逐字逐句配音要節省更多的時間,在短時間內提高效率,這樣可以加速紀錄片完成進度。我們可以花費大量時間在創新研究上,使人工智能為紀錄片配音時更具特色,使其賦予更多細膩的功能,逐漸變成一個能體會情感變化的紀錄片配音助手。
從《周恩來外交風云》到《改革開放二十年》再到《再說長江》《大明宮》李易老師的聲音陪伴一代又一代人的成長,似乎也成了紀錄片配音的代名詞。應該說,李易老師的聲音本身就具有標識性。紀錄片《創新中國》通過人工智能技術再次讓李易老師的聲音重現熒屏,“其音色的端莊儒雅且厚重自然、發音的強氣息和弱控制、語流的起伏平淡又極富張力,共同構成其紀錄片解說的獨特風格。”[2]
(1)吐字發音
“毋庸置疑,配音藝術最基本的要求就是規范到位的吐字歸音和嫻熟自如的發聲技巧。”[3]在吐字發音方面,人工智能充分復制并重組了李易老師的語音,成功實現了李易老師吐字清晰、準確,發音純正、規范的特點。例如在《創新中國》第一集《信息世界》有一句“對于每天忙碌在派送一線的陶文斌來說,這次選拔競爭激烈。”其中“陶文斌”“激烈”這樣的重音詞,不僅在調值上能夠做到陰陽上去分明到位,并且在這基礎上能夠很自然的突出重點,使整個句子主次分明邏輯清晰。讓受眾感受到該紀錄片態度的端正性與嚴謹性。而模仿一位大師吐字發音的準確性只是人工智能為紀錄片配音邁出的第一步。
(2)音色調整
“美好的聲音總是能夠讓人難以忘懷,這也說明每個人都有自己獨特的聲音特色和聲音魅力。”[3]音色的特點表現為共鳴腔體的位置、氣息的處理方式、歸音的特點以及音高音強的處理等。李易老師的聲音厚重自然、端莊儒雅,其配音作品氣息平穩、虛實相宜,共鳴腔體的位置以胸腹共鳴為主,歸音平穩利落。這種音色端莊大氣適于給大題材、大事件配音。在《創新中國》第一集《信息世界》中有這樣一句話“一旦通過面試,他們的職業生涯將被徹底改變,更重要的是他們將親身經歷物流領域正在上演的一次創新革命。”在這段配音當中元音的開口度到位,后鼻韻歸音采用胸腹共鳴使音色略顯滄桑,句尾音節收束有力,音節彈性較強,使整個文本顯得很有力量,并具有時代厚重感。
(3)語流音變
“評判解說人語言質量不僅要聽聲音的靜態品質,而且要看語言的動態表達效果。”[2]李易老師在處理語流音變時多采用強氣息弱控制的方法使語言平緩有力、銜接自然流暢,同時又不失重音起伏的變化,可謂是一氣呵成。但在《創新中國》配音當中,人工智能的語流音變略顯僵硬,在第一集介紹無人機技術時多次出現字與字之間銜接不夠圓潤的情況,如“走出深圳實驗室,走向實際應用場景。”其中可以明顯感受到“走出”“深圳”“實驗室”三個詞之間有停頓沒能形成很連貫的一個短句子。再如“帶來了兩款獨特機型”同樣可以聽出“帶來了”與“兩款”之間仍間隔較長,這就使短句子更碎片化,在聽覺上沒能呈現很好地表達效果。但從整體上看《創新中國》長句子的處理,語流音變還是很入耳的。
(1)記憶呼喚
“配音員聲音特質與紀錄片的完美契合,能夠形成傳播過程中受眾的聲音審美期待。”[4]當李易老師的聲音出現在紀錄片《創新中國》當中時,不由得讓人回憶起當年李易老師的那些經典之作,那是一代人的記憶呼喚,同時也為當下的人們所贊嘆,雄渾親和的聲音,擲地有聲,不免讓人懷念當年的崢嶸歲月,回憶起的不僅是一部部經典紀錄片,而是屬于那個年代的點點滴滴。同時也讓受眾感慨歲月流逝,如今的科技水平,已經可以在一定程度上滿足人們的記憶呼喚,再次重溫李易老師的經典之聲,就已經讓受眾身臨其境在《創新中國》的科技魅力里,感受我國的發展進步。這不得不讓人們感受到《創新中國》制作團隊的良苦用心。
(2)豐富想象
人工智能通過對李易老師聲音的模仿激發了受眾的想象力,“紀錄片有其鮮明的時代特征,紀錄片配音也必然有其獨特的時代個性。”[5]人工智能配音紀錄片《創新中國》首先在聲音上豐富了對李易老師早期作品的想象與回憶。其次,李易老師的聲音作為紀錄片當中最為熟悉的聲音之一,會給受眾更強的代入感,因此對紀錄片《創新中國》當中所講述的事情也會有所想象。最后,受眾感慨于當今科技發展的突飛猛進,自然而然地會想象出未來科技的高速變化。如在《創新中國》第四集《生命科學》中講到的一段“由于人多地少等現實問題的困擾,如何制造充足的食物來滿足未來中國人的需求,科學家們不斷利用生物技術,創造著奇跡。”當人們聽到這段講述時,不免會想起李易老師的經典之作《再說長江》。同時,在雄渾的聲音中,一幅幅生動的畫面又把觀眾的想象拉回到現實,那滄桑的聲音傳遞出的悲憫情懷和面對未來的信心也讓我們深受感染。這會使觀眾在多重想象中獲得極大的審美滿足。
(3)人文情懷
“唯有融合東方審美取向和當下時代審美訴求,紀錄片配音才能在精神引領和審美塑造方面發揮作用。”[6]人工智能選用李易老師的聲音為紀錄片《創新中國》配音,首先包含了對已逝去的李易老師的緬懷之情,李易老師作為我國早期紀錄片配音的標桿本就屬于一個時代的印記,其中濃縮了早年我國社會人文的心路歷程。再者,李易老師的聲音能夠再現熒屏,證明他的聲音在某些方面仍具有當代學習的價值,這是與時代無關的,而是他能成為一代典范與他的后天努力與堅持的精神是密不可分的。在看似簡單的配音背后是一代一代人創新堅守的成果才有了今天人工智能配音紀錄片的出現。“舊聲新現”的樣態同樣記錄著我們這一時代的歷史巨變,呈現出帶有歸屬性的人文情懷。
(1)創作空間狹窄
“AI智能配音還是有一定的缺陷,首先它沒有情感也沒有思想,在現階段僅僅只是能夠做到更接近人聲,但缺乏配音員對于聲音形象和具體情節的塑造,所以適用場景有限。”[1]如在《創新中國》第二集《創造能源》中“當下的我們,前所未有地支配著種類繁多的能源,但沒有哪一種能源是完美的。”從這句當中并沒有很好地表達出我們對能源匱乏的擔憂,以及對開發新能源篤定的信念。情感平淡并且有些刻意機械。又如同樣在第二集中出現的“蛋變成雞需要在孵化器里經歷21天的時間。”其中表述的重音不是很明確也就顯得這句話的邏輯感不強。因此,除了人工智能首先涉及的手機語音助手與語音導航外,人工智能選中為紀錄片配音就是因為紀錄片在文字表達中極少使用議論、抒情等表達方式,并且在為紀錄片《創新中國》配音時也盡量避開或刪減了有關情感跨度較大的詞語,避免造成情感表達不當等問題的出現,以免影響整部紀錄片的傳播效果。若不能改變人工智能配音情感表達及態度呈現方面的問題,那么人工智能配音的空間將仍面臨一個狹窄的局面。
(2)個性化缺失
個性化是藝術創作追求的目標之一。由于人工智能配音的《創新中國》是我國首部運用該技術合成的紀錄片,因此可借鑒的素材極少,選用李易老師的聲音作為人工智能模仿的對象也是一次大膽的挑戰,畢竟李易老師的聲音是極具個性化的。但是就是這種個性化的聲音,并不能適用于所有的紀錄片配音。因為,每個紀錄片作品都是獨一無二的個體,更何況李易老師的配音風格已經與我國近幾年的紀錄片配音風格有所區別,因此人工智能配音的紀錄片還缺少一定的個性,沒有很明確的自身定位。例如在第二集中提到的“這些剛孵化出來的小雞,將被送往40公里外武夷山脈的深處。”李易老師的聲音雄渾有力,在處理這句話的時候明顯感受到對于小雞的闡述過于沉重,缺失了一份靈動自然。“紀錄片配音藝術,雖是輔宰卻同其他藝術構成元素一樣,承載了紀錄片創作的整體和諧之美。”[7]李易老師的聲音雖具有個性,但相對于全部配音作品來講卻并不是全體匹配的。另外,隨著時代的改變,受眾人群也在相繼發生變化,李易老師的聲音是否還適用于當今受眾的審美需求,有待考證。
人工智能配音首先選中紀錄片的一個重要原因就是在紀錄片的表述中少有語言的情感變化。這樣就大大降低了人工智能給紀錄片配音的難度,這也是為什么《創新中國》能夠取得成功的原因之一。在第三集“智造”生活當中像是“中國曾以驚人速度成長為制造業巨頭”這樣的理性概述語言占全片配音篇幅較多,這也就降低了紀錄片的情節性,而更像一部純粹的科普片。從以往李易老師的作品來看,他的聲音更適合大氣的紀錄片作品。
我們熟知的電視劇、電影、動漫等都需要配音演員極深的臺詞功底,再加上我國語言文化博大精深,若人工智能配音想探索這些領域,就有極大的困難。因此,人工智能配音在今后的發展中除了要量化自身,其次就是要確定配音范圍,尋找適合自己的文本進行加工創作。除了紀錄片以外,還可以嘗試新聞類節目這樣的少有情感變化的語言類節目進行再度加工。
“不難發現,許多優秀的紀錄片解說配音都選擇了更具張力的聲音。音域更寬更深,嗓音更具共鳴和彈性,以及成熟穩健的敘事風格,是表達紀錄片內涵的完美條件。”[8]紀錄片《創新中國》能夠一炮打響,還有一個不可或缺的因素就是它選用了受眾們最為熟知的李易老師的聲音。李易老師的聲音是一個時代的標簽,極具代表性。但隨著我們的社會發展,人文風貌也在發生著相應的改變,李易老師的聲音固然有他的時代意義,但未必適用于未來的紀錄片配音風格。因此,人工智能在未來的聲音選取上也要多挖掘有個性的聲音,具有我們這個時代特色的聲音,能高度符合當代社會文化的主旋律,為不同風格元素的紀錄片選取最適中的聲音去塑造它,為紀錄片增添更多新鮮活力的血液,從而打造屬于我們這個時代的紀錄片聲音印記。
李易老師的聲音之所以能成為一個時代的經典,就證明他的配音順應當時的社會歷史背景,而人工智能在今后為紀錄片配音時也需要選取多元化的聲音來凸顯不同紀錄片的特色以及所要表達的主旨要義,既要在聲線上與紀錄片題材相吻合,語言氣質上更要有審美性,突破原本的紀錄片配音印象,擺脫刻板、冷漠的聲音形象,盡可能使紀錄片的聲音畫面和諧自然。多元化的聲音也可以反作用于人們的常規思想,激發更多更好的紀錄片文本創作,增添更加豐富的畫面素材靈感,為受眾們呈現更多印有中國元素的紀錄片。
人工智能為紀錄片配音的出現無疑是一次科技與人文相融合的大膽嘗試。而人工智能配音是否對真人真聲配音產生沖擊一直是很多配音演員及廣大受眾所擔心的問題。其實只要定位得當找準自己的最佳生態位,二者完全可以相輔相成不會出現此消彼長的局面。人工智能給紀錄片配音的技術還不夠穩定成熟,聲音形式和樣本還較為單一,情感表達不當或不到位是人工智能配音紀錄片目前無法攻克的難關。