999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于ChatGPT語言模型的虛擬數字人語音交互應用

2023-09-19 05:46:52
電視技術 2023年8期
關鍵詞:引擎動畫文本

嚴 通

(南寧師范大學 美術與設計學院,廣西 南寧 530100)

0 引 言

虛擬數字人的誕生,最早可追溯至2016年12月1日,日本虛擬主播“絆愛”在YouTube的“A.I”頻道發布了第一個視頻。直至2018年2月23日,該頻道訂閱人數達到了100萬。由“絆愛”等虛擬主播帶頭,虛擬主播行業迎來了快速發展的時代[1]。盡管虛擬數字人具有巨大潛力,但現有的虛擬數字人交互應用仍存在一些限制,比如互動簡單、內容單一及實時性不足等技術問題。為了提高虛擬數字人的交互效果和用戶體驗,本文立足于當前研究現狀,旨在進一步研究和改進語音交互技術。本文采用虛幻引擎作為虛擬數字人交互的開發平臺,通過設計和實施基于ChatGPT語言模型的實時語音交互程序來解決實時性語音交互應用問題,進而實現更自然、流暢和智能的交互體驗。這種交互形式基于ChatGPT語言模型,將虛擬數字人與現實世界連接,能夠為用戶提供豐富多樣且自然的對話體驗。

1 ChatGPT語言模型的原理及虛擬數字人語音交互現狀

1.1 ChatGPT語言模型原理

ChatGPT (Chat Generative Pre-Training Transformer)是由OpenAI實驗室開發的大語言模型(Large Language Model,LLM)。在其之前,OpenAI基于Transformer開發了一系列LLM,包括GPT、GPT-2、GPT-3以及GPT-3.5[2]。在GPT-3.5的基礎上,OpenAI實驗室加入優化后的預訓練、生成對抗技術以及基于人工反饋的強化學習技術。Transformer架構在處理自然語言序列數據時表現出色,通過使用自注意力機制,有效地提高了對上下文的理解能力。模型需要經過大量預訓練,以學習語言結構、語法規則和從文本中提取信息的技巧。作為一種生成型語言模型,GPT能根據給定的上下文,使用概率生成預測文本串。為了使模型在特定任務上更加精確,微調是必要的,它可以提高模型在某些領域的專業知識。此外,可以通過調整溫度參數來影響模型生成文本的隨機性,從而在創造力和保守性之間取得恰當的平衡。

1.2 虛擬數字人語音交互現狀

虛擬數字人的思想起源于賽博格(Cyborg)。1985年,哈拉維在其賽博格宣言中將賽博格定義為無機物機器與生物體的結合體,如安裝了假牙、假肢、心臟起搏器等的身體。這些身體模糊了人類與動物、有機體與機器、物質與非物質的界限[3]。虛擬數字人的語音交互涵蓋了許多技術和組件,使得人類可以與虛擬角色或數字人進行自然、流暢的語音交流。語音交互的主要元素包括自然語言處理(Natural Language Processing,NLP)、自動語音識別(Automatic Speech Recognition,ASR)和語音合成(Text to Speech,TTS)等多種交互技術。

在多樣化的交流形式中,人機語音交互將極大地便利人們的日常生活和工作。隨著技術的不斷進步,虛擬數字人在這個階段實現了更高程度的真實感。但是,以簡單的二維動畫或三維模型出現的虛擬數字人還不是十分智能化,只能將提前設計的內容進行循環播報,沒有任何的互動和交流,其主要原因如下。

(1)在沒有像ChatGPT這樣的預訓練語言模型的情況下,虛擬數字人將無法有效地根據用戶給出的內容進行智能處理和回應。若只依賴于觸發關鍵詞的方式,很難滿足用戶對于真實、自然對話的需求。

(2)傳統三維數字人往往無法實現實時表情動畫驅動,這導致語音與嘴型的不匹配現象,進而使得聲音表現與面部表情難以協調一致,從而降低了人物的真實效果和沉浸感。

(3)虛擬數字人在文本輸入的模式下使用范圍相對較窄,受限于操作臺。若采用語音輸入方式,用戶可以擺脫操作界面的限制,在較廣泛的范圍內與虛擬數字人展開便捷、自然的交流互動。

2 ChatGPT語言模型在虛幻引擎中的語音交互設計與實現

2.1 虛幻引擎語音交互技術

虛幻引擎5(Unreal Engine 5),是由Epic Games公司開發的一款游戲引擎,以其優越的性能在游戲和影視行業中越發受歡迎。虛幻引擎提供了一套全面且易于使用的工具和技術,涵蓋圖形渲染高峰、精密的物理模擬、強大的人工智能能力、高品質音頻支持、穩定的網絡編程框架和高度可定制的游戲邏輯編輯器。

基于虛幻引擎的語音交互技術,指的是將現代先進的語音識別、語音合成和自然語言處理技術融入虛幻引擎,創建契合時代需求的用戶交互體驗。這一技術實現的核心方式主要有集成第三方庫和開發自定義插件兩種。通過這兩種方式,虛幻引擎可以無縫地識別用戶的語音輸入,并針對輸入內容做出相應的響應,最終呈現給用戶一種高度互動與沉浸式的語音交流體驗。這種結合虛幻引擎和語音交互技術的應用可以廣泛用于各類場景,如游戲開發、虛擬現實、影視制作等,賦予角色更富有生命力的對話和反饋,從而顯著提高用戶的參與度和沉浸感。同時,基于虛幻引擎的語音交互技術也為行業創新帶來了巨大的潛力,通過打破界限、拓展創意、提升體驗,引領未來教育、商業、娛樂等多個領域的發展方向。

2.2 虛擬數字人語音交互在虛幻引擎中的程序設計

虛擬數字人語音交互應用程序使用虛幻引擎并整合了ChatGPT作為核心組件,以提供高質量的自然語言處理能力。通過將多個功能模塊和技術相結合,本文創建了一個實現高效、自然語音交互的應用程序。其中包含以下幾個關鍵環節,如圖1所示,以下將以步驟形式詳細說明實現過程。

圖1 設計流程圖

(1)輸入設備監聽。應用程序設計的第一步是獲取用戶錄音設備(如麥克風)的輸入。在虛幻引擎中,可以利用內置的聲音輸入模塊或引入外部第三方插件來實現此功能。模塊在UI界面啟動時、用戶發出聲音時自動激活,捕捉到音頻數據并進行下一步處理。

(2)語音識別。語音識別是實現虛擬數字人語音交互應用程序的關鍵環節之一。應用程序接收到用戶的語音輸入后,需要將音頻數據轉換為可供chatGPT理解的文本數據。為實現這一目的,可以調用語音識別服務,通過云服務方式實現。

(3)與ChatGPT交互。將用戶的語音成功轉換為文本后,需要將這些數據發送給ChatGPT模型以生成相應文本回應。借助OpenAI提供的應用程序編程接口(Application Programming Interface,API),可以方便地實現與ChatGPT的通信。在虛幻引擎中,可以使用Set Open AiApi Key藍圖系統編寫網絡請求和數據處理功能。

(4)文本轉語音。當應用收到ChatGPT所生成的文本回應時,需要將這些文字轉換為實際的語音輸出。這一步驟可借助文本轉語音(TTS)引擎實現,其中,微軟的TTS是一種可選方案。處理生成的音頻數據后,需要將其轉換為虛擬引擎支持的格式,以便應用程序調用。

(5)驅動虛擬數字人動畫。成功獲取音頻數據后,需要將聲音與虛擬數字人的面部動畫融合,以產生協調一致的效果。根據音頻信號,應用程序可自動生成虛擬數字人的嘴型、表情等動畫效果,使模型更具真實感。

(6)動畫與聲音同步播放。為提供緊密協調的用戶體驗,需要同步播放聲音和對應的嘴型動畫。虛幻引擎提供了MetahumanSDKATL插件和動畫藍圖(Animation Blueprints)這兩個模塊,可用于實現聲音和動畫的同步播放。

通過上述描述,在虛幻引擎中實現虛擬數字人語音交互應用,涉及多個重要環節和相關技術。這些關鍵模塊需要高度協同,確保應用程序連接無縫、運行效果極佳。本文從輸入設備的監聽、音頻數據傳輸到生成回應,再到最后的動畫和聲音相互搭配,打造出一款自然、引人入勝的數字人語音交互系統。

2.3 虛擬數字人語音交互在虛幻引擎中的實現方法

虛擬數字人語音交互在虛幻引擎中的實現,是將前面階段中的程序設計轉化為可執行的藍圖和配置。實現過程中需要用到多個技術模塊和數字資源。以下是更詳細的步驟。

準備虛擬數字人模型。需要一個3D模型來作為虛擬數字人的形象,確保模型包含面部動畫(如骨骼、混合形),以支持語音同步產生的嘴型動畫。將3D模型導入虛幻引擎項目中,設置骨骼與模型的綁定,使用虛擬數字人來設置起始場景。使用相應的動畫藍圖,確保虛擬數字人能完成所需的基本動作,如圖2所示。

圖2 虛擬數字人模型綁定

配置用戶麥克風輸入,實現語音識別。通過第三方插件AzSpeech-Voice and Text插件來實時獲取用戶的麥克風輸入數據。將插件模塊添加到藍圖,添加Speech to Text with Default Options庫,對接收到的音頻數據進行識別,將識別結果保存為字符串變量,傳輸至ChatGPT API交互階段。

連接ChatGPT API。在虛幻引擎中安裝并啟用OpenAI API插件,以支持與ChatGPT 語言模型的交互功能。在藍圖中創建一個新事件來與ChatGPT API進行交互。使用插件提供的“Set OpenAI API key”功能來設置并獲取API密鑰,從而實現與ChatGPT服務器的連通。配置API密鑰,即可在虛擬數字人項目中搭建起與ChatGPT API通信的渠道。請求節點成功后,分析返回的JSON數據,以提取ChatGPT返回的文本內容,為接下來的文字轉語音和嘴型動畫環節提供數據。

實現文字轉語音服務。通過文字轉語音(TTS)服務將ChatGPT API返回的文本內容轉換為音頻。本案例采用微軟云服務,以AzSpeech-Voice and Text插件作為語音轉換模塊。將Text To Sound Wave with Default Options庫添加到項目,編寫自定義函數以接收文本數據并調用TTS服務。音頻文件可以被保存為WAV或者MP3格式,并傳輸至虛擬數字人音頻播放階段。

設置音頻播放和嘴型同步動畫。需要將虛擬數字人的面部動畫(骨骼、混合形)聯系起來,實現聲音與嘴型動畫的同步。在虛擬數字人的藍圖中,配置ATLMapping info映射信息。在Pose Asset中選擇mh_arkit_mapping_pose映射姿勢,實現數字人嘴型的綁定,如圖3所示。同時,使用MetaHumanSDKAPIManager獲取為引擎子系統,把ATL Audio to Lipsync庫獲取音頻播放長度創建動畫節點,同步對齊嘴型,保持實時音頻同步狀態。根據語音的長度控制嘴型動畫,在音頻完成播放后,虛擬數字人嘴型回到初始閉合狀態,等待新的語音播放,如圖4所示。

圖3 虛擬數字人表情綁定

圖4 關鍵實現藍圖

3 虛擬數字人在語音交互領域的典型應用

3.1 虛擬數字人在娛樂領域的應用

虛擬數字人在娛樂領域的應用得益于語音交互技術的發展和研究。語音合成指將以文字為主的媒體內容轉化為人類語音輸出。和語音識別一樣,語音合成也是智能語音技術的重要組成部分。借助這一技術,虛擬數字人能更好地為用戶服務,定制個性化的互動方案。用戶能夠與虛擬數字人進行自然且愉快的語音對話,來分享內心的想法和感受。每個虛擬數字人根據用戶的問題進行智能的回復,這樣設計的目的在于滿足用戶在娛樂方面的多樣化和個性化需求。總體上說,虛擬數字人和語音交互技術的結合,確保了用戶在使用過程中能夠獲得流暢、清晰且富有邏輯性的互動體驗。

3.2 虛擬數字人在教育領域的應用

基于ChatGPT語言模型開發的虛擬數字人在教育領域得到了廣泛關注。教育數字人具備高度的擬人化特征,其外觀和性格特征均可與真實人類媲美。無論是在微表情、發質還是膚質等方面,教育數字人都能夠還原真實人類的模樣,并且能夠在不同的光影條件下進行對應的渲染和模擬,呈現出與真實教育從業者極為相似的虛擬形象[4]。總之,教育數字人的高度擬人化特點,使其在教育領域的應用價值日益凸顯。虛擬數字人通過創新的互動方式與學生溝通,激發學生的學習好奇心與興趣,從而提高他們的學習積極性。基于ChatGPT語言模型的虛擬數字人被賦予了與學生進行語言交流的能力,可以根據學生的問題提供針對性的解答和指導。

3.3 虛擬數字人在影視制作中的應用

虛擬引擎在影視制作中發揮著重要作用。它打破了嚴格的制作流程,使模型和貼圖處理能夠同時進行,特效制作也可以提前進行。虛擬引擎支持動作捕捉設備,拓展性和容錯度更好,給創作團隊帶來了更大的靈活性和便利性[5]。虛擬數字人可以在影視作品中擔任虛擬角色。在基于ChatGPT語言模型的虛擬數字人語音交互應用中,虛擬數字人與實際人物或其他虛擬角色展開自然的對話與互動,從而極大地豐富觀眾的觀影體驗。得益于ChatGPT強大的語言處理能力,借助虛擬數字人這一寶貴素材,導演和編劇既能節省角色創作成本,又能豐富劇情表現,全面提升作品藝術價值,從而使觀眾流連忘返于獨特的視聽盛宴。

4 結 語

隨著人工智能技術的飛速發展,虛擬數字人作為一種新興交互形式受到了廣泛關注。虛擬數字人能實現精準、高效的語音交互體驗,已走進人們的視野。虛擬數字人打破了傳統界限,為跨領域合作提供了空間,推動了娛樂、教育、影視、數字媒體等多規模產業的革新與發展。基于ChatGPT語言模型的語音交互技術,將逐漸成為推動虛擬數字人普及應用的重要驅動力。

猜你喜歡
引擎動畫文本
做個動畫給你看
動畫發展史
我的動畫夢
文苑(2019年22期)2019-12-07 05:28:56
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
藍谷: “涉藍”新引擎
商周刊(2017年22期)2017-11-09 05:08:31
我是動畫迷
學生天地(2016年9期)2016-05-17 05:45:06
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
無形的引擎
河南電力(2015年5期)2015-06-08 06:01:46
基于Cocos2d引擎的PuzzleGame開發
主站蜘蛛池模板: 国产精品无码一二三视频| 午夜国产大片免费观看| 在线中文字幕日韩| 欧美日韩国产成人高清视频| 精品国产91爱| 亚洲日本中文字幕天堂网| 精品久久久久成人码免费动漫 | 久久人人妻人人爽人人卡片av| 亚洲欧美自拍中文| 国产中文一区二区苍井空| 成人噜噜噜视频在线观看| 欧美亚洲网| 国产剧情国内精品原创| 青青草国产免费国产| 中文字幕免费视频| 最近最新中文字幕在线第一页| 国产99精品久久| 日本免费福利视频| 成人午夜天| 国产超薄肉色丝袜网站| 亚洲黄网在线| 亚洲无码高清一区二区| 欧美日韩在线成人| 91探花在线观看国产最新| 亚洲视频在线青青| 国产日产欧美精品| 亚洲精品动漫| 欧美精品在线免费| 欧美精品亚洲二区| 亚洲欧美不卡| 国产Av无码精品色午夜| 国产精品视频系列专区| 久久人与动人物A级毛片| A级毛片无码久久精品免费| 永久在线播放| 美女被操黄色视频网站| 欧美三级不卡在线观看视频| 成人中文在线| 国产福利在线观看精品| 亚洲乱码视频| av在线手机播放| 欧美日韩另类国产| 中文字幕在线永久在线视频2020| 日韩a在线观看免费观看| 大陆精大陆国产国语精品1024| 91福利在线观看视频| 91免费国产在线观看尤物| 国产亚洲精| a级毛片网| 亚洲成人77777| 亚洲欧洲国产成人综合不卡| 国产国拍精品视频免费看| 91原创视频在线| 久久综合丝袜日本网| 99久久国产综合精品2023 | 青青草一区二区免费精品| 99在线观看精品视频| 国产菊爆视频在线观看| 亚洲Av激情网五月天| 国产91av在线| 日本精品影院| 国产免费人成视频网| 中文一级毛片| 91色国产在线| 成人福利在线视频免费观看| 国产精品自在线拍国产电影 | 亚洲va视频| 国产成人麻豆精品| 国产麻豆福利av在线播放| 免费一级大毛片a一观看不卡| 欧美日韩国产系列在线观看| 午夜视频在线观看免费网站| 色135综合网| 久久五月视频| 免费看一级毛片波多结衣| 特级做a爰片毛片免费69| 日韩精品一区二区三区大桥未久 | 日本一本在线视频| 中文字幕在线观看日本| 黄色在线不卡| 亚洲最新地址| 亚洲九九视频|