[內(nèi)容提要]人工智能已經(jīng)成為近些年來各個領(lǐng)域的主要應(yīng)用之一,視頻行業(yè)通過綜合運用專業(yè)性的機器人、AI主播、多元化算法、大數(shù)據(jù)存儲、機器審核等多種智能技術(shù)解放平臺人員機械性重復(fù)性工作的雙手,實現(xiàn)了對用戶個性化的內(nèi)容匹配推送,達到了多元化的渠道傳播,有效地對用戶的使用效果進行了收集和判定,并對整體的流程進行再造和優(yōu)化。但是人工智能在激勵視頻領(lǐng)域發(fā)展的同時也凸顯了一定的問題,其背后隱藏著技術(shù)所帶來的偏向,偏向所帶來的實質(zhì)是平臺與受眾關(guān)系斷裂潛在的危機。而技術(shù)持有方嘗試通過重新提升對人工智能實踐理念的認知,以人為本,尊重受眾,也許會迎來新的轉(zhuǎn)機。
[關(guān)鍵詞]人工智能;視頻領(lǐng)域;算法;科技反思
人工智能作為多種計算機技術(shù)的集合概念,其影響力不僅僅是停留在計算機領(lǐng)域,近年來以算法、大數(shù)據(jù)、機器學(xué)習(xí)等多種智能技術(shù)為代表的人工智能已經(jīng)逐漸滲透到傳媒領(lǐng)域,并因此產(chǎn)生了“人工智能+傳媒”的應(yīng)用熱潮,應(yīng)用范圍覆蓋文字、圖片和視頻領(lǐng)域。2019年新華智云8月26日發(fā)布了自主研發(fā)的25款媒體機器人,希望能用智能化的技術(shù)、媒體機器人來解決媒體人在新聞生產(chǎn)過程中的痛點,更快更好地采集和處理新聞資源。
一、激勵:人工智能在視頻領(lǐng)域的盛況
除了通過機器人減少媒體工作者的工作負擔(dān),互聯(lián)網(wǎng)公司巨頭們也率先向人工智能發(fā)起進攻,其中最具代表性的便是視頻領(lǐng)域和新聞資訊類APP的智能算法技術(shù)。以短視頻為例,平臺通過算法采集用戶的個人基本信息、頁面逗留時間、視頻標簽類型、點贊與評論信息等,實現(xiàn)對用戶畫像的描摹,進而探究出用戶的視頻類型偏好,進行個性化推薦從而增強用戶黏性。“抖音短視頻”“西瓜視頻”“微視”等短視頻APP均是采用此種算法。除算法外,其他類型的人工智能技術(shù)也以多元化的組合方式對視頻領(lǐng)域的內(nèi)容創(chuàng)作、內(nèi)容審核、渠道分發(fā)以及后續(xù)的受眾效果反饋產(chǎn)生總體影響,實現(xiàn)對視頻生產(chǎn)整個流程的優(yōu)化和再造。
(一)千人千面,算法推薦
人工智能是指基于大數(shù)據(jù)、算法和云計算三項技術(shù)基礎(chǔ),開發(fā)用于模擬、延伸和擴展人的智能的理論和方法的新技術(shù),是制造智能機器、可學(xué)習(xí)計算程序和需要人類智慧解決問題的科學(xué)和工程。依靠人工智能技術(shù)發(fā)展的短視頻實現(xiàn)了平臺和用戶的雙重解放。依靠算法,實現(xiàn)對用戶的精準捕捉。如果說傳統(tǒng)的媒體無法實現(xiàn)對用戶或受眾一對一精準的了解,那么在應(yīng)用了算法的視頻行業(yè)則十分明確地鎖定了每一位用戶,了解每一位用戶的精準信息和偏好,節(jié)省了平臺去尋找用戶的時間,讓用戶主動找到相應(yīng)的視頻平臺。正如算法新聞公司捕捉個體出讓的隱私信息,包括個人的地理位置、頁面逗留時間、政治立場、關(guān)系數(shù)據(jù)等,為每個人建構(gòu)一個“數(shù)字身份檔案”,以此為基礎(chǔ)來進行精準化、個性化的推送。
基于這樣的算法技術(shù),短視頻平臺實現(xiàn)了高匹配度的內(nèi)容分發(fā)機制,基于數(shù)字檔案的建立,平臺可以快速根據(jù)視頻內(nèi)容的特點、標簽、話題等要素實現(xiàn)對已關(guān)注受眾和潛在受眾的針對性分發(fā)。抖音短視頻APP是這種算法的主要代表,抖音平臺通過對發(fā)布者的粉絲數(shù)量、發(fā)布頻率、視頻內(nèi)容質(zhì)量給予一定的流量權(quán)重進行初始投放,在經(jīng)過一定周期后測評投放效果,根據(jù)其熱度的高低進行二次流量投放,這樣極大的解放了平臺方內(nèi)容篩選人員的雙手。而對于受眾,基于人工智能的內(nèi)容審核機制使他們在初次看到多元化視頻內(nèi)容的基礎(chǔ)上滿足了其獵奇心,而在“算法”的持續(xù)進攻下,獵奇心轉(zhuǎn)變?yōu)榱苏加杏K惴ㄇ逦牧私饬耸鼙姷囊曨l偏好類型,在此基礎(chǔ)上受眾的使用黏性開始提升,視頻行業(yè)的邊際效益發(fā)揮到了最大。大數(shù)據(jù)的出現(xiàn)算法的出現(xiàn)縮短了視頻內(nèi)容達到目標受眾的周期時間,提升了用戶的受眾黏性,而這也是各大短視頻應(yīng)用巨頭用戶活躍量不斷提升的重要原因之一,為行業(yè)的發(fā)展注入了活力。而千人千面的算法也打破了傳統(tǒng)的一對多內(nèi)容分發(fā)方式,實現(xiàn)了對長尾理論的有效應(yīng)用,最大限度地開拓了受眾市場。
(二)智能專門化,應(yīng)用機器人
在新華社所發(fā)布的25款智能機器人中有關(guān)處理視頻的機器人包括視頻包裝機器人、直播剪輯機器人、視頻防抖機器人、字幕生成機器人、智能配音機器人等多款機器人,這些機器人很好地協(xié)助了各大媒體內(nèi)容的采集和生成,更有利于一次采集多元生成模式的實現(xiàn)。據(jù)了解,目前浙江、山東等地新聞人已在這些媒體機器人的協(xié)助下開展新聞資源的采集和處理。大至地震、臺風(fēng)等突發(fā)事件的報道,小至為視頻添加字幕的日常工作,有了各種機器人的助力,使用者的普遍感受是“操作簡單、提效明顯、成果專業(yè)”。這些機器人大規(guī)模的實踐與應(yīng)用有效地解放了媒體工作者的硬性工作,激勵了行業(yè)的產(chǎn)出效果,同時也賦予了媒體工作者更多策劃選題和商討創(chuàng)意的時間,推動了優(yōu)質(zhì)視頻內(nèi)容的生產(chǎn)。
在2019年8月的超強臺風(fēng)“利奇馬”的報道中,浙江廣電集團旗下的錢江都市頻道新聞部用數(shù)據(jù)新聞機器人制作了多條數(shù)據(jù)新聞視頻。專業(yè)化的機器人對于視頻中所需的各個要素都能做到一對一服務(wù),專業(yè)化的機器人對接提升了視頻生成的整體時效,使傳統(tǒng)媒體在視頻內(nèi)容的制作輸出上提高了運作效率。不僅如此,專業(yè)化的AI剪輯軟件程序也不斷涌現(xiàn),提升了普通受眾制作視頻內(nèi)容的能力,進而激發(fā)了視頻領(lǐng)域的活力。正如2019年OPPO手機品牌推出的Reno手機,其中自帶的Soloop即錄剪輯APP支持AI自動剪輯、AI自動添加字幕、智能轉(zhuǎn)場、濾鏡、音樂等實用性功能,對于視頻后期制作助力不少。另外還有小米的CC9 Pro型號手機內(nèi)置有Vlog智能視頻剪輯功能,可以一鍵生成Vlog視頻。而在2019年的國慶大閱兵現(xiàn)場,“索貝”牽手央視對現(xiàn)場的閱兵方陣進行了AI視頻剪輯的實地操作。從大閱兵三軍儀仗隊進入視線開始,通過新聞云,AI引擎能夠自動編輯前方70余個機位的畫面內(nèi)容,平均耗時90秒。以上種種案例已經(jīng)說明智能化的程序從機器人到APP已經(jīng)對視頻領(lǐng)域全面發(fā)力,而情感化視頻畫面的識別和定位也將是該領(lǐng)域深度學(xué)習(xí)的下一個方向。
(三)虛擬主播可視化,建構(gòu)沉浸化敘事
人工智能的不斷發(fā)展在基于圖像和聲音的基礎(chǔ)上產(chǎn)生了AI主播,這種主播模擬真實主播的聲音、神態(tài)、語氣進行相關(guān)新聞視頻的播報和講解,即所謂的新聞AI主播。AI主播立足于主播們所形成的資料庫,對這些真實主播們的聲音、語調(diào)、神態(tài)進行深度學(xué)習(xí),從而做到虛擬的在場。也正是因為AI主播們不受各種人為因素的干預(yù),所以可以做到全天候、不間斷的直播,為實現(xiàn)全程媒體奠定了一定的基礎(chǔ),也實現(xiàn)了視頻內(nèi)容制作的全程參與。2018年11月7日,在第五屆世界互聯(lián)網(wǎng)大會上搜狗與新華社聯(lián)合發(fā)布了全球首個全仿真智能AI主持人。而在2019年3月3日,新華社再次聯(lián)手搜狗推出了全球首個AI合成女主播“新小萌”,AI主播可以每天24小時在其官方網(wǎng)站和社交媒體平臺上工作,從而減少生產(chǎn)成本,提高生產(chǎn)效率。作為新華社的“新員工”,AI合成主播上線后立即投入到新聞報道中并實現(xiàn)量產(chǎn),目前已播報新聞3400余條,累計時長達10000多分鐘,參與了包括第五屆世界互聯(lián)網(wǎng)大會、首屆進博會等重要報道,是助力新華社新聞生產(chǎn)的新生力量。除了主流媒體進軍AI主播,相關(guān)直播軟件也開始試水。在2019年9月10日夜問“斗魚圓桌pie”的特別節(jié)目里,科技自媒體人那巖的虛擬形象“那小巖”出現(xiàn)在直播間里,并且引來了觀看直播的網(wǎng)友們大量彈幕評論。AI主播的出現(xiàn)為視頻領(lǐng)域創(chuàng)造了又一個新的熱潮,在一定時期內(nèi)增強了受眾對視頻節(jié)目的注意力。
此外,隨著視頻行業(yè)的火熱,數(shù)據(jù)可視化技術(shù)也逐漸得到應(yīng)用,尤其是在處理大批量的數(shù)據(jù)時通過信息化圖像將數(shù)據(jù)盤活,從而在短時間內(nèi)提升了受眾對于信息的解讀接收能力。新華智云作為新華社的智能媒體平臺在其所發(fā)布的25款智能機器人中,就有關(guān)于處理數(shù)據(jù)可視化的機器人。機器人可將得到的數(shù)據(jù)依照不同的維度要素進行分類,并以此產(chǎn)生不同形態(tài)的圖像,將每一幀的圖像進行動態(tài)組合即得到了可視化的數(shù)據(jù)視頻。以2019年底武漢市暴發(fā)的新型冠狀病毒肺炎為例,新華智云根據(jù)國家衛(wèi)健委所發(fā)布的相關(guān)感染人數(shù),每天由相應(yīng)機器人自動生成疫情變化視頻。其中包括每天的感染人數(shù)折線變化情況,并依據(jù)相關(guān)地區(qū)要素維度生成全國感染概況,可以直觀的了解到全國各省市的疫情發(fā)展情況,視頻以極短的時間為限度帶動受眾短時間內(nèi)了解疫情相關(guān)信息。AI主播聯(lián)合數(shù)據(jù)可視化在視頻領(lǐng)域減輕了媒體工作者的工作負擔(dān),提升了受眾對于視頻的關(guān)注度和解讀力,從而在拉近受眾與視頻距離的同時也拉近了與媒體的距離。
二、規(guī)訓(xùn):人工智能背后受眾消費的反轉(zhuǎn)
人工智能在視頻領(lǐng)域的應(yīng)用的確為行業(yè)激發(fā)了活力,實現(xiàn)了用戶紅利的增長和有效利用,也有效的提高了視頻領(lǐng)域的運作效率,實現(xiàn)了多渠道的新聞傳播和信息解讀。但是科技向來是把雙刃劍,在人工智能助力視頻領(lǐng)域的背后其實也存在著令人值得反思的地方,人工智能在視頻領(lǐng)域打造上述繁榮景象的背后我們更需要探究其背后的本質(zhì),技術(shù)的出現(xiàn)為平臺所利用,平臺為受眾服務(wù),受眾在消費平臺也在消費技術(shù)。但是可怕的是受眾被悄無聲息的技術(shù)所引誘,進而失去主動出入的積極性,成為“上癮”的被消費者而不自知,這是一種細思極恐的反轉(zhuǎn)。
(一)表面的多元,背后的同質(zhì)
算法作為人工智能的組成部分,其在短視頻領(lǐng)域的應(yīng)用十分廣泛,尤其是在用戶的個性化方面。算法可以根據(jù)每位用戶的在短視頻頁面的具體操作情況判斷出用戶的視頻類型偏好,從而不斷向用戶推薦該類視頻作品,實現(xiàn)對用戶畫像的描摹,增強用戶的黏度,提升用戶的使用時間。但事實上這樣的行為對于用戶來說并非是百益無害的,用戶會沉浸在自己的喜好中,而拒絕接受其他視頻信息,即所謂的“信息繭房”。當(dāng)算法成為了過濾器,用戶只接受算法過濾后的視頻內(nèi)容,千人千面算法實現(xiàn)的同時卻也造成了個人與個人、個人與群體、個人與社會之間的潛在斷裂。算法總希望順應(yīng)用戶的心理,為他們提供“悅耳”的聲音,但某些時候,它也需要提供一些刺耳的聲音,讓用戶了解真實世界的多面性。
算法的個性化推薦將為每位用戶打造“個人密室”,造成個人、群體、社會之間的隔斷,信息接收的窄化和缺乏公共性議題將導(dǎo)致這三種圈層之間無法實現(xiàn)有效的溝通與流動。算法個性化推薦的視頻機制也干預(yù)了個人議題的設(shè)置,“我的日報”現(xiàn)象自然屢見不鮮,但是無法實現(xiàn)公共新聞的參與進程,宏觀層面視頻內(nèi)容多元化的背后其實是微觀層面用戶個人視頻的單一化。而算法的本質(zhì)其實是作為一種權(quán)力的象征,如編輯終審權(quán)本身是作為傳統(tǒng)媒體所擁有的媒體權(quán)力,卻在算法為基礎(chǔ)的人工智能背景下,新媒體以此為刃瓦解了內(nèi)容的審核分發(fā)權(quán)。英國文化研究專家斯科特·拉什(ScottLash)強調(diào):“在一個媒體和代碼無處不在的社會,權(quán)力越來越存在于算法之中。”個性化視頻推薦的背后蘊含著算法實踐平臺的權(quán)力偏見,算法的偽中立性在視頻的個性化推薦和算法新聞的推出中體現(xiàn)得淋漓盡致,算法造成的個性化推薦導(dǎo)致受眾的嚴重依賴,受眾的興趣被算法當(dāng)作引誘受眾消費的初始點,但逐漸受眾被算法的個性化推薦套牢,無路可逃。
(二)客觀的收集,主觀的利用
人工智能中的大數(shù)據(jù)與算法兩者相輔相成,大數(shù)據(jù)負責(zé)收集信息用于算法生成的運算機制,但是大數(shù)據(jù)的使用也存在著危機,尤其是關(guān)于用戶隱私泄露,濫用數(shù)據(jù)的危機。而在視頻領(lǐng)域大數(shù)據(jù)的應(yīng)用包含著對每位用戶個人信息的收集,從私人的硬性信息(即姓名、性別、聯(lián)系方式、地理位置等)到彈性信息(即視頻觀看時長、軟件使用時長、類型偏好、視頻分享的社交鏈接等)無所不包。而這些信息的泄露將給用戶造成潛在的個人危機,從而對某個視頻背后的平臺或所屬媒體造成商業(yè)名譽損失,也會進一步地對視頻領(lǐng)域的生態(tài)環(huán)境造成破壞。在2019年9月一款名為“ZAO”的APP一經(jīng)發(fā)布便惹來爭議,該款軟件可以將影視劇中明星的臉換成用戶自己的臉或他人的臉用于生成視頻內(nèi)容,“ZAO”的用戶使用協(xié)議中規(guī)定,用戶如果把內(nèi)容中的臉換作使用者的臉或他人的臉則視為同意或確保肖像權(quán)權(quán)利授予“ZAO”及其關(guān)聯(lián)公司,并在全球范圍內(nèi)完全免費、不可撤銷、永久、可轉(zhuǎn)授和可再許可的權(quán)利等。這些規(guī)定無疑嚴重侵犯了用戶的隱私,收集用戶數(shù)據(jù)并存在一定商業(yè)利用的潛在可能。視頻大數(shù)據(jù)的收集在于為用戶提供更好的服務(wù),而不是讓用戶赤裸裸地面對網(wǎng)絡(luò)世界無力自保。
此外,由于海量數(shù)據(jù)背后存在著巨額的商業(yè)利益,大數(shù)據(jù)技術(shù)的視頻應(yīng)用方會冒著違規(guī)用戶意愿的風(fēng)險直接收集數(shù)據(jù),從而為后續(xù)長期的視頻平臺精準定位制定發(fā)展策略。早在2018年YouTube平臺就被曝收集了大量13歲以下兒童的數(shù)據(jù),其中包含電話號碼和地理位置等信息并追蹤了他們在許多網(wǎng)站上的瀏覽習(xí)慣,且在沒有獲取許可的前提下利用這些數(shù)據(jù)提供精準的廣告服務(wù)。人工智能的底線在于不違背用戶、群體、社會的利益,且這些圈層是息息相關(guān)的。而數(shù)據(jù)作為物與物、物與人、人與人之間的連接不應(yīng)該將用戶玩弄于股掌之間,而是應(yīng)該成為治理和維系視頻領(lǐng)域良好秩序的紐帶。
(三)虛擬的困境,沉浸的悖論
AI主播的出現(xiàn)大大提升了新聞節(jié)目處理緊急突發(fā)事故時的效率,基于文本輸入和語音輸出以及多重分身的智能技術(shù)減少了視頻節(jié)目的出錯率,但是就現(xiàn)階段及未來長時間內(nèi)AI主播只能運用于播報財經(jīng)、體育等硬性新聞。而對于需要包含豐富情感的人文節(jié)目或者其他需要情感觸點的新聞視頻的錄制都還只能卻步,因為受眾通過視頻中的主播所了解到的不只是文字的表面意思,更是有與主播的情感交流和共鳴。AI主播長時間大范圍的應(yīng)用難免會引起受眾的心里抵觸,當(dāng)受眾得知新聞播報主持人為虛擬主播時短期的新鮮感不足以維持長期形成的信賴感和交流感,即無法觸及受眾心中的心理落點。
除了AI主播打造了形象化的視頻敘事新主體,數(shù)據(jù)可視化視頻以及VR、AR等可視化穿戴設(shè)備在視頻領(lǐng)域也逐漸得到應(yīng)用。受眾通過穿戴這些可視化設(shè)備即可進行沉浸式的視頻敘事體驗,多感知性、沉浸性、交互性和構(gòu)想性被認為是虛擬現(xiàn)實最為顯著的典型特征。虛擬現(xiàn)實是融合了視覺、聽覺、觸覺、嗅覺、味覺等諸多感官的輸入和輸出的可交互系統(tǒng),將能夠給人們帶來身臨其境的感覺。華為公司于2019年9月26日發(fā)布的VR眼鏡HUAWEI VR Glass,這比之前的VR系列眼鏡重量更輕,體型更小,并且在手機等移動設(shè)備上即可投屏。這種沉浸式體驗設(shè)備將拉近視頻內(nèi)容與體驗者的距離,從而提升用戶對視頻內(nèi)容的關(guān)注度。但是可穿戴設(shè)備在視頻領(lǐng)域中的應(yīng)用受制于現(xiàn)實的困境,技術(shù)的高門檻和視頻內(nèi)容制作的高成本導(dǎo)致該項技術(shù)只是星星點點展現(xiàn),而并非大規(guī)模的市場化運作。在2013年《得梅因紀事報》制作了《豐收的變化》的VR新聞視頻:其攝制組花費了3個月的時間進行不問斷的拍攝制作,視頻的錄制時間將近320個小時,該報社花費近5萬美元,有22人參與了該項目全程操作。而美國電影學(xué)會則認為,目前利用VR技術(shù)只適合拍攝短片,因為即便是小短片,其制作成本已經(jīng)甚至高達上千萬。而關(guān)于VR技術(shù)在新聞視頻中的運用,斯坦福新聞組就建議記者只在以下敘事中考慮運用VR技術(shù):難以涉足的地方或人們不愿意去的地方,某些親自去過后比通過文章、照片和視頻更容易理解故事的地方,你必須左右兩邊轉(zhuǎn)動頭部的地方。VR視頻內(nèi)容中還存在新聞倫理的矛盾,世界因為互聯(lián)網(wǎng)而構(gòu)建了擬態(tài)環(huán)境,VR技術(shù)則加劇了擬態(tài)環(huán)境的構(gòu)建,而基于鮑德里亞的“擬像”理論,VR超真實技術(shù)的背后實則是符號和代碼的操縱,受眾的沉迷可能會成為VR技術(shù)隨波逐流的擁躉,像提線木偶一樣被擺弄,而失去了自身的意識。
三、科技反思:人工智能的實踐理念
基于上述的分析可知,人工智能技術(shù)背后蘊含的可能性危機使得我們?nèi)ニ伎既斯ぶ悄艿谋澈蟮降资鞘裁矗咳斯ぶ悄茏鳛橐环N技術(shù)它的性質(zhì)本應(yīng)是中立的,但是為人所用就存在了或多或少的主觀I生,追根到底,探究人工智能應(yīng)用的本質(zhì)即是探究人工智能背后的實踐者與受眾的關(guān)系,即人與人的關(guān)系。
(一)以人為本:人工智能平視受眾
算法和大數(shù)據(jù)為基礎(chǔ)的人工智能在視頻領(lǐng)域的實踐使得受眾處于相對被動的地位。人工智能的技術(shù)本質(zhì)是算法,算法的社會本質(zhì)是權(quán)力。人工智能利用算法等技術(shù)將受眾的興趣愛好等個人信息和關(guān)聯(lián)信息進行掃描、記憶、學(xué)習(xí),引導(dǎo)受眾沉浸于個人偏好的圖像化敘事場景,致使受眾逐漸失去了探究其他潛在性視頻類型的機會和動力。看似宏觀層面的千人千面算法推薦實則是個體受眾的單人單面,不利于社會多元化議題的形成和討論,也會在一定程度上對受眾共識的形成造成挑戰(zhàn)。
以抖音為代表的短視頻平臺應(yīng)用的“精英算法”機制在于扶持絕大多數(shù)的頭部賬號,并且在推薦頁面中將70%左右的流量都用于了這些賬號下的視頻作品,這實際上已經(jīng)將受眾放在了一個不平等的位置。短視頻平臺不應(yīng)披著“個性化”的外衣實施“精英算法”的推薦,扶持絕大部分的頭部造成其他用戶視頻內(nèi)容的忽略。而“快手”同作為一款短視頻應(yīng)用,所采用的算法卻是普惠的算法,頭部賬號的推薦流量不會超過總體推薦流量的30%,剩下的70%流量留給每一位用戶,在這樣相對公平的環(huán)境中,算法把受眾放在了與自身平等的位置,是一種平視的關(guān)系。
(二)科技向善:人工智能讓世界更美好
在新華社2019年8月26日的采訪中,快手的CEO宿華表示:“快手本身是人們通過短視頻來表達、交流的社區(qū)。快手不需要特意扶持簽約的大v,快手上的大v就是在這個社區(qū)成長起來的普通人……人們每天的在線時長已經(jīng)接近5到8小時,人與人之間的溝通有30%到40%是在線上進行的。所有的互聯(lián)網(wǎng)企業(yè)都要認真地思考,我們能給這個世界帶來什么,怎樣保證我們帶來的變化能讓世界變得更好。”人工智能的出發(fā)點應(yīng)該是為用戶著想,憂用戶之憂,想用戶之想,讓用戶發(fā)自心底的認同,視頻領(lǐng)域也應(yīng)當(dāng)如是。2019年9月5日,bilibili的CEO陳睿在《晚點Late Post》對其的采訪中說道:“一個真正偉大的企業(yè),考慮的應(yīng)該是利他。”
2019年12月4日,浙江大學(xué)阿里巴巴分校和史蒂文斯理工學(xué)院的研究人員設(shè)計了一種方法,稱為“按語言說話”(LIBS),該方法利用從語音識別器中提取的特征作為補充線索。他們說,它達到了業(yè)界領(lǐng)先的準確性,在字符錯誤率方面,比過去高出7.66%和2.75%。LIBS和其他類似的解決方案可以幫助那些聽障人士觀看缺少字幕的視頻。據(jù)估計,全世界有4.66億人患有失能性聽力障礙,約占世界人口的5%。根據(jù)世界衛(wèi)生組織的數(shù)據(jù),到2050年,這一數(shù)字可能會超過9億。研究人員描述道:“LIBS減少了對無關(guān)框架的關(guān)注。”“幀級知識提煉進一步提高了視頻幀特征的可分辨性,使注意力更加集中。”
人工智能的運用應(yīng)在專門化的階段盡力地去解決用戶的正當(dāng)需求,在視頻領(lǐng)域如此,其他領(lǐng)域亦是如此。技術(shù)的運用在了解用戶的同時不應(yīng)將用戶置于“人為刀俎,我為魚肉”的境況,而應(yīng)通過引導(dǎo)受眾去關(guān)注社會的多元議題。人工智能背后是人的操作,它以其自身的新鮮性、趣味性、科技性引導(dǎo)受眾更加了解自己的同時也應(yīng)更加地了解這個社會,在滿足用戶自身偏好的同時更應(yīng)該嘗試引領(lǐng)用戶關(guān)注群體、社會的現(xiàn)象,增加公共空間交流的可能,這才應(yīng)是人工智能的本質(zhì)歸宿。
四、結(jié)語
視頻作為媒介迭代的產(chǎn)物,在當(dāng)代社會更是因為具備了文本、聲音、圖像等豐富多樣的元素成為受眾所鐘愛的媒介形式,當(dāng)下短視頻和長視頻平臺的火爆即是有利的證明。而人工智能的加入提升了該領(lǐng)域的運作效率,專門化的人工智能和多元化的輔助設(shè)備豐富了視頻的呈現(xiàn)手段,也在一定程度上增強了用戶黏度。但是其背后的技術(shù)偽中立特性使得視頻領(lǐng)域在與人工智能的共處中與受眾出現(xiàn)了潛在的矛盾,而只有學(xué)會處理好技術(shù)與人背后人與人的關(guān)系才能贏得受眾內(nèi)心的最終認同,而這也是以后人工智能在視頻行業(yè)順利發(fā)展必須解決的關(guān)鍵點。