
傳媒行業從黑白到彩色,從模擬到數字化,從標清到高清再到超高清,從三根線到SDI再到IP化傳輸,很多從業者都經歷完整的傳媒行業的發展,也見證整個傳媒行業崛起。2024年2月, Sora剛剛發布的時候,傳媒從業者產生是否會被AI取代的憂慮,但隨著技術迭代不斷發展,我們發現AI帶來的只是一個全新的生產方式和生產工具,我們要做的就是擁抱這種新的生產工具。像科大訊飛推出的自然語言處理技術和星火大模型,已成為越來越多的國內多領域頭部媒體及企業大模型應用首選,正在加速賦能廣電傳媒行業。
智能語音技術不斷迭代升級
作為智能語音“國家隊”,科大訊飛在智能語音技術領域有著長期研究積累,并在中文語音合成、語音識別、口語評測等多項技術上擁有國際領先成果?;趽碛凶灾髦R產權的世界領先智能語音技術,我們推出并不斷迭代升級訊飛星火大模型、訊飛同傳、訊飛繪文、訊飛智文等產品應用。
其中,訊飛同傳依托科大訊飛語音轉寫、 機器翻譯、語音合成等核心技術,實現多語種混合識別,多語種語音翻譯、會議內容記錄、實時字幕等,并可支持遠程會議人工保障等多種功能。早在2011年,科大訊飛就經國家發展改革委批準與中國科學技術大學成立 “語音及語言信息處理國家工程實驗室”。目前,科大訊飛的語音技術已經形成從識別、轉寫、翻譯到語音合成的完整鏈路,并與眾多行業頭部企業在人工智能、大數據等領域開展全面合作與應用。2024年6月,科大訊飛以多語種智能語音關鍵技術及產業化獲得國家科學進步一等獎。
在機器轉寫和翻譯方面,2015年12月,科大訊飛首次將人類發言同步轉寫成實時字幕,這開啟機器轉寫應用新篇章。2021年11月,在多語種識別比賽中,科大訊飛在15個語種22項比賽中全部是第一名。同時,科大訊飛推出的C端翻譯機作為“口袋中的翻譯官”,支持80多個語種,覆蓋200多個國家和地區。
在語音合成方面, 科大訊飛基于聽感量化的多人混合訓練等合成框架,在配音合成、對話合成等更有表現力的場景方面,以自然通報分5分為滿分的評價指標,已做到接近4.5分的水平,擬人度達到83%。因此,我們這項成熟的語音合成技術,在學習強國、新華社等主流媒體平臺被廣泛應用。
星火大模型推動數字傳媒發展
2023年5月, 科大訊飛首次發布通用大模型“星火認知大模型V1.0”。星火認知大模型的能力包括文本生成、語言理解、知識問答、邏輯推理、數學能力、 代碼能力、多模態能力等方面。今年6月,科大訊飛正式發布訊飛星火大模型V4.0,其文本生成、語言理解、多模態等7個核心能力全面提升,整體超越GPT-4 Turbo。
在國產化算力方面,科大訊飛一直強調大模型技術底座自主可控。2023年10月,科大訊飛與華為聯合打造的首個支撐萬億參數大模型訓練的萬卡國產算力平臺“飛星一號”正式啟用,并在此基礎上開展對標GPT-4的更大參數規模的大模型訓練。該平臺是國內唯一在國產化算力下的大模型基座。在大模型加持下,我們的多語種和多方言免切換識別能力也有了提升,現在可以支持37個語種及37種方言免切換,方言識別效果平均提升30%。另外,科大訊飛打造的企業智能體平臺,可供企業結合業務場景快速構建可落地的智能體應用。
科大訊飛始終致力于支持國家戰略,推動數字傳媒發展。我們率先推出傳媒大模型,該模型覆蓋信息傳播、 文化傳播及國際傳播全流程生產場景,為眾多媒體機構提供全面的智能創作平臺。得益于傳媒大模型加持,我們在內容生產效率、管理制度及內容安全審核等方面實現質的提升。
多模態內容生成方面,科大訊飛的音頻創作能力尤為突出。我們的語音合成技術可以支持廣播節目的AI同期聲配音、AI常態化廣播及國際傳播節目配音。
在圖像創作方面,科大訊飛不僅具有文生圖和文生視頻方面的能力,還賦能全媒體生產流程。在國內外大型活動上,科大訊飛除提供文字轉寫成字幕,還有國際傳播中心或者國際頻道相應翻譯,以及后期語音合成配音。在AI數字人場景應用方面,在媒體、金融、文旅教育、政企等多個行業有相應應用落地,為內容創作者提供相應AI創作助手。
在今后的發展中,科大訊飛將繼續致力于在人工智能生成內容(AIGC)領域為數字傳媒行業注入新的生產力,在內容生產、內容安全、內容管理和內容運營等多個方面進行深入開發和優化。 最終,我們期待在AIGC時代,積極擁抱AIGC工具、AI技術,以及全新視角和生產模式。W
(作者張美靜系科大訊飛股份有限公司智慧傳媒業務總監)
責任編輯:任雨希