Q:《數碼影像時代》
A:安徽聽見科技有限公司(科大訊飛全資子公司)副總經理談冰
2016年圍棋人機大戰中韓國國手李世石1:4憾負谷歌機器人AlphaGo,由此掀起了人工智能的熱潮。近兩年來,AI的發展更是一路高歌猛進,逐漸向交互式體驗領域拓展,科大訊飛依托智能語音技術成功領跑AI應用服務媒體行業。以此次2018CCBN(中國國際廣播電視信息網絡展覽會)為契機,科大訊飛展出了旗下最新研發的一系列智能語音應用產品?!稊荡a影像時代》記者現場采訪了安徽聽見科技有限公司(科大訊飛全資子公司)副總經理談冰,希望借此機會讓大家對科大訊飛人工智能在媒體行業的應用有一個更深入的了解。
Q:科大訊飛今年是第一次參加CCBN,作為一家專注于智能語音處理技術開發、服務的互聯網公司,來參加這樣的廣電展有著怎樣的考量?希望達到什么樣的目標呢?
A:媒體是我們新介入的一個行業,語音技術在這個行業里將會成為一個剛需性的應用。傳統媒體的內容生產和傳播當中有很多環節是完全可以通過人工智能技術來提升效率的。我們曾做過一次測算,在一檔節目制作過程中,至少在文字采編這一塊的工作效率完全可以提升4到6倍,這樣就可以大幅度釋放記者編輯工作人員的精力,投入到更多原創內容的生產中去。我們希望科大訊飛基于現有的人工智能技術,能夠在內容生產傳播方面來提供一些技術支撐和應用方案。
Q:科大訊飛目前在人工智能語音方面做得非常出色,未來在媒體行業的發展方向或布局又是怎樣的呢?
A:目前我們在人工智能技術的媒體應用方面主要聚焦在語音技術上,但實際上整個媒體行業對于人工智能的訴求,不僅限于這個層面,未來我們是要打造一個全方位的AI媒體云平臺。在這個體系里面除了我們目前的產品服務之外,還包括其他一些人工智能技術,比如機器翻譯、人臉識別、自然語言理解等。在這個基礎上圍繞著媒體行業的整個采編、審核、傳播等業務流程,來建立我們的各種應用形態。
Q:未來十到二十年的時間內,人工智能語音交互技術將會對我們的生活,尤其是在媒體應用方面產生怎樣的影響?
A:當前人工智能語音交互技術已經開始進入我們生活的方方面面,比如語音輸入法、語音導航、翻譯機、智能家庭、智能玩具等等。隨著時間的向前推移和世界各國間商貿、文化交流的加強,未來它在跨文化溝通交流領域會有更大的發展空間。今年的兩會上,我們劉董事長就提出了一項打造全球范圍內的共同語言計劃,這會成為人工智能語音交互技術未來的一大發展趨勢。
在媒體應用方面,目前最直觀的就是語音轉寫,在這一點上,訊飛的語音轉寫已經走在了行業的前端。未來在這方面的應用實踐,更多的應該還是伴隨著知識、資訊傳播的需要,最大程度上將人解放出來,提升效率與體驗感。
Q:除了剛才提到的正在落地實施的廣電行業解決方案,我們看到科大訊飛也有一些針對兒童的智能產品,在這方面的切入點是什么呢?
A:切入點其實依然還是基于我們訊飛的人工智能技術。傳統的兒童的玩具都是屬于機械化的,而我們在這次展會上發布的一些兒童玩具,它更偏向于和孩子之間能夠進行相對比較智能化的語音交互。比如說我們推出的阿爾法蛋機器人,通過它孩子可以進行一些英語和漢字的學習,它甚至還能夠給你講故事、播放兒童音樂等等,這完全都是基于語音交互的方式來進行的。
我們一直講人工智能的發展,其實它可以分為運算智能、感知智能、認知智能三個階段,現在訊飛在感知智能方面做語音合成,已經讓機器能聽而且會說了,應用相對是比較成熟的。目前訊飛也在不斷向認知智能階段去跨越,而且在認知智能領域中的閱讀理解、邏輯推理知識圖譜、圖像識別等方面也已經取得了一些實際成果。
Q:如果僅從技術角度來講,市面上常見的智能手機借助APP就可以輕松實現科大訊飛此次展出的“譯唄”翻譯機的功能,那么相比之下它的突出優勢又在哪里呢?
A:影響語音的識別效果有很多方面,其中非常重要的一個就是環境。“譯唄”翻譯機內含一個降噪矩陣模塊,即使是在嘈雜環境下也可以保證很高的語音識別度,而且和聲源間的有效識別距離也遠遠大于手機,它的適用場景也與手機有很大差別。
另一方面,它還裝配有SOS緊急求救模塊,若在國外旅行過程中遭遇突發緊急情況,可以通過它快速與駐地領事館取得聯系,語音直接就可以傳送過去,非??旖?。
以上可以看出科大訊飛確實走在了人工智能應用服務行業的前沿,依托語音處理技術真正實現了智能化的交互式體驗。在人工智能概念如火如荼的今天,科大訊飛作為行業的領跑者,將其具象化為可感可觸的實物與具有前瞻性的解決方案,給這一概念的落地提供了更多的操作方法與思路借鑒。