本刊記者 王寅
除了手機,智能語音技術(shù)在呼叫中心、教育考試和醫(yī)療等行業(yè)的生意也越做越大。不超過十年,語音技術(shù)將成為(信息技術(shù))競爭的制高點,發(fā)展語音產(chǎn)業(yè)意義十分重大。
“工信部要抓的事情很多,為什么把語音產(chǎn)業(yè)放在最重要的位置去抓?正是由于我們看到其重要意義及其應(yīng)用前景。”工業(yè)和信息化部副部長楊學(xué)山在2013年11月舉行的中國語音產(chǎn)業(yè)發(fā)展工作座談會上說了這么一段話,“不超過十年,語音技術(shù)將成為(信息技術(shù))競爭的制高點,發(fā)展語音產(chǎn)業(yè)意義十分重大。如果今天看不到這個問題,不抓緊的話,我們將會重復(fù)過去集成電路和軟件的發(fā)展道路。”但當(dāng)時楊學(xué)山的這番話并未在社會上廣泛傳播,我國的語音技術(shù)企業(yè)在公眾之中的影響力也一直處于不溫不火的狀態(tài)。
可是,今年6月的一次眾多企業(yè)家參與的論壇所造成的資本市場波動卻迅速提升了語音產(chǎn)業(yè)及相關(guān)企業(yè)的知名度。
6月15日,科大訊飛股份有限公司董事長劉慶峰在某企業(yè)家大會上發(fā)表了名為《尋找互聯(lián)網(wǎng)風(fēng)口最好的那頭“豬”》的演講,“智能語音技術(shù)”就是他演講中的那頭“豬”。第二天,科大訊飛股票漲停,市值一夜間增長20億。語音技術(shù)及其相關(guān)產(chǎn)業(yè)也因此“名聲大振”。
“我認(rèn)為語音技術(shù)就是內(nèi)容技術(shù),包括自然語音處理技術(shù)和知識信息處理技術(shù)。”楊學(xué)山的這段話概括了語音技術(shù)的主要內(nèi)容,智能語音技術(shù)既包括對語音的識別、合成等處理技術(shù),也包括對語義的理解與處理。
這些內(nèi)涵說起來似乎比較抽象,但智能語音技術(shù)在各個行業(yè)的應(yīng)用卻是看得見摸得著的。
國內(nèi)主要的語音技術(shù)企業(yè)及其合作公司
“客戶常常不知道怎么使用電話語音系統(tǒng)咨詢業(yè)務(wù),所以很多客戶都直接選擇人工客服進(jìn)行服務(wù)。”在招商銀行擔(dān)任客服工作的袁園(化名)對本刊記者表示,雖然這是她的工作,但是高峰期大量等待人工接聽的客戶來電,依然給自己帶來了很大的工作壓力。
“電話客服的語音服務(wù)一般需要客戶選擇電話上不同的按鍵,來獲取相應(yīng)的語音咨詢服務(wù)。但問題是,很多客戶常常不知道自己要咨詢的業(yè)務(wù)到底該按哪個鍵。”袁園表示,有時候客戶還會直接在電話中向她抱怨自助語音服務(wù)太復(fù)雜。“雖然在我們看來這個系統(tǒng)并不復(fù)雜,但客戶確實希望未來的服務(wù)能夠更便捷,畢竟人工客服數(shù)量有限,而且成本很高。”
“全國現(xiàn)在有一百萬席呼叫中心,每年支出上千億元,而且問題的重復(fù)性很高。”在北京云知聲信息技術(shù)有限公司董事長梁家恩看來,這些問題都可以用機器解決。梁家恩舉了個例子:“現(xiàn)在打電話查話費需要先按1再按2,按好幾層才能查到,如果配備智能語音技術(shù),客戶只要說出‘我要查話費’就可以直接得到查詢結(jié)果。”他表示,這在提升用戶體驗的同時,通過語音識別和解析大數(shù)據(jù),企業(yè)可以用機器來解決用戶的眾多常規(guī)需求。“而且這是24小時的服務(wù),大量節(jié)省了呼叫中心的成本。”
這個市場有多大?劉慶峰算了這么一筆賬:“目前部分與我們合作的運營商已經(jīng)節(jié)省了30%的人工成本。預(yù)計到2017年,呼叫中心的總投資會達(dá)到1700億元,超過70%的是人工客服。”如果智能語音系統(tǒng)能在三年內(nèi)替代50%以上的人工,就能將超過800億元的資金投入其他用途,而語音產(chǎn)業(yè)也能從中獲利。
為重復(fù)性勞動浪費大量時間和精力的不僅僅是呼叫中心的客服人員,還有醫(yī)生。國內(nèi)醫(yī)藥生命科學(xué)專業(yè)網(wǎng)站丁香園的一個專項調(diào)查發(fā)現(xiàn),50%以上的住院醫(yī)生平均每天用于寫病歷的時間超過四小時。國外也不例外,根據(jù)美國醫(yī)學(xué)會(AMA)的統(tǒng)計,美國的醫(yī)生在整個職業(yè)生涯中,有15%—20%的時間用在了病歷書寫及相關(guān)文案工作上。
美國蘋果公司Siri的技術(shù)服務(wù)商紐昂斯通訊公司(Nuance)已經(jīng)開始利用語音識別技術(shù)讓醫(yī)生和護(hù)士通過語音錄入病歷,并能實時顯示文字內(nèi)容。相關(guān)統(tǒng)計顯示,醫(yī)生輸入病歷效率因此提高50%以上。
Nuance公司2013年年度財務(wù)數(shù)據(jù)顯示,其業(yè)務(wù)覆蓋醫(yī)療保健、手機及大眾消費、企業(yè)服務(wù)和圖像服務(wù)四大領(lǐng)域,2013年總收入超過18億美元,其中醫(yī)療保健業(yè)務(wù)收入超過8.7億美元,相比2011年醫(yī)療保健部門5.2億美元的收入,增長幅度超過60%。
現(xiàn)在,中文智能語音服務(wù)提供商也開始踏足醫(yī)療行業(yè)。
“我們有大量的付費用戶。”云知聲聯(lián)合創(chuàng)始人康恒表示,雖然語音技術(shù)企業(yè)會提供免費的開放云平臺,但這并不意味著沒有人愿意付費使用語音服務(wù)。在愿意付費的用戶中,醫(yī)療機構(gòu)及醫(yī)療從業(yè)者就是很重要的一類用戶。由于醫(yī)療用語專業(yè)性非常強,因此,醫(yī)療機構(gòu)及醫(yī)療從業(yè)者需要專門為他們量身訂制的智能語音服務(wù)。
“一要針對醫(yī)療的特定業(yè)務(wù)來提升語音識別的準(zhǔn)確程度,二來這些行業(yè)的用戶也有可能會有接入方面的要求或者接口方面的要求。”康恒說,正是由于這些特殊需求的存在,智能語音服務(wù)才能夠在未來從醫(yī)療行業(yè)中獲得更多的“增值業(yè)務(wù)”收入。
3月8日至11日,廣東省舉行了普通高考英語聽說考試。據(jù)廣東省教育考試院的統(tǒng)計數(shù)據(jù),今年的報考人數(shù)創(chuàng)歷史新高,達(dá)71萬多人。這么多考生,如果采用傳統(tǒng)英語口語考試方式,讓英語口語考試官一個一個考查考生的英語會話能力,在四天的時間內(nèi)結(jié)束考試,簡直是不可能的事情。
就讀于廣州市華南師范大學(xué)附屬中學(xué)的李逸就參加了今年的廣東省普通高考英語聽說考試。他告訴本刊記者:“英語聽說考試是計算機輔助測評的,對著電腦說話,不是老師來考查。”
據(jù)本刊記者了解,在廣東省普通高考英語聽說考試中所使用的智能評測系統(tǒng)于2012年底通過廣東省鑒定,并在2013年6月開始在廣東省英語聽說考試中使用。“近兩年這種評測系統(tǒng)很有可能逐步在全國其他省份擴大應(yīng)用范圍。”劉慶峰如此表示。
除了我國,美國也在嘗試將智能語音技術(shù)應(yīng)用在考試中。今年5月,美國教育考試服務(wù)中心(ETS)宣布已經(jīng)在全球范圍內(nèi)對考生身份進(jìn)行語音識別,以防止作弊。早在今年2月,生物語音識別技術(shù)已經(jīng)覆蓋全球130多個舉行托福考試的國家和地區(qū)的考場。ETS全球教育及職業(yè)部門高級副總裁大衛(wèi)·亨特表示:“生物語音識別軟件能有效地鑒別偽造身份的嫌疑,這讓ETS能在報告成績前取消這些考生的分?jǐn)?shù)。”