在微信越來越普及的今天,微信的語音聊天功能卻讓越來越多的人頭疼。而在去年10月錘子科技2016年新品發布會上,由于羅永浩的大力推介,智能語音輸入突然火了,火爆程度甚至超過了人們對于錘子科技新品手機M1和M1L的關注。那么,智能語音輸入可以成為我們對抗微信語音恐懼癥的靈丹妙藥么?智能時代,究竟該怎樣發聲?
為什么有人那么討厭微信語音
微信是騰訊旗下一大強力產品,根據騰訊公布的財報顯示,微信的月活躍用戶為8.46億人。雖然在數字上比不上騰訊的老牌產品QQ,不過越來越多人偏向于使用微信,微信也已經成為國內月活躍用戶量最多的APP。
微信本是靠著語音聊天這一突破功能,與QQ區別開來,在微信剛推出的時候,人們甚至都會以使用微信語音而讓自己顯得很洋氣。但隨著微信的逐步使用,也有不少人都不喜歡用微信語音了。單從表面上來看,發語音比發文字方便很多,縱使如此,依然有不少人討厭微信聊天的時候對方發語音消息過來,這又是為什么呢?
公共場合放外音很尷尬
現在的手機多是觸屏的,在公車上和朋友微信聊天,對方發來語音,在聽的時候不小心碰到了揚聲器播放模式,聲音就會外放,若是日常聊天內容還好,若是比較隱私的聊天內容,那多尷尬。
而且像公車上、候車室、購物商場等場所還好,多多少少有別人聊天說話的聲音。若是在辦公室或者圖書館,本身環境就非常安靜,惡作劇的朋友要是給你發來奇奇怪怪的語音,不小心放外音出來了,簡直是尷尬得恨不得找個地縫鉆進去…
聽語音比看文字繁瑣
對方發語音消息過來,你想知道對方說啥,就得拿起手機貼到耳朵聽才可以,有時候一次聽不清,還要調大音量再聽一次,若對方是在嘈雜的環境下錄得語音模糊不清,你甚至需要反復聽好幾次才行。若是公共場合,為了避免尷尬,可能還得拿出耳機來才方便聽對方發來的語音。如果對方發來的語音很長,在整個收聽的過程中出現中斷,也需要從頭再聽。更不要提對方在錄音過程中因為猶豫、思考而出現的空白時間,簡直是對時間的最大浪費。
而若對方發來的是文字,一眼看過去就知道對方說的是啥了,文字多的話頂多多看幾秒。
不方便查詢記錄
如果是文字記錄,當自己想找某一段時間或者某個方面的聊天內容時,直接翻看即可找到。比如你去超市朋友拜托你順便幫忙買點零食回來,有瓜子、牛奶、水果、面包,你突然想不起來一共要買幾樣了,擔心漏了想查看一下聊天記錄,文字的話很直白的就可以查看到了。若是語音消息,你還得一個個地聽才知道哪個是對方講要買什么東西的那條,并且聽了一次就得熟記在心,不然忘記了又得重新聽一次了。
語音轉換為文字不準確
可能有的人會說,微信不是自帶語音轉換為文字的功能嗎?長按語音,選擇轉換為文字就可以啦,如果你不想聽語音,可以使用這個功能呢。然而生活中的經驗告訴我們,這個翻譯往往不準確,有部分語音轉為文字后大概的意思能看得懂,然而因僅限于普通話的語音轉換,而并不是每個人的普通話都是那么標準的,有的語音翻譯出來,你根本沒法看出來對方想表達的是啥!如果你想知道對方說什么,只能被迫聽語音才行。
總而言之,從產品角度說,微信語音是個好產品,必須點500個贊。同時,微信語音也是個浪費時間的好產品。這個功能太方便了太順手了,所以越來越多的懶人非常青睞它。難怪之前有人提議,從節省時間的角度出發,發語音之前應該先道歉?!读_輯思維》的主持人羅振宇在談到微信語音時就表示,發語音是不尊重對方時間的一種行為,他還舉了個例子:“有領導在的群里一般沒人發語音。”
語音輸入法早已準備就緒
既然微信語音是這么的“不得民心”,那我們是不是就要完全放棄“語音”這個方便的交流手段呢?回答當然是否定的。如果能夠既保留語音輸入的方便快捷,又輸出節省閱讀時間的文字內容,對于目前移動端的溝通交流來說應該是最好的解決辦法了。
輸入是語音最典型的應用場景,戶外、家里、走路、開車,人們有許多時候都不便于打字,或者說懶得打字,抑或打字效率不夠高,語音就成為一種選擇。隨著語音技術的發展,識別準確率、方言兼容度、噪音抗干擾諸多難題都已得到解決,語音識別率已經達到實用水平。
還記得去年底在錘子發布會上火了一把的訊飛語音輸入法嗎?本來只是配角的訊飛語音輸入法,因為可達一分鐘400字的輸入速度和97%的識別準確率,可以說吸引了很多人的關注。其實訊飛的成功并不偶然,截至2016年6月,訊飛輸入法就已經擁有了3.6億用戶,活躍用戶更是超過1億。其中,語音用戶滲透率高達59%,成了目前國內語音行業不折不扣的龍頭企業。在錘子發布會后,許多用戶跑去應用市場下載了這款軟件,在APP Store工具榜上瞬間沖到了第三名!成為最熱門的輸入法!不僅如此,連帶著股價也迎來了新高。
國內在語音輸入法上,搜狗輸入法、訊飛輸入法和百度輸入法是最主要的三個玩家??拼笥嶏w憑借著語音技術切入輸入法領域;百度輸入法也將語音當做亮點,其宣稱借助于DeepSpeech技術解決了噪音問題。語音輸入量最大的則是搜狗輸入法,其7%的用戶會用到語音識別功能,這一功能每天會有超過1億次的語音轉化量,在整體1.4億的請求次數中占據相當比例,這也從側面表明,搜狗語音應用最關鍵還是輸入。
在具體功能上,語音輸入有許多特點。比如訊飛支持粵語、四川話、閩南話、客家話、上海話、東北話等19種方言,這對于老人家來說簡直就是好幫手,只要對著手機講話就可以把意思表達出來,爺爺奶奶再也不用戴著老花鏡慢慢按鍵盤了。而百度語音輸入法還可以根據用戶說話時的語氣輕重、內容等識別出用戶情緒,自動為用戶匹配符合情緒的趣味表情,很好地彌補了因語音輸入文字時對語意表達的缺失,更好地還原了語音中所表達的情感。
智能時代語音技術百花齊放
語音輸入對于解決微信語音恐懼癥的確是一個好幫手,不過在智能時代,語音技術的使用絕不局限于語音輸入這么簡單。雖然從目前來看,人們對于智能語音識別轉化文字這樣的場景需求并沒有想象的那么豐富。因為畢竟通過智能語音識別轉化為文字的輸入方式,并不是人們最為常用的溝通和聊天的方式,現在人們通過語音輸入轉化識別為文字,場景使用還稍顯小眾。
不過,智能語音作為集合機器學習、大數據、語音識別等技術的集大成者,隨著識別越來越精準,應用場景的越來越豐富,成為下一代入口并不是不可能。語音技術,簡單來說,用戶只需要用說話的方式給服務終端發布命令,就能得到相應的服務。這一產業從上世紀六十年代就已出現,但并不為普通消費者所熟知,消費者對其認知度也比較低。近年來,隨著蘋果、亞馬遜、谷歌、微軟等公司先后推出Siri、Echo等智能語音服務,這一服務以及相關產業也開始被普通消費者和投資界所關注。如果說點擊和觸摸構筑了到目前為止的互聯網時代,那么語音和體感必將成為未來智能時代的主要組成部分。鍵盤作為輸入系統即將被停留在上個時代,人類將用語言和機器進行交互。智能家居和車載成為語音產業最集中的領地,也即將誕生出爆發市場。
語音搜索:移動搜索的重要分支
谷歌、百度、Bing,全球主流搜索引擎的語音搜索比例都在逐步增加,麥克風圖標變得跟搜索框一樣重要。搜索引擎來自移動端的搜索流量均已超過50%,人們在自帶麥克風的移動設備上使用語音更方便,而在移動場景下打字并不方便。有報告指出,百度語音搜索的整體用戶量在2015年增長超過3倍,用戶中的90后和00后人群占比接近50%,其優勢在于省去了中英文輸入法切換的繁瑣、支持口語化多輪交互、能夠提供貼心的語音播報和有聲搜索。
語音助手:不再是被調戲的玩具
幾年前,Siri還是一個被調戲的玩具?,F在,它可以理解很多命令,比如設置鬧鐘、添加日歷,打開App等,語音助理已完成從玩具到工具的蛻變。除了Siri之外,Windows內置的Cortana、Google Now升級而來的Google Assitant,以及百度、搜狗、科大訊飛等公司均推出了自己的語音助理軟件。以百度推出的度秘為例,已經接入到手機百度APP,用戶可在手機百度端直接調用,使用語音對話的形式享受點餐、購物、路線、訂票等多項生活類服務。可見,要做好語音助理并不容易,除了語音識別和語義理解之外,它必須要能“完成任務”,而這需要獲取其他設備和應用的控制權,這一點只有巨頭才能做到,創業型玩家基本已經消失。
語音內容:不再是冷門的形式
微博剛剛興起時,許朝軍做了一個“啪啪”,要做語音版的微博,后來發生的事情大家都知道了。不過,語音內容正在卷土重來。最近在行做的“分答”十分火爆,這款APP集合了語音、打賞、共享經濟諸多新興模式,讓知識分享前所未有的有趣。而在2015年,喜馬拉雅等網絡電臺崛起了。這些現象均表明,“聲音”依然會是十分重要的一類內容形態,人們不會浪費耳朵這個重要器官,在許多場景下,“語音消費”都更適合,比如開車時,高德地圖與林志玲等明星合作的語音導航就取得了很好的市場反饋。在許多垂直領域,例如教育,語音技術同樣在體現其重要性,比如通過語音技術做口語訓練。就是說,不只是“麥克風”變得重要了,“喇叭”也在變得重要。
語音硬件:隨時待命的助理
Amazon眼下最炙手可熱的硬件Echo,內置了Amazon Alexa語音助手,目標是占領家居、汽車、手機的麥克風,還能智能購物。這款產品銷量已突破400萬臺。除了Echo之外,Google 已推出Google Home硬件,擁有Siri的Apple很可能會發布類似產品。為何“語音助理硬件”會普及?為什么不直接用手機上的Siri等助理呢?因為手機是個人設備,并不適合家庭成員共享;而當前的語音技術,讓手機支持“隨時待命可被喚醒”會很耗電,基于Echo等家用設備就不需要擔心這個問題。正是由于這個原因,類似于Echo的產品將成為接下來的爆點。國內巨頭同樣在布局,京東已推出叮咚智能音箱,阿里巴巴聯合科大訊飛推出了“飛兒”。
與“家”同等重要的語音場景非汽車莫屬:車主在駕駛時雙眼和雙手都被占用,語音成為最佳輸入方式。搜狗針對汽車發布了智能語音導航App,可實現駕駛之外的常規車內交互,包括打電話、發短信、查天氣、歌曲播放等。不久前,YunOS與上汽合作的國內首款互聯網汽車,語音交互被當作一個賣點:阿里巴巴CEO張勇展示了用語音打開天窗這樣的操作。在未來,汽車內的語音交互將成為標配。
世界是由懶人創造的,人機交互的演進也可以認為是人們越來越懶的演進過程。俗話說得好,“能動口的絕不動手”,就是這個道理。語音最大的優勢是,它是人類最自然的交互方式。雖然語音技術目前還存在很多問題,但歷史早就證明,技術的障礙永遠不是障礙。科技讓生活更智能,語音讓交互更便捷,智能語音的時代已經來開序幕。