文|王蘊韜

目前我國提供開放的人工智能語音語義服務平臺現在越來越多,中國人工智能產業發展聯盟(AIIA)前期已經梳理了將近20家企業,企業會把自己的技術,自己已有的數據積累,以及應用場景方面的產品或服務,打包成一個平臺服務的形式,從而降低人工智能使用的門檻,人工智能服務平臺化是大勢所趨。
語音語義是現在較為成熟的人工智能服務平臺,目前AIIA主要針對語音語義的功能性以及性能方面進行評測,雖然各家都有自己的特點,但背后的技術都相通,為了更好地規范發展,需要相關的評估評測工作。具體的工作思路是找到語音語義平臺背后基礎功能性模塊,比如語音合成,包括聲紋識別、語音識別、機器翻譯、理解交互等,然后針對每一個模塊來做相關的功能性以及性能評測。
人工智能更多的是依賴于海量的數據,各家的數據量非常大,但有效樣本數非常小,真正能用的數據非常少。每個企業都有自己的數據標注團隊、數據采集團隊,但是人力、物力有限,最多一個企業能達到一百人的數據標注團隊,但是一百個人每天能標注的數據也非常有限。并且,雖然現在各家都有數據標注團隊,但每家的數據都沒有能夠達到互換交易共享的能力。如果能把大家收集到的數據做一個平等互換,這樣不但節省了成本,而且對于自身業務提高也大有裨益。
目前整個數據集建設沒有形成一定的規范,包括數據采集的規范、數據標注的規范、數據質量把控的規范以及數據交付的規范。由于缺乏這些規范導致各家使用數據的格式都不一樣,就算是交換以后也不能用,所以AIIA也想通過在數據方面的規模化來為企業提供服務。語音語義在目前人工智能發展中最為成熟,AIIA現在想以語音語義為抓手,先從語音識別的數據做起,未來形成一系列的評測理論規范。除了企業,政府也有相當的考慮,國家主要的政策文件,都對數據集有了明確的要求,搭建公共服務數據集。
自從開源的項目管理模式興起以后,計算機軟件業才真正發展起來。開源分成三個層面:底層是基礎技術,包括代碼、工具、數據庫等;上層是企業根據開源的底層技術打造的盈利性產品,包括定制化服務、基于開源軟件提供的軟硬件產品等;連接頂層和下層的橋梁是產業生態建設這一環節,把連接上層和底層的生態建設做好,對于整個產業非常重要。
國家到目前為止,整個開源生態并沒有建設起來,目前很多企業都有自己的開源項目,都想把自己的項目貢獻出去。企業掌握的程序雖然是開源的,但一旦涉及到盈利點,知識產權限制就非常嚴格。代碼開放出去使用,并不意味著就能隨心所欲,所以還是需要自己來建開源的生態。AIIA這一中立第三方平臺,把開源框架搭建起來,協助大家把底層的基礎夯實,把生態做好。
我個人一直在深度參與聯合國國際電信聯盟(ITU)的工作,作為全球范圍內信息通信領域的權威標準化組織,ITU分成三大部門,分別是標準化部門、無線電部門和發展部門。標準化部門主要做信息通信相關國際標準的立項輸出;無線電部門主要是涉及到頻率分配;發展部門主要是為發展中國家提供交流合作的平臺,通過項目的形式,把一些標準化的項目做好對接。我個人主要參加ITU標準化和發展部門的活動,ITU在標準化方面主要在做人工智能技術和網絡技術相結合的標準研究,下一步也將進一步擴大涉及范圍。
人工智能基礎技術標準在國內是缺失的,AIIA會利用ITU的渠道,把工作放到聯合國平臺上,做出國際標準,雖然不具有強制性,但會以國際建議的形式呈現出來。參與建立國際標準,走在世界舞臺上就比較通暢。希望更多的國內企業參與到國際標準建設中,人工智能是變道超車的好機會。
做人工智能的人才稀缺又昂貴,結果大家都在做相同的東西,就會存在同質化競爭問題。但是合理的競爭是必須的,不能一家獨大,這對于產品迭代、用戶體驗都不利。競爭是有必要的,但需要避免惡性競爭,目前國內的人工智能公司,主要呈倒三角結構,大多數注重頂層應用,專注于底層基礎設施和中間層算法的公司比較少。 2017年以來,經過大浪淘沙和去偽存真的過程,一些真正有實力的公司會逐漸地顯現和得到重視,形成一定的規模。
從上層應用來看,智慧城市豐富多彩,但落到基礎設施層,無非就是互聯網、數據中心、傳感器、數據采集和平臺。通過有效的手段采集數據,然后通過可靠的傳輸網絡傳輸到平臺上去做集中化的處理。背后的技術非常成熟、相互通聯;應用在不同的場景下,能產生很多不同的效果。
目前,智慧城市最多的應用是視頻監控,視頻監控如果真正能夠做到預警或者對數據深度挖掘,都涉及到人工智能的技術。還有不同角度攝像頭之間智能協同的問題。市政基礎設施可以通過引進人工智能技術實現質的提升,但是實現質的提升需要克服三大障礙:第一是數據,沒有人去收集數據,沒有人去標注數據就沒辦法針對每一個場景有效搭建數據集;第二,數據整齊了,還需要搭建一整套平臺,需要開發人員做開發;第三,系統建成以后,還需要運營人員運維;這些都是很大的投入。

在人工智能領域的貢獻,尤其在頂級會議的貢獻,我國貢獻率已經達到了很高的水平,但是現在的情況是:企業去玩企業的,學術的去參加學術的,政府參加政府的,大家完全沒有形成合力,沒有形成一套機制。人工智能發展,更多的需要學術、產業、政府之間形成合力。這種工作的開展要依托于結合了政產學研用的行業組織、產業聯盟。
從基礎的技術儲備來說,大家都想掙快錢,把基礎性技術研究也都交給研究機構、高校,但是研究機構、高校不產業化,沒有實力去真正做好底層的技術,而且做出的技術可能跟產業結合得非常淺。所以說還是需要鼓勵企業,更專注于底層深耕。
人工智能尤其是區塊鏈,炒作太猛烈,對整個產業來說并不是一件好事,熱錢來得快去得也快,而且很容易對國家金融穩定造成威脅,人工智能的泡沫需要警惕。
對于人工智能探索已經經歷了這么多年,到現在為止還沒有做起來,很多的技術,比如傳感器、網絡等,都已經有非常長的一條利益鏈,要把它們打包融合在一起很難。