底層技術是人工智能發展的基礎

2018-08-29 12:09:58王蘊韜

中國建設信息化 2018年11期

文｜王蘊韜

智能語音語義服務平臺

目前我國提供開放的人工智能語音語義服務平臺現在越來越多，中國人工智能產業發展聯盟（AIIA）前期已經梳理了將近20家企業，企業會把自己的技術，自己已有的數據積累，以及應用場景方面的產品或服務，打包成一個平臺服務的形式，從而降低人工智能使用的門檻，人工智能服務平臺化是大勢所趨。

語音語義是現在較為成熟的人工智能服務平臺，目前AIIA主要針對語音語義的功能性以及性能方面進行評測，雖然各家都有自己的特點，但背后的技術都相通，為了更好地規范發展，需要相關的評估評測工作。具體的工作思路是找到語音語義平臺背后基礎功能性模塊，比如語音合成，包括聲紋識別、語音識別、機器翻譯、理解交互等，然后針對每一個模塊來做相關的功能性以及性能評測。

數據及數據集建設

人工智能更多的是依賴于海量的數據，各家的數據量非常大，但有效樣本數非常小，真正能用的數據非常少。每個企業都有自己的數據標注團隊、數據采集團隊，但是人力、物力有限，最多一個企業能達到一百人的數據標注團隊，但是一百個人每天能標注的數據也非常有限。并且，雖然現在各家都有數據標注團隊，但每家的數據都沒有能夠達到互換交易共享的能力。如果能把大家收集到的數據做一個平等互換，這樣不但節省了成本，而且對于自身業務提高也大有裨益。

目前整個數據集建設沒有形成一定的規范，包括數據采集的規范、數據標注的規范、數據質量把控的規范以及數據交付的規范。由于缺乏這些規范導致各家使用數據的格式都不一樣，就算是交換以后也不能用，所以AIIA也想通過在數據方面的規模化來為企業提供服務。語音語義在目前人工智能發展中最為成熟，AIIA現在想以語音語義為抓手，先從語音識別的數據做起，未來形成一系列的評測理論規范。除了企業，政府也有相當的考慮，國家主要的政策文件，都對數據集有了明確的要求，搭建公共服務數據集。

人工智能開源

自從開源的項目管理模式興起以后，計算機軟件業才真正發展起來。開源分成三個層面：底層是基礎技術，包括代碼、工具、數據庫等；上層是企業根據開源的底層技術打造的盈利性產品，包括定制化服務、基于開源軟件提供的軟硬件產品等；連接頂層和下層的橋梁是產業生態建設這一環節，把連接上層和底層的生態建設做好，對于整個產業非常重要。

國家到目前為止，整個開源生態并沒有建設起來，目前很多企業都有自己的開源項目，都想把自己的項目貢獻出去。企業掌握的程序雖然是開源的，但一旦涉及到盈利點，知識產權限制就非常嚴格。代碼開放出去使用，并不意味著就能隨心所欲，所以還是需要自己來建開源的生態。AIIA這一中立第三方平臺，把開源框架搭建起來，協助大家把底層的基礎夯實，把生態做好。

國際交流

我個人一直在深度參與聯合國國際電信聯盟（ITU）的工作，作為全球范圍內信息通信領域的權威標準化組織，ITU分成三大部門，分別是標準化部門、無線電部門和發展部門。標準化部門主要做信息通信相關國際標準的立項輸出；無線電部門主要是涉及到頻率分配；發展部門主要是為發展中國家提供交流合作的平臺，通過項目的形式，把一些標準化的項目做好對接。我個人主要參加ITU標準化和發展部門的活動，ITU在標準化方面主要在做人工智能技術和網絡技術相結合的標準研究，下一步也將進一步擴大涉及范圍。

人工智能基礎技術標準在國內是缺失的，AIIA會利用ITU的渠道，把工作放到聯合國平臺上，做出國際標準，雖然不具有強制性，但會以國際建議的形式呈現出來。參與建立國際標準，走在世界舞臺上就比較通暢。希望更多的國內企業參與到國際標準建設中，人工智能是變道超車的好機會。

在競爭中生存

做人工智能的人才稀缺又昂貴，結果大家都在做相同的東西，就會存在同質化競爭問題。但是合理的競爭是必須的，不能一家獨大，這對于產品迭代、用戶體驗都不利。競爭是有必要的，但需要避免惡性競爭，目前國內的人工智能公司，主要呈倒三角結構，大多數注重頂層應用，專注于底層基礎設施和中間層算法的公司比較少。 2017年以來，經過大浪淘沙和去偽存真的過程，一些真正有實力的公司會逐漸地顯現和得到重視，形成一定的規模。

從底層技術看智慧城市建設

從上層應用來看，智慧城市豐富多彩，但落到基礎設施層，無非就是互聯網、數據中心、傳感器、數據采集和平臺。通過有效的手段采集數據，然后通過可靠的傳輸網絡傳輸到平臺上去做集中化的處理。背后的技術非常成熟、相互通聯；應用在不同的場景下，能產生很多不同的效果。

目前，智慧城市最多的應用是視頻監控，視頻監控如果真正能夠做到預警或者對數據深度挖掘，都涉及到人工智能的技術。還有不同角度攝像頭之間智能協同的問題。市政基礎設施可以通過引進人工智能技術實現質的提升，但是實現質的提升需要克服三大障礙：第一是數據，沒有人去收集數據，沒有人去標注數據就沒辦法針對每一個場景有效搭建數據集；第二，數據整齊了，還需要搭建一整套平臺，需要開發人員做開發；第三，系統建成以后，還需要運營人員運維；這些都是很大的投入。

人工智能發展的憂慮

在人工智能領域的貢獻，尤其在頂級會議的貢獻，我國貢獻率已經達到了很高的水平，但是現在的情況是：企業去玩企業的，學術的去參加學術的，政府參加政府的，大家完全沒有形成合力，沒有形成一套機制。人工智能發展，更多的需要學術、產業、政府之間形成合力。這種工作的開展要依托于結合了政產學研用的行業組織、產業聯盟。

從基礎的技術儲備來說，大家都想掙快錢，把基礎性技術研究也都交給研究機構、高校，但是研究機構、高校不產業化，沒有實力去真正做好底層的技術，而且做出的技術可能跟產業結合得非常淺。所以說還是需要鼓勵企業，更專注于底層深耕。

人工智能尤其是區塊鏈，炒作太猛烈，對整個產業來說并不是一件好事，熱錢來得快去得也快，而且很容易對國家金融穩定造成威脅，人工智能的泡沫需要警惕。

對于人工智能探索已經經歷了這么多年，到現在為止還沒有做起來，很多的技術，比如傳感器、網絡等，都已經有非常長的一條利益鏈，要把它們打包融合在一起很難。