鄧家斌


摘? ?要:2018年被稱為人工智能全面落地應用的元年,國家先后確立了阿里、百度、騰訊和科大訊飛4家公司為人工智能的4大平臺。其中作為人工智能的重要分支之一的智能機器人也逐漸開始嶄露頭角。文章主要從智能陪護角度出發,探討了陪護機器人交換系統的設計與實現。
關鍵詞:智能陪護;人工智能;交互系統
2018年,國家統計局數據顯示我國0~14歲的兒童數量達到2.5億人。尤其是二胎政策全面開放后,預計我國每年新生嬰兒數量會逐漸增加。根據騰訊數據實驗室發布的《2018中國少兒家庭洞察白皮書》估算,中國兒童消費市場的規模已突破4.5萬億元,與此同時,兒童消費經濟也正以年增長率超過30%的速度增長。而未來5年的時間里,兒童智能產品將會有75%的年均增速,迅速成為下一個千億級別的市場。
迄今為止,基于大數據技術的跨平臺學習型智能趣味陪護機器人的交互系統研究依然處于初級階段,距離最終目標還有很長的路要走,價格也比較高,稍微好一些的品牌動輒上千元,甚至數千、上萬元不等。高昂的價格和相對不太成熟的技術,已經成為迫切需要解決的難題。
1? ? 智能趣味陪護機器人系統的設計思路
1.1? 算法的核心思想
人機交互的語音通信主要有兩種情況:第一種情況為人類主動,機器受動(Speech Recog,SR)。第二種情況為剛好想法,機器主動說話(回答),即從文本到語音(Text To Speech,TTS)。無論是哪種情況,都牽扯到機器學習中語音、語義識別方法。
常見語音識別的方法主要有3種:基于聲道模型和語音知識的方法、基于模板匹配的方法和人工神經網絡的方法。早些年前兩種方法比較盛行,但由于機器學習能力較弱,效果不太好。近2~3年來,基于神經網絡,尤其是卷積神經網絡(Convolutional Neural Networks,CNN)發展迅速,在圖形圖像、語音、語義等方面有了長足的進步,現已經成為主流的解決方法,如圖1所示。
1.2? 設計思想
(1)通過選擇目前已經比較成熟的人工語音平臺,將其作為模板,進行修改,使之成為適合本項目的人工智能云系統。能完成一定的語義識別、趣味問答、語音聊天等功能,真正實現人機無障礙溝通。
(2)結合大數據技術,將海量成語、兒歌等寓教于樂,使得學習更生趣,讓孩子在享受快樂生活的同時,潛移默化地接受智能化教育。
1.3? 解決方法
(1)底層使用了大數據技術:詞典、數據集、語料庫、知識圖譜以及外部世界常識性知識等都是語義識別算法模型的基礎。
(2)應用層:包括行業應用和智能語音交互系統、技術應用。
(3)核心技術是神經語言程序學(Neuro-Linguistic Programming,NLP)技術層:以語言學、計算機語言等學科為背景,采用當下比較流行和成熟的神經網絡等技術,對簡單的兒童自然語言進行詞語解析、信息抽取、時間因果、情緒判斷等技術處理,最終讓計算機“懂”人類的自然語言認知,把計算機數據轉化為自然語言生成。
詞語解析與信息抽取包括分詞、詞性標注、命名實體識別、詞義消歧、從給定文本中抽取重要的信息等,如圖2—3所示。
2? ? 結論
本文通過結合當地企業的實際生產能力以及現行國內類似產品的具體情況和問題,提出了一種基于兒童的在人工智能環境下的智能趣味人工智能交互系統。通過該交互系統,基本實現與幼兒或兒童交流,孩子們可向機器人發送簡單語音指令,機器人相應做出對應反饋,甚至可以實現一定機器學習等功能。
[參考文獻]
[1]桂林電子科技大學.一種適用于噪聲環境下的語音識別方法:中國,201910581762.8[P].2019.
[2]周志華.機器學習[M].北京:清華大學出版社,2016.
[3]張晴晴,劉勇,潘接林,等.基于卷積神經網絡的連續語音識別[J].工程科學學報,2015(9):1212-1217.
[4]劉偉波,曾慶寧,卜玉婷,等.基于雙微陣列與卷積神經網絡的語音識別方法[J].計算機應用,2019(11):3268-3273.