王倩+魏鑫+易奎+李文生+何謙+潘小琴
摘要:隨著科技的飛速發展,兒童的玩伴不再拘泥于傳統玩具,具有人機交互功能的教育機器人將得到極大發展。文章設計出一種基于語音技術的早教寫字機器人,該機器人采用輪式結構,以STM32F103作為主控芯片,用x、y、z三自由度寫字機構實現寫字功能,語音模塊能夠準確識別使用者命令并傳遞控制信號,超聲波傳感器可實現機器人避障。實驗結果表明,語音技術能較好實現人機交互,所寫字跡規范、清晰。
關鍵詞:機器人;語音技術;人機交互;寫字技術
中圖分類號:TP242 文獻標識碼:A 文章編號:1009-2374(2014)06-0021-03
機器人一直是國內外研究的熱點,其中教育機器人則是以激發學生學習興趣、提高學生綜合能力為目標,它在豐富兒童童年生活的同時,激發了兒童對科學技術的好奇心和求知欲。目前,國內已出現了機器人寫字相關技術的研究。陳雪華、張學文等人對四自由度寫字機器人做了詳細的研究,并對其控制系統設計、軌跡規劃、運動學仿真進行了詳細的分析;宮曉博利用IRB140型機器人做了漢字繪制的研究;但將機器人寫字技術與語音技術相結合的研究并不多見。漢王科技推出的“雙槍筆”利用語音技術實現了當使用者對著麥克風朗讀,相應文字就會自動錄入電腦,但這一技術卻沒能實現書寫過程的展示。文章主要闡述基于語音技術的早教寫字機器人,通過x、y、z三自由度機構帶動筆的運動來展現書寫過程。語音控制技術強化了人機交互功能,使得機器人更加人性化。
1 系統總體設計
圖1 系統總體設計框圖
系統是基于語音技術的早教寫字機器人。該機器人能按照使用者的語音命令,驅動其寫字機構運動——帶動上面的常規繪圖筆,完成10以內的算術運算的書寫。系統是典型的機電聲技術相結合的輪式結構機器人,由STM32F103作為主控芯片,系統按功能由車身驅動部分、寫字部分、語音處理部分、電源模塊和顯示器、播放器等輔助設備組成。系統總體設計框圖如圖1所示。系統由24V,3A的開關電源供電。機械結構包括車體和寫字機構。車體采用四輪式,以安裝于后輪的兩個直流電機作為驅動;寫字機構放在寫字板上,一同置于車體中層;在車前方安裝了三個互成一定角度的超聲波傳感器用于避障檢測。
2 寫字機構設計
圖2 “十”字滑塊結構
寫字機構搭載在寫字板上,采用“十”字滑塊結構實現XY平面內的任意軌跡運動;曲柄滑塊機構實現Z方向的提筆、下筆運動。“十”字滑塊結構由導軌座、移動滑塊、寫字板、滾珠絲杠螺母副和步進電機等部件構成,“十”字滑塊結構如圖2所示。兩個步進電機作為原動機以驅動滾珠絲杠,分別安裝在寫字板的X軸和Y軸上。移動滑塊位于兩滾珠絲杠的交點處,滾珠絲杠的螺母帶動滑塊上的繪圖筆實現沿x、y平面內任意軌跡的運動,從而實現繪圖筆對平面任意點的遍歷。曲柄滑塊機構用來完成Z方向的提筆和下筆動作,曲柄滑塊機構如圖3所示,它能將圓周運動轉換為直線運動,筆固定于滑塊上,通過舵機轉動控制曲柄的圓周擺動從而使滑塊沿Z方向上下移動。
圖3 曲柄滑塊機構
3 寫字功能的實現及寫字算法
該功能旨在完成10以內的算術運算。一個完整的算術運算由運算元和運算子構成,例如“3+6=9”。以下將運算元和運算子統稱為運算單元,不同的運算單元又由不同的直線、斜線、圓弧等組合構成。在XY平面,兩個57系列的步進電機帶動寫字機構運動。步進電機是將電脈沖信號轉變為角位移或線位移的開環控制元件。在非超載的情況下,電機的轉速、停止的位置只取決于脈沖信號的頻率和脈沖數,而不受負載變化的影響,即給電機加一個脈沖信號,電機則轉過一個步距角。電機的驅動為TB6560驅動板,由于電機的步距角為1.8°,再經一定的細分后,定位將更加精確。
由STM32產生一定頻率、一定時間的PWM波使步進電動機完成相應的轉動,滾珠絲杠能將步進電機的旋轉角度轉換為繪圖筆相對于坐標軸相應距離的直線運動。當一個電機轉動而另一個電機不轉動的情況下,可完成橫線或豎線的書寫;當兩個電機同時轉動,完成斜線的書寫,斜線的斜率取決于兩電機轉動頻率差值;由于圓弧可看成由若干斜率不同的細小的直線段構成,雖然電機的轉動對時間是離散的,但電機的步距精度很高,可以實現圓弧的書寫。
以繪圖板左上角為坐標原點建立X-Y平面坐標系。設A(x1,y1),B(x2,y1),C(x3,y1),D(x4,y1),E(x5,y1)分別為書寫過程中五個運算單元的起始坐標。程序根據對脈沖的計數可定位出繪圖筆當前的坐標P(xp,yp),計算過程如下:
書寫第一個運算單元時,以A(x1,y1)作為筆的起始坐標。設定控制X軸向運動的電機的最小步距角為θ0,某段時間內微控制器輸出給X軸向電機的脈沖頻率為fxk,對應脈沖個數為nxk(k=1,2,3,...),則此時間段內該電機轉過的角度為θxp,有
(1)
設步進電機輸出軸半徑為R0,則筆的當前X軸向坐標為xp,有:
xp=x1+R0θxp (2)
同理,對Y軸向上的運動有:
yp=y1+R0θyp (3)
(4)
弧線的書寫是算法實現過程中較為復雜的部分,下面介紹從A點開始畫半徑為R的弧APn的算法實現過程。如圖4,將圓若干等細分后每部分弧線均可看做直線,且對應的圓心角為α°。設筆已經完成了弧APn-1的書寫,弧Pn-1Pn近視等效為直線Pn-1Pn,此時:
(5)
(6)
將xPn-1,xPn的值分別代入式2中的x1、xp,聯立式1和式2,即可求出書寫弧Pn-1Pn這一過程中X軸向電機接受單片機輸出脈沖個數nxk。同理可求出yxk。
當完成一個運算單元的書寫,滑塊上的舵機完成Z方向提筆,接下來需完成由上一個運算單元的結束位置(x'p,y'p)到下一個運算單元的起始坐標(xk,yk)(k=2,3,4...)后落筆的動作,然后書寫下一個運算單元。
圖4 畫弧示意圖
4 機器人驅動及避障的實現
系統利用兩個差速電機提供動力,采用L298作為此電機驅動。為解決單個超聲波的檢測不準確的問題,系統使用3個超聲波傳感器,通過計算出最小盲區和最小干擾范圍,設計出合理的超聲波傳感器擺放位置。超聲波測距的公式為:
L=C×T (7)
式中L為測量的距離長度;T為超聲波從發射到接收的時間間隔的一半;C為超聲波在空氣中的傳播速度,計算公式為:
C=C0+0.607×T℃ (8)
C0為零攝氏度時的聲波速度332m/s,T為環境當前的攝氏溫度,這樣補償了溫度變化對于超聲波傳播速度的影響。
系統依靠3路超聲波進行距離測量,得到3個方位的距離數據后進行判斷,當距離小于最小避障距離30cm后,底盤上兩直流電機形成差速使機器人避障。具體策略如表1所示:
表1 超聲波避障策略
傳感器編號 策略
左 中 右 左轉優先
0 0 0 前進
0 0 1 左轉
0 1 0 左轉
1 0 0 右轉
0 1 1 左轉
1 0 1 后退
1 1 0 右轉
1 1 1 后退
注:圖示:1.進入避障范圍;0.不在避障范圍
5 語音控制技術
語音控制技術包括語音識別和單片機控制技術。
系統采用以IC公司LD3320語音芯片為核心的ASR(Automatic Speech Recognition)模塊,實現語音識別功能。系統通過穩定的算法可完成非特定語音識別,不需要用戶事先錄音和訓練。經測試,在口令觸發模式下識別準確率高達95%,非口令觸發模式下識別準確率可達70%;內置功放電路,麥克風、立體聲耳機和單聲道喇叭,方便與芯片管腳連接;用戶每次可設置50項不超過79字節的拼音串候選識別句。
語音控制框圖如圖5所示,圖中“LD3320與外圍電路”實現將采集到的非特定語音信號轉化為數字信號,并與語音庫進行信號匹配,確定有用信息及信息內容,并通過串口將有效內容以十進制數方式傳遞給主控制器,主控制器控制執行機構做出相應動作,同時MP3模塊發出提示音。
圖5 語音控制框圖
6 實驗驗證及總結
實驗證明,本系統能較好地實現早教功能;寫字機構運動穩定、噪聲小,定位精度達90%,所寫字跡清晰,圓潤,書寫結果正確率達99%;語音控制方便、靈活,識別準確率高達95%。通過使用者與機器人的良好交互,機器人完成的書寫效果如圖6所示。
圖 6 寫字效果圖
參考文獻
[1] Carson-Berndsen Julie.Finite-state models,
event logics and statistics in speech recognition
[J].Philosophical Transactions of the Royal
Society A: Mathematical, Physical and Engineering
Sciences,2000,358.
[2] Lixiao Huang,Terri Varnado ,Douglas Gillan.
An Exploration of Robot BuildersAttachment to
Their LEGO Robots[J].Proceedings of the Human
Factors and Ergonomics Society Annual Meeting,
2013,(1).
[3] 李楊.基于智能語音識別的云電視系統設計[J].
中國高新技術企業,2012,(7).
[4] 楊智鑫.移動機器人語音識別系統的研究與實現
[D].北京:北京化工大學,2011.
[5] 張學文,陳小安,梁錫昌.寫字機器人運動學分析
及仿真[J].現代制造工程,2009,(10).
[6] 謝光輝,梁錫昌,李偉.一種機器人繪字控制系統
的研制[J].制造業自動化,2007,(2).
[7] 楊晶東,楊敬輝,蔡則蘇.基于多目標優化的移動
機器人避障算法[J].上海交通大學學報2012,
(2).
基金項目:本文系西南科技大學實驗技術研究項目(14syjs-10);西南科技大學大學生創新基金項目(CX13-053)研究成果。
作者簡介:王倩(1991—),女,四川南充人,西南科技大學“智能機器人”創新實踐班班長,研究方向:機器人控制技術、機器人運動規劃。
圖4 畫弧示意圖
4 機器人驅動及避障的實現
系統利用兩個差速電機提供動力,采用L298作為此電機驅動。為解決單個超聲波的檢測不準確的問題,系統使用3個超聲波傳感器,通過計算出最小盲區和最小干擾范圍,設計出合理的超聲波傳感器擺放位置。超聲波測距的公式為:
L=C×T (7)
式中L為測量的距離長度;T為超聲波從發射到接收的時間間隔的一半;C為超聲波在空氣中的傳播速度,計算公式為:
C=C0+0.607×T℃ (8)
C0為零攝氏度時的聲波速度332m/s,T為環境當前的攝氏溫度,這樣補償了溫度變化對于超聲波傳播速度的影響。
系統依靠3路超聲波進行距離測量,得到3個方位的距離數據后進行判斷,當距離小于最小避障距離30cm后,底盤上兩直流電機形成差速使機器人避障。具體策略如表1所示:
表1 超聲波避障策略
傳感器編號 策略
左 中 右 左轉優先
0 0 0 前進
0 0 1 左轉
0 1 0 左轉
1 0 0 右轉
0 1 1 左轉
1 0 1 后退
1 1 0 右轉
1 1 1 后退
注:圖示:1.進入避障范圍;0.不在避障范圍
5 語音控制技術
語音控制技術包括語音識別和單片機控制技術。
系統采用以IC公司LD3320語音芯片為核心的ASR(Automatic Speech Recognition)模塊,實現語音識別功能。系統通過穩定的算法可完成非特定語音識別,不需要用戶事先錄音和訓練。經測試,在口令觸發模式下識別準確率高達95%,非口令觸發模式下識別準確率可達70%;內置功放電路,麥克風、立體聲耳機和單聲道喇叭,方便與芯片管腳連接;用戶每次可設置50項不超過79字節的拼音串候選識別句。
語音控制框圖如圖5所示,圖中“LD3320與外圍電路”實現將采集到的非特定語音信號轉化為數字信號,并與語音庫進行信號匹配,確定有用信息及信息內容,并通過串口將有效內容以十進制數方式傳遞給主控制器,主控制器控制執行機構做出相應動作,同時MP3模塊發出提示音。
圖5 語音控制框圖
6 實驗驗證及總結
實驗證明,本系統能較好地實現早教功能;寫字機構運動穩定、噪聲小,定位精度達90%,所寫字跡清晰,圓潤,書寫結果正確率達99%;語音控制方便、靈活,識別準確率高達95%。通過使用者與機器人的良好交互,機器人完成的書寫效果如圖6所示。
圖 6 寫字效果圖
參考文獻
[1] Carson-Berndsen Julie.Finite-state models,
event logics and statistics in speech recognition
[J].Philosophical Transactions of the Royal
Society A: Mathematical, Physical and Engineering
Sciences,2000,358.
[2] Lixiao Huang,Terri Varnado ,Douglas Gillan.
An Exploration of Robot BuildersAttachment to
Their LEGO Robots[J].Proceedings of the Human
Factors and Ergonomics Society Annual Meeting,
2013,(1).
[3] 李楊.基于智能語音識別的云電視系統設計[J].
中國高新技術企業,2012,(7).
[4] 楊智鑫.移動機器人語音識別系統的研究與實現
[D].北京:北京化工大學,2011.
[5] 張學文,陳小安,梁錫昌.寫字機器人運動學分析
及仿真[J].現代制造工程,2009,(10).
[6] 謝光輝,梁錫昌,李偉.一種機器人繪字控制系統
的研制[J].制造業自動化,2007,(2).
[7] 楊晶東,楊敬輝,蔡則蘇.基于多目標優化的移動
機器人避障算法[J].上海交通大學學報2012,
(2).
基金項目:本文系西南科技大學實驗技術研究項目(14syjs-10);西南科技大學大學生創新基金項目(CX13-053)研究成果。
作者簡介:王倩(1991—),女,四川南充人,西南科技大學“智能機器人”創新實踐班班長,研究方向:機器人控制技術、機器人運動規劃。
圖4 畫弧示意圖
4 機器人驅動及避障的實現
系統利用兩個差速電機提供動力,采用L298作為此電機驅動。為解決單個超聲波的檢測不準確的問題,系統使用3個超聲波傳感器,通過計算出最小盲區和最小干擾范圍,設計出合理的超聲波傳感器擺放位置。超聲波測距的公式為:
L=C×T (7)
式中L為測量的距離長度;T為超聲波從發射到接收的時間間隔的一半;C為超聲波在空氣中的傳播速度,計算公式為:
C=C0+0.607×T℃ (8)
C0為零攝氏度時的聲波速度332m/s,T為環境當前的攝氏溫度,這樣補償了溫度變化對于超聲波傳播速度的影響。
系統依靠3路超聲波進行距離測量,得到3個方位的距離數據后進行判斷,當距離小于最小避障距離30cm后,底盤上兩直流電機形成差速使機器人避障。具體策略如表1所示:
表1 超聲波避障策略
傳感器編號 策略
左 中 右 左轉優先
0 0 0 前進
0 0 1 左轉
0 1 0 左轉
1 0 0 右轉
0 1 1 左轉
1 0 1 后退
1 1 0 右轉
1 1 1 后退
注:圖示:1.進入避障范圍;0.不在避障范圍
5 語音控制技術
語音控制技術包括語音識別和單片機控制技術。
系統采用以IC公司LD3320語音芯片為核心的ASR(Automatic Speech Recognition)模塊,實現語音識別功能。系統通過穩定的算法可完成非特定語音識別,不需要用戶事先錄音和訓練。經測試,在口令觸發模式下識別準確率高達95%,非口令觸發模式下識別準確率可達70%;內置功放電路,麥克風、立體聲耳機和單聲道喇叭,方便與芯片管腳連接;用戶每次可設置50項不超過79字節的拼音串候選識別句。
語音控制框圖如圖5所示,圖中“LD3320與外圍電路”實現將采集到的非特定語音信號轉化為數字信號,并與語音庫進行信號匹配,確定有用信息及信息內容,并通過串口將有效內容以十進制數方式傳遞給主控制器,主控制器控制執行機構做出相應動作,同時MP3模塊發出提示音。
圖5 語音控制框圖
6 實驗驗證及總結
實驗證明,本系統能較好地實現早教功能;寫字機構運動穩定、噪聲小,定位精度達90%,所寫字跡清晰,圓潤,書寫結果正確率達99%;語音控制方便、靈活,識別準確率高達95%。通過使用者與機器人的良好交互,機器人完成的書寫效果如圖6所示。
圖 6 寫字效果圖
參考文獻
[1] Carson-Berndsen Julie.Finite-state models,
event logics and statistics in speech recognition
[J].Philosophical Transactions of the Royal
Society A: Mathematical, Physical and Engineering
Sciences,2000,358.
[2] Lixiao Huang,Terri Varnado ,Douglas Gillan.
An Exploration of Robot BuildersAttachment to
Their LEGO Robots[J].Proceedings of the Human
Factors and Ergonomics Society Annual Meeting,
2013,(1).
[3] 李楊.基于智能語音識別的云電視系統設計[J].
中國高新技術企業,2012,(7).
[4] 楊智鑫.移動機器人語音識別系統的研究與實現
[D].北京:北京化工大學,2011.
[5] 張學文,陳小安,梁錫昌.寫字機器人運動學分析
及仿真[J].現代制造工程,2009,(10).
[6] 謝光輝,梁錫昌,李偉.一種機器人繪字控制系統
的研制[J].制造業自動化,2007,(2).
[7] 楊晶東,楊敬輝,蔡則蘇.基于多目標優化的移動
機器人避障算法[J].上海交通大學學報2012,
(2).
基金項目:本文系西南科技大學實驗技術研究項目(14syjs-10);西南科技大學大學生創新基金項目(CX13-053)研究成果。
作者簡介:王倩(1991—),女,四川南充人,西南科技大學“智能機器人”創新實踐班班長,研究方向:機器人控制技術、機器人運動規劃。