趙力瑾
(榆林學院,陜西榆林 719000)
隨著我國近年來計算機信息技術的不斷創新研發,手機作為移動終端設備,目前在人們的社會生活、工作學習等各領域占據重要地位。而近年來國際間各領域的交流滲透,使得每年中國出境總人數呈遞增趨勢,那么身處異國他鄉遇到不認識的文字時,就可以運用移動手機,將攝像頭打開從而獲得文字翻譯結果,所以本研究旨在能夠設計可以滿足實時、準確翻譯的系統。如今手機可以支持的互譯語言包括了中文、日語、韓語、俄語、西班牙語等,部分公開翻譯軟件有:有道翻譯、Google 翻譯、百度翻譯等。不僅如此,國內手機云應用近年來也獲得了飛速發展,譬如百度、阿里巴巴,阿里巴巴于2011 年便成功發布手機計劃,先后推出了阿里云、云智能OS 等功能,讓用戶無需在手機終端下載應用,便可以實現在網絡環境下登錄云賬號正常應用。如今,多數應用都基于云平臺成功搭設服務器,來擴充計算資源提高整體應用性能。基于此,本次研究立足實際翻譯所需,與云計算技術、移動應用開發技術相結合,設計基于移動終端的云計算實時翻譯系統,來針對性結合動態化運行環境,保證短時間內可以成功獲得最高效的翻譯使用體驗。
模擬圖像作為在空間中無連續性分割且無等級劃分信號值的一種圖像,數字圖像處于空間中被持續分割形成離散像素,主要表現方式為二維數組,應用于該文圖像處理中,通過采集圖像功能轉換為數字化圖像之后再進行處理。
圖像信號在具體處理過程中,進行邊緣檢測可以有效減少數據量,同時也能夠將大批量不相關信息成功剔除,從而有效保留圖像結構屬性。目前常見的邊緣檢測算子分別包括了Canny 算子、Sobel 算子、Roberts 算子等。
圖像膨脹腐蝕操作中的基本組成是結構元素,一般情況下主要包括了多個待處理圖像矩陣,在結構元素中心點則明確指定圖像中所需要加以處理的主要像素范圍,設定結構元素為1,作為鄰域像素膨脹腐蝕操作參與計算的關鍵依據。
OCR 主要經電子設備成功獲取文字圖像具體信息后,對于圖像的亮暗度等情況進行檢測,運用字符識別法翻譯圖像信息,獲得計算機文字光學轉換處理圖像中文字,最終可得黑白點陣圖像文件,從而運用識別軟件轉換文字形成的文本格式。在OCR 技術運用中,會存在書寫習慣、圖像品質等影響,導致OCR 識別結果的差異。所以運用OCR 就是為了有效降低文字識別時誤識、拒識等情況的發生率,并提升整體識別的穩定速率。
本次系統設計是為了在手機終端平臺中,運行基于移動云計算的實時翻譯系統,將手機攝像頭預覽圖像英文文字轉換為中文,用戶可以通過手機屏幕實現圖像場景預覽,同時也可以實現對場景預覽圖像的實時改變。實際應用通過定義整個運行過程為多個任務序列組合,包括實時翻譯的圖像獲取、文字定位、識別、翻譯、顯示結果等五大任務功能。該系統的實時翻譯任務路徑如圖1 所示。

圖1 實時翻譯任務路徑
圖2 作為本次系統設計架構圖,采用C/S 網絡總架構,用戶可以通過手機終端完成系統安裝,并經手機網絡或無線網,訪問該手機的云計算服務器,之后計算分擔服務器便可經有線網絡訪問百度翻譯服務器,從而形成該系統的正常運行所需條件。與傳統C/S 云服務運行不同,本次系統架構云服務器計算過程均在云端執行,經代碼實現整個文字定位、識別,實際運行中也可以通過手機運行云端。

圖2 系統網絡結構拓撲圖
本次設計的基于移動云計算技術的實時翻譯系統功能模塊,如圖3 所示,包括了實時翻譯、云計算動態分擔兩大功能模塊。

圖3 系統功能模塊圖
圖4為本次系統設計中的實時翻譯模塊結構圖。

圖4 實時翻譯模塊結構圖
1)圖像采集中,能夠實時采集經攝像頭獲取的用戶所在場景圖像信息,不需要按下快門,即可成功獲取相應的圖像信息,并且顯示于手機屏幕中實現圖像信息預覽。在本次功能設計中選用了Andorid攝像頭接口,能夠對場景信息進行實時捕捉和獲取,經onPveiwFrame 即可完成圖像像素字節組的妥善保存,并將不同像素點RGB 值保存為三維數據。
2)文字定位。通過分析處理場景圖像,可以對于復雜化背景圖像,成功完成文本定位,最終返回至文字區域中的外界矩形頂點坐標。通過運用圖像形態學結合連通域,成功定位文字區域,并進行圖像預處理,即可根據文字特征成功定位,需要經過灰度化處理、邊緣檢測、圖像膨脹腐蝕、填充孔洞、標記和分析連通域等步驟。
3)文字識別。在識別圖像中存在的數據文本信息,操作中可以識別為英文數據字符加以處理,運用光學字符識別能夠成功識別?;赥esseracr-OCR引擎成功識別文本,從而支持各類編程語言。
4)文字翻譯。本次系統設計中基于百度云翻譯API 智能識別翻譯文本,能夠以帶翻譯的原文本語言和最終翻譯的目標語言,以百度接口向API 提供從而獲得相應的存儲翻譯JSON 字符串。
5)顯示結果。經過顯示文字定位、翻譯最終結果,可以在預覽圖像中,根據用戶的指定位置,完成翻譯文本添加并覆蓋。
本次系統設計主要基于移動云計算技術實現,在云計算動態分擔模塊中,主要功能點包括了資源監控預估、分擔決策、分擔執行以上3 個模塊,具體如圖5 所示。

圖5 云計算動態分擔模塊架構
1)資源監控預估
想要獲取在資源運行過程中,系統CPU 和具體的網絡傳輸總速度、數據總量各類歷史資源數據,還有以往系統運行過程中所獲取的真實歷史數據資源,設計出基于系統歷史數據的計算評估模型,從而評估未來系統運行的資源數量。以該部分為例設計代碼示例如下:


2)選擇分擔路徑
結合具體監控資源并選擇預估模塊內部的資源數據,本系統可以經過云端計算以及運作協作方案,尋找最優化分擔執行路徑方案。執行路徑在選擇過程中,對性能產生主要影響的因素包括T、E,分別表示時間消耗、電能消耗。其中時間消耗又包括了數據的傳輸所耗時間,執行數據任務獲得結果的所需時間,以及云端文字識別的計算時間。對于策略制定過程中,假設本地執行、遠程執行兩個時間分別為Tloeal、Tremote,計算遠程執行時間和遠程執行能耗公式如下:

3)分擔執行
本系統通過封裝處理每一個任務作為可序列化處理對象,并進行單獨封裝作為任務序列,經本地或云端執行每一步任務,并經分散決策動態化制定具體運行位置,最終分別執行于本地、云端等,可以獲得相應的運行結果,并向分擔決策功能模塊提供真實的運行數據,包括數據量的上傳下載、運行時長等均作為關鍵的預估依據。經Java 序列化、反序列及反射從而成功云端執行,定義C 類擁有p 方法,C 類實例對象o,假若o 采用的m 方法可以向云端執行成功遷移,那么則可以傳輸o、o、m 對象調用p 參數序列化可傳輸byte 數組。同步傳輸m 至云端服務器,接收云端服務器后,反序列byte 數組,成功恢復為o 對象,可以喚起o 對象的m 方法,最終獲得運行結果。
以歷史運行數據為依據,完成執行任務的時間、能量具體消耗情況,完成總運行消耗量計算,最終選擇消耗量較小的路徑,作為主要的實際運行路徑。
經本次測試發現,通常情況下該系統的靜態圖像文字定位精準率可以達到80%以上,可以成功識別90%以上的正確定位區域文字。并且經本次測試研究結果,也發現該算法可以準確識別小傾斜角度文字區域。通過將文字場景圖片展開測試,將系統打開后對準圖片進行拍攝,其程序運行結果如圖6 所示,發現可以在原圖文字位置實時顯示翻譯后的文字信息。

圖6 實時翻譯運行截圖
文中通過與移動應用需求相結合,設計了基于移動云計算的實時翻譯系統,能夠經攝像頭實時取景后獲取翻譯結果,經云計算動態分擔獲取資源信息,并經Java 程序實現云端分擔執行翻譯任務,證實了該文設計的實時翻譯系統的翻譯效果,未來也將在翻譯領域有一定的發展前景。