趙棟材 周雁
摘 要 電子文本自然語言處理是新時代發展的產物,在計算機科學領域發展中占據重要地位。傳統的電子文本自然語言處理系統花費成本較高,人工投入較大,已經不能滿足目前提出的要求。基于深度學習設計了電子文本自然語言處理系統,分別對系統的硬件、軟件進行設計,硬件部分由數據采集器、數據合成器和數據處理器3部分組成,由SIFT算法實現軟件部分的計算。通過對比實驗證明給出的系統能夠有效處理自然語言,而且工作效率很高,具有很好的發展前景。
【關鍵詞】深度學習 電子文本 自然語言 語言處理系統
步入二十一世紀之后,計算機行業得到迅速發展,自然語言處理(NLP)是計算機科學領域研究的一個重要方向。在處理自然語言時要運用到語言學、數字學與計算機學等多個學科,并將其融合到一起進行研究。自然語言是人們在日常生活中應用的語言,和語言學緊密相關,但是也不完全相同。具體來說,自然語言處理是一種計算機系統,能夠有效實現自然語言通信。綜上所述,本文基于深度學習設計了電子文本自然語言處理系統,分別對系統的硬件、軟件進行設計,通過實驗驗證了所給系統的可行性。
1 基于深度學習的電子文本自然語言處理系統硬件設計
基于深度學習對電子文本自然語言處理系統硬件部分進行設計,硬件由數據采集器、數據合成器和數據處理器3部分組成,系統硬件的功能如下:由數據采集器對電子文本的信息進行采集,然后由數據合成器篩選出無用信息,合成有用信息,最后利用數據處理器處理自然語言信息,至此完成整個自然語言處理過程。基于深度學習的電子文本自然語言處理系統硬件部分總體設計框架圖如圖1所示。
數據采集器的采集芯片為英國Frocdema公司研發的ROM芯片,通過邏輯總線連接內部結構,利用A/D、D/A轉換器轉換數據。采集后的數據會深入到硬件中,將采集到的信息進行集成處理,利用VHDL執行操作命令,大大保證了系統的可靠性。
數據合成器選用法國Tnmlced公司研發的dacem合成器。Tnmlced公司歷經五年時間研發了此款合成器,又經過一年的時間試用,雖然是一款新型合成器,但是工作穩定性極高,與市面上的其它合成器相比,dacem合成器合成能力至少能夠提高2倍以上。Dacem合成器內部擁有12位DSP指令,通過6級整數流水線去執行命令,效率極高。處理器同時具有讀/寫兩個操作部件,共同實現合成工作。
數據處理器是自然語言處理系統硬件的核心部分,處理器內部選用美國Intel公司研發的Loihi1547人工智能處理芯片。此款芯片內核為2.5V,控制總線工作頻率為72MHZ,支持處理148類自然語言,對語言的處理能力能達到15位,芯片分為運行、休眠和停止三種狀態,工作耗時短,需要的成本很低,在非工作狀態系統進入休眠模式,不會造成功率的浪費。
2 基于深度學習的電子文本自然語言處理系統軟件設計
基于SIFT算法對本文提出的電子文本自然語言處理系統進行軟件設計。在處理自然語言中,處理設備需要選用鏈路質量確定模式,當RSSI達到最大網絡模式時接入,還要考慮通信場強強度是否均衡。SIFT算法如下所示:
公式(1)中,G(x,y)為高斯函數,計算過程如下:
(x,y)代表自然語言的尺度坐標,σ表示語言類別,尺度不同對應的語言精度也不同。由公式可知,當G(x,y)=70時,自然語言處理系統處理能力最強,傳遞速率最高,工作性能最穩定
3 實驗研究
為了測試本文設計的電子文本自然語言處理系統是否具有實際可操作性,與傳統的電子文本自然語言處理系統進行了對比,設計實驗,實驗參數如下:電源電壓限定在220V以內,電源模式為三相四線制,系統最大負載電阻為10Ω,最小負載電阻為5Ω,電感串聯為20mA,系統工作時長2h。
傳統系統和本文設定的電子文本自然語言處理系統都能實現自然語言的智能處理,但是本文設計的系統處理能力始終高于傳統系統。尤其是到后期時,傳統的系統已經無法進行語言處理,但是本文設定的系統工作效率依然極高,工作時不會消耗過多的成本,產生的噪音很小,有效降低工作人員的勞動強度。
4 結束語
通過本文的探討分析可以了解到傳統的電子文本自然語言處理系統局限性較大,本文基于深度學習設計的語言系統,硬件部分由數據采集器、數據合成器和數據處理器3部分組成,在短時間內處理不同類型的語言。利用SIFT算法計算出語言換算頻率,有效實現軟件系統設計。通過與傳統系統進行對比實驗顯示的結果可知,本文設計的系統工作穩定性更強,在工作時產生的噪聲更小,消耗成本很低,工作效率高,是未來的必然發展方向。
參考文獻
[1]任柏青.基于深度學習的智能中文文本檢校方法[J].現代電信科技,2017,47(04):55-58.
[2]崔萌,張春云.基于不同語料的詞向量對比分析[J].蘭州理工大學學報,2017,43(03):112-116.
作者簡介
趙棟材(1976-),男,四川省南充市人。碩士研究生。副教授,碩士生導師。研究方向為自然語言處理。
周雁(1981-),女,廣東省高州市人。碩士研究生。副教授,碩士生導師。研究方向為語音處理、嵌入式系統。
作者單位
西藏大學信息科學技術學院 西藏自治區拉薩市 850000