辛強偉 唐云凱
摘要:信息存儲、傳輸、處理等能力的增強為充分大范圍利用大數據提供了可能。大數據是人工智能的重要基礎之一,需要將大量數量進行合理的處理,通過對大量數據的選擇、整合和分析,找出其中的正確規律加以運用。人工智能系統的可靠性或精度需要得到保障,特別是一些實際應用中對可靠性或精度要求極高。多維度數據組合可以降低數據的片面性和潛在的隱患,從而提升人工智能系統的可靠性和精度。
關鍵詞:人工智能;大數據;多維度;組合
中圖分類號:TP393? ? 文獻標識碼:A? ? 文章編號:1007-9416(2020)10-0000-00
0引言
人工智能即人造智能,指用機器(計算機)模擬或實現人類的智能。人工智能并非一個新概念,“人工智能”一詞最早是在1956年Dartmouth學會上提出的,它是研究和開發用于模擬、延伸和擴展人的智能的科技。人工智能企圖了解智能的實質,對人的意識、思維過程進行模擬,產生出能以人類智能相似的方式做出反應的智能設備,該設備能像人那樣思考。人工智能領域的研究包括機器人、圖像識別、語言識別處理和專家系統等。
人工智能自誕生以來,應用領域不斷擴大,近些年由于大數據、通信技術、傳感器等技術的快速發展使人工智能又上了一個臺階,也使人工智能新的應用有了基礎和可能[1-2]。例如計算機視覺和圖像處理、機器翻譯和自然語言理解、專家系統、智能搜索引擎、數據挖掘和知識發現、自動駕駛、人像識別、文字識別、圖像識別、車牌識別和語音識別等[3]。
1分析
人工智能系統特點是快速計算與海量存儲能力,具有自主學習的能力,各模塊之間互相依賴并且可以同時學習,具有實時的學習能力。人工智能系統的認知可分為三個步驟:首先獲得數據,然后對數據進行加工整合得出結果,最后自我學習自我完善。人工智能系統要達到類人思考,像人一樣思考,代替人取代人,特別是在一些重復性、很繁重或者說很危險的工作當中代替人,這樣可以降低成本、提高效率和安全性。
機器學習是大數據的分析方式之一,也是人工智能的主要研究方向之一,有些大數據研發人員就是通過機器學習轉入了人工智能領域。機器學習涉及統計學、概率論、逼近論、算法復雜度理論等多門學科,研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。
此外,人工智能還涉及到模式識別。模式識別研究模式的自動處理和判斷,根據樣本的特征將樣本劃分到一定的類別中去,使設備具有模仿人類通過感官接受外界信息、識別和理解周圍環境的感知能力,即用計算機來模擬人的各種識別能力,當前主要應用在人工智能領域的圖形識別和語音識別。然而,有些場景中對人工智能的應用提出了嚴苛的要求,人工智能系統的可靠性或精度需要得到保障。比如在無人駕駛中對數據獲取的速度、精度以及數據通信傳輸的速度,都有很高的要求。因此需要進一步提出多種多樣的方法來不斷提升人工智能系統的可靠性或精度。
2多維度數據組合
反饋校正方式是一種提升系統性能的方法。反饋校正的基本原理是校正系統中對動態性能改善有重大妨礙作用的某些環節,恰當選擇反饋校正的形式和參數,使系統的性能滿足給定的指標要求。但在反饋校正方式和多種學習訓練方法(如機器學習)之外需要另外的方法。
大數據作為人工智能發展的重要基礎之一,與人工智能存在緊密的聯系。正是基于大數據技術的快速發展,通過人工智能結合大數據,近些年人工智能才取得了諸多突破。數據的價值如何體現出來,其中一個重要方面是數據要應用到智能控制方面,智能控制是自動控制,不是人工控制。智能化的實現要依靠數據,數據量越大,那么它所反映出來的概率越準確。
統計學、概率論、組合學都可以在人工智能當中發揮重要的作用,特別是將三者結合起來使用。以往人工智能運用較多的是統計學、概率論,并沒有明確地引入組合的思想,沒有與組合學充分結合。人工智能與組合學相結合可以有效地提高人工智能系統的性能。人工智能的實現需要大量的數據,對于所取得的信息進行科學的分析,以便作為決策或控制的依據,這些都需要統計的支持。數據是人工智能的重要參考和依據。人工智能離不開對數據的分析,其中要用到大量的統計方法,以便對未來的狀況進行預測。統計學應用廣泛,例如,企業要對自己產品的市場潛力作出預測,以便及時調整生產計劃,這就需要利用市場調查取得數據,并對數據進行統計分析;經濟學家在預測通貨膨脹時,運用有關生產價格指數、生產能力、失業率等統計數據,然后用統計模型進行預測。統計學能讓人們正確地認識事物,避免或減少錯誤發生。概率論是研究隨機現象的統計規律的數學學科。結果具有多種可能性,而且在之前可以確定所有可能的結果,但不能準確預言會出現哪種結果。概率是衡量事件發生的可能性的量度。在隨機情況下某個事件的發生具有偶然性,但在相同條件下大量重復的隨機試驗卻常常表現出明顯的規律。組合學也稱組合數學,它研究的是滿足各種附加條件的有限個對象的集合。組合學所研究的問題有:計數問題、存在性問題、構造和算法問題、優化問題等。組合學分為圖論、組合計數、組合設計、組合最優化和組合幾何等。根據組合學研究與發展的現狀可分為五個分支:經典組合學、組合序、組合設計、圖與超圖和組合多面形與最優化。組合學不僅在軟件技術中有重要的應用價值,在企業管理、金融分析、交通規劃等領域都有重要的應用。例如,在美國有一家公司用組合學的方法來提高企業管理的效益,取得了很大的成功。
數據按照獲取時間大致可以分為實時數據和過往數據,過往數據的作用是根據以往的數據來判斷和推理將來和未知。數據的獲取主要可以通過傳感器來完成,例如空調中的溫度和濕度傳感器,電視機的紅外遙控器,電冰箱、電飯煲中的溫度傳感器,照相機中的光傳感器,汽車的燃料計和速度計等,不勝枚舉。許多人工智能設備獲取信息是通過多種不同功能的傳感器來收集各種不同性質的信息,例如溫濕度、紅外、震動、氣體、氣壓、速度、加速度等數據。對于信息的理解則是通過對傳感器信息的處理來實現的。如果用人體來類比,計算機相當人的大腦,執行機構相當人的肌體,傳感器相當于人的五官和皮膚,對外界或周邊環境進行感知,將感知到的信息轉化為電信號并進行傳輸。世界已經進入信息時代,構成現代信息技術的三大支柱是:傳感器技術、通信技術和計算機技術,三者在信息系統中分別起到“感官”、“神經”和“大腦”的作用。運用傳感器技術進行信息采集,運用通信技術進行信息傳輸,運用計算機技術進行信息處理。在利用信息的過程中首先要獲取準確可靠的信息,而傳感器是獲取信息的主要途徑和手段。目前傳感器已經在眾多的領域得到應用,除了工業、農業、商業外,還廣泛用于自動化生產、環境監測、交通、醫療診斷、現代辦公設備、航空航天、智能樓宇和家用電器等領域。
人工智能學科是計算機科學中涉及研究、設計和應用智能機器的一個重要分支,研究如何使機器具備智能的科學和技術,通過使機器模擬和執行人的大腦的某些智力功能,能在各類環境中執行各種擬人任務的機器,并探索相關的理論和技術。人類智能指的是人類所具有的智力和行為能力,包括感知能力、記憶能力、思維能力、歸納與演繹能力、學習能力和行為能力。所有的這些能力都與人的大腦相關。人的大腦包括端腦和間腦,端腦包括左右大腦半球,端腦由約140億個細胞構成,巨量的腦細胞之間存在著復雜的聯系。如果用網絡來表示,大腦毫無疑問是一個超大規模的復雜網絡。腦細胞的數量動態變化,每天要死亡約10萬個,越不用腦,腦細胞死亡越多,因此要勤于用腦。人腦中的主要成分是血液,血液占到80%,大腦雖只占人體體重的2%,但耗氧量達全身耗氧量的25%,血流量占心臟輸出血量的15%,一天內流經腦的血液為2000升。到目前為止,人類大腦依然是最復雜最神秘的科學難題,存在著大量的未知之謎。研究人工智能有助于人類對自身大腦的認識?,F在計算機的智能水平還相對低下,人們研究人工智能的遠大前景是讓計算機同人腦一樣,甚至超越人腦。用機器代替人,可以代替人從事繁重的工作,提高效率或品質,降低成本,也適合于一些危險或艱苦的場合。人腦是一個動態的、開放的、高度復雜的龐大信息系統。目前往往采用結構模擬的方法,即根據人腦的生理結構和工作機理實現計算機的智能,由于還不能對人的大腦做到真正和完全模擬,只是對它進行局部或近視模擬。具體地說,就是用人工神經網絡作為信息和知識的載體,用神經計算的方法實現識別、學習、聯想和推理等功能,從而來模擬人類大腦的智能,使計算機表現出某種智能。結構模擬法基于人類大腦的生理模型進行數值計算,從微觀上模擬人類大腦以實現機器智能。這種方法先通過神經網絡的自學習獲得知識,然后利用知識來解決問題實現智能化。
人工智能依賴于大數據,人工智能以數據為基礎,往往通過數值計算進行問題求解而實現智能。數據的類型大致可分為三類:傳統數據、機器和傳感器數據、社交數據。傳統數據包括各種調查數據、統計數據、銷售數據、庫存數據以及記錄數據等。機器和傳感器數據包括查詢記錄、瀏覽記錄、呼叫記錄、智能儀表、工業設備傳感器、設備日志、交易數據等。社交數據包括用戶行為記錄、反饋數據等,如微信這樣的社交媒體平臺。數據的種類是多種多樣的,數據的來源也是多種多樣的,人工智能結合大數據需要去偽存真,去除錯誤數據、虛假信息和離群值。從大數據中可以提取多種數據和多個數據源,運用組合(協同)降低風險。采用多維度數據組合以提升人工智能系統性能,應用概率論和數理統計,根據應用場景的不同選擇多種類型的數據加以組合。多維度數據組合可以避免單一數據或低維度數據可能存在的片面和隱患,從而提升人工智能的可靠性和精度。
3結語
未來的世界人工智能將扮演重要的角色,其中的關鍵因素包括數據處理速度和通信速度的大幅提升。隨著5G技術的推廣和普及,使人工智能在人類生產和生活的各個方面會發揮越來越重要的作用。人工智能系統性能至關重要,多維度數據組合的方法有助于人工智能系統性能的提升。
參考文獻
[1] 林海倫,王元卓,賈巖濤,等.面向網絡大數據的知識融合方法綜述[J].計算機學報,2017,40(1):1-27.
[2] 林培光,周佳倩,溫玉蓮.SCONV:一種基于情感分析的金融市場趨勢預測方法[J].計算機研究與發展,2020,57(8):1769-1778.
[3] 秦晨光,王海,任杰,等.基于多任務學習的方言語種識別[J].計算機研究與發展,2019,56(12):2632-2640.
收稿日期:2020-08-25
作者簡介:辛強偉(1980—),男,陜西西安人,博士,講師,研究方向:物聯網。
Performance Optimization Analysis of Artificial Intelligence System Based on
Multi Dimensional Data Combination
XIN Qiang-wei,TANG Yun-kai
(School of Computer, Xianyang Normal University, Xianyang Shaanxi? 712000)
Abstract: The enhancement of the ability of information storage, transmission and processing makes it possible to make full use of big data. Big data is one of the important foundations of artificial intelligence. It is necessary to deal with a large number of data reasonably. Through the selection, integration and analysis of a large number of data, we can find out the correct rules and apply them. The reliability or accuracy of artificial intelligence system needs to be guaranteed, especially in some practical applications. Multi dimensional data combination can reduce the one sidedness and potential hidden danger of data, so as to improve the reliability and accuracy of artificial intelligence system.
Key words: Artificial intelligence; Big data; Multi dimensional; Combination