李心宇,李曉航,李志偉,李冬雪
(1.吉林大學 軟件學院軟件工程系,吉林 長春 130000;2. 吉林大學 數學學院,吉林 長春 130000)
多層感知器神經網絡,重視以較多的層次進行復雜信息快速處理,擬構建四層作業架構,拓撲結構見圖1。

圖1 多層感知器神經網絡拓撲結構
對該結構進行分析可發現,其特點在于增設了兩個中間層次,基層仍負責海量信息的直接收集和處理,之后反饋給中層,再由中層反饋給高層。此過程中所有信息不斷得到優化和加工,有助于實現高效率的分析和決策。
基層的功能在于直接進行海量信息的直接收集,并對其進行初步加強,使完全松散的數據信息帶有一定的半結構化特點。在此基礎上,半結構化信息被傳輸至中層,由中層將其加工為結構化信息,并借助中層的另一個層次進行處理,使其在結構化的基礎上完成分類,再選取合適的信道進行傳輸。結構化的分類信息最終傳輸給高層,即多層感知器神經網絡的終端,結合傳輸結果進行信息分析和最終決策。
多層感知器神經網絡對信息處理的要求極高,不同信息富含的內容也較為多樣,具有多個可分析的維度。例如,信息內容為“X 省XX 大學X 學院100 名學生考入清華大學研究生院”。該信息中可分析的維度包括地理信息、學校信息、動態信息、主體信息等。如果各類信息均完整進行所有維度評估,工作量較大,難以保證效率,不符合多層感知器神經網絡的工作要求,也無法發揮智能分類算法的積極作用。擬采用降維設計思路,在多層感知器神經網絡的各層次,只在層次內對信息的核心維度進行提煉,以完成海量信息的快速處理[1]。
多層感知器神經網絡的基層即第一層,作用與人體各處的神經元類似,強調海量信息的收集和快速加工。以降維訓練法為基礎,擬在該層次收集K 近鄰算法進行工作。選取工作對象后,提煉其核心維度信息,將提煉后獲取的信息作為標準K 點帶入計算機中實現記憶。收集所獲的信息越多,K 點的選取越具科學性。例如,工作對象為“大學生消費信息統計”。可選取的核心維度包括大學生和消費額兩個方面。多層感知器神經網絡內廣泛分布的基層神經組織,可對各類信息進行初步收集,信息被收集后均投入到K 近鄰算法的定義域內。如果該信息與兩個標準K 點學生、消費額均較為接近,表明其符合信息收集要求,可對其進行下一步處理。如果基層資源豐富,可做性別、年齡等維度的設計,進一步發揮基層的計算價值,提升信息加工的有效性。如果基層計算資源相對缺乏,則不做更多信息,以核心維度進行信息初篩和計算即可[2]。
第二層次、第三層次采用的智能算法均為隨機森林法。基層完成原始信息的收集和初步加工后,以“學生、消費額”為核心維度的信息被傳輸至第二層。第二層仍借助降維方式進行計算,設定“性別”“地區”“年級”等核心維度,在此基礎上調整訓練方式,建立涵蓋至少30 000 棵決策樹的森林。所有樣本投入第二層次后,均由森林內決策樹進行分析。例如,A樣本含有“性別”“地區”“年級”等維度信息,森林中3 000 棵樹木認為信息包括“女性”特點,嘗試將其納入女大學生信息庫。20 000 棵樹木認為信息包括“男性”特點,嘗試將其納入男大學生信息庫。根據多數原則,可認為A 樣本中的目標為“男性”,進行對應信息的快速加工,進一步提升其結構化特點。
第二層次信息完成智能計算后,繼續發送至第三等級。第三等級借助降維方式進行計算,以隨機森林法進行智能分析,其設定的分析維度與第二層和基層均有不同,更強調借助具有高度特點的方式完成信息的篩選,如“學歷”維度、“消費結構”維度、“消費等級維度”等。以消費等級維度為例,可設定高級(月消費超過3 000 元)、中級(月消費在1 500~2 999 元之間)和低級(月消費在1 499 元及以下)。在此模式下,第二層次傳輸的所有信息得到該層次的進一步加工處理,更具結構化特點。計算完成后可傳輸至第四層次,直接用于分析、查看。
模擬對象為A 地區17 所大學的成績情況,借助大學信息資料庫建立基于多層感知器神經網絡的智能分類算法模型,采用第一節、第二節所述的設計和算法進行模擬分析。以常規單層次感知器神經網絡和傳統算法對照,評估新方式的積極作用。觀察指標為計算耗時、結果是否存在差錯和信息完整性。其中,信息完整性包括原始信息完整性、半結構化信息完整性和結構行信息完整性3 個方面。三類信息均完整,可隨時調取查看,評估為完整。樣本數共18.52 萬個,均為隨機樣本,不進行重組[3]。
模擬過程分為兩個階段。第一階段為新方式階段,直接將所有樣本投入到第一層次進行大范圍收集和分析。設定第一層次分析維度為“成績”“年級”“學院”3個方面;第二層次分析維度為“不同科目”“必修課”“選修課”;第三層次為“優等”(得分超過80 分)、“中等”(得分60~79 分)、“較差”(得分59 分或以下)。第四層次直接進行第三層次信息的收集和查看。第二階段為常規單層次感知器神經網絡和傳統算法模擬。對照標準為上述學院的現有信息。
實驗結果見表1。
可見,基于多層感知器神經網絡的智能分類算法,能夠快速完成18.52 萬個樣本的分析和計算,耗時6.4 s,未出現差錯,信息完整性為100.00%。對照組采用常規單層次感知器神經網絡和傳統算法進行工作,計算耗時為12.2 min,出現差錯共411 例,且信息完整性為66.67%,僅實現了非結構化信息、結構化信息的保存,無法提供半結構信息,表明基于多層感知器神經網絡的智能分類算法具有較高的價值。

表1 模擬實驗結果
結合實驗結果,四層次感知器神經網絡存在結構相對復雜、對硬件設備要求高、對通信活動要求高的特點。不同層次之間的交互,要求以無線模式和優先模式并行的方法開展。當出現通信信道擁堵問題時,基層可能無法獲取對應的原始信息,中層、高層之間的信息交互也會受到影響。此外,頻繁的信息交互也可能導致互擾問題,導致信息可讀性下降。此外,無論采用K 近鄰算法或隨機森林法,均面臨大量數據收集和訓練的問題,且需要合理進行篩選、計算維度的選取,以免出現計算遺漏或降維不當。
為予以應對,不同層次進行早期訓練時可收集大數據信息,確保基于目標的算法具有高度適用性。例如,借助大數據進行消費信息評估時,應考慮收集所獲信息與工作對象的相關性,剔除無關信息的同時,確保主要信息內容詳實、豐富且客觀。降維訓練法下,在計算維度選取時,要求保證所選維度能與對象核心信息相匹配。建議在實際工作中加強信道建設,在條件允許的情況下,以有線信道提供通信服務,所有信道均避免接收干擾源頭。從算法設計層面看,還應引入智能分析法。當存在信息傳遞和交互需求時,借助中層(包括第二層次和第三層次)進行信道擁堵程度的智能化評析,優先選取較流暢的信道進行信息傳輸。為避免信息出現互擾,可采用降噪技術,在信息的接收一端對初步收集和傳遞的信息進行篩選、加工,篩除各類噪音。
基于多層感知器神經網絡的智能分類算法具有較高價值,也具有可行性。多層感知器神經網絡拓撲結構為四層模式,不同層次功能各自獨立,擬采用降維設計思路對海量數據的處理采用K 近鄰算法,用于多層感知器神經網絡基層,其余層次以隨機森林法進行智能計算。模擬實驗證明,上述理論具有可行性。