沈文杰
(福建農(nóng)業(yè)職業(yè)技術(shù)學院,福建 福州 350119)
如今,多種形式的先進拍照技術(shù)越來越普及,網(wǎng)絡(luò)的圖像保存量越來越大,廣泛存在于社交過程與圖像搜索的過程中。圖像可涉及豐富的信息數(shù)據(jù),部分不能借助語言和文學表達的場景都能通過圖像進行充分呈現(xiàn),因此怎樣高效率地運用圖像數(shù)據(jù)備受學術(shù)界以及工業(yè)界相關(guān)人員的重視。機械學習分析結(jié)合生理學知識與認知科學知識,創(chuàng)設(shè)與人們學習過程相匹配的模型,創(chuàng)新理論與方法,形成任務(wù)模式的結(jié)構(gòu)體系,立足于機器學習進行圖像協(xié)同分類系統(tǒng)設(shè)計是強化圖像加工的優(yōu)質(zhì)手段,為此筆者具體、詳細地開展了相關(guān)研究。
機器學習算法研究對應(yīng)信息,在權(quán)重分配與其他類型參數(shù)的參考之下增強性能、實現(xiàn)目的這一過程就是“學習”的內(nèi)涵。掌握機器學習信息集十分關(guān)鍵,通常把最初信息劃分為訓練集以及測試集,前者進行分類器訓練,也就是借助學習過程整理模型,在完成訓練后,根據(jù)測試集對分類器進行預(yù)測。針對圖像種類的信息源,以機器學習為主的圖像分類應(yīng)該獲取圖像基礎(chǔ)特點,后續(xù)構(gòu)建特征向量,借助機器學習算法實現(xiàn)綜合分類器的性能,并將其視作預(yù)測樣本信息的有效工具[1]。近年來,機器學習算法分類器往往被運用于制作BOW模型以及pbM模型的過程中,且成效較好。機器學習分類種類繁多,例如決策樹算法、K最近鄰算法等。任何類型的機器學習算法都存在局限,決策樹的局限就是僅在計算對應(yīng)信息時可獲取顯著成效。對樸素貝葉斯算法來說,應(yīng)將其作用于簡短文本中,決策樹處理簡短文本的成效不如樸素貝葉斯算法,因此要有針對性地挑選機器學習計算方法。
經(jīng)過一系列的分析,機器學習算法對圖像進行分類的成效受到以下3個因素的影響:1) 圖像提取算法。優(yōu)質(zhì)的圖像提取算法可控制縮放與反射等外在因素的制約,全方位凸顯圖像信息。2) 機器學習算法分類器的性能設(shè)置。關(guān)聯(lián)向量機算法應(yīng)創(chuàng)設(shè)對應(yīng)核函數(shù),如果選取樸素貝葉斯應(yīng)嚴格要求樣本獨立性、引進K最近鄰算法時應(yīng)確保K值穩(wěn)定且引進決策樹算法時應(yīng)對樹進行加工[2]。3) 圖像特征信息的多樣化。如果圖像比較單一,那么傳遞信息的過程就會存在難度,提倡綜合篩選多種類型的信息數(shù)據(jù),這樣就能提高圖像的表達性能,還可以達到有效強化圖像分類效率的目的。在當前的系統(tǒng)編制中,對圖像特征向量的精確度進行研究是一種相對可靠的方式,也是后續(xù)研究的關(guān)鍵點,在很大程度上可以帶動圖像分類系統(tǒng)的運作與創(chuàng)新。
機器學習主要是進行數(shù)據(jù)加工,以信息的形式輸出相關(guān)信息。第一種形式便是監(jiān)督學習,也就是在某種情況下分析函數(shù),在接收全新信息數(shù)據(jù)的狀態(tài)下對函數(shù)進行結(jié)果評估。監(jiān)督學習包括輸入過程與輸出過程,在訓練集中通過人員自主標注,監(jiān)督學習有決策樹學習類型與最近鄰居法類型[3]。監(jiān)督學習選取詞匯的出發(fā)點是分類,根據(jù)經(jīng)驗法則降低信息數(shù)據(jù)面臨風險的概率,也就是經(jīng)驗風險最小化。第二種形式便是無監(jiān)督學習,根據(jù)循環(huán)以及遞減運算規(guī)律對信息誤差現(xiàn)象進行規(guī)避,從而合理地對數(shù)據(jù)信息進行分類。不需要給計算機發(fā)送指令,而是計算機自主完成數(shù)據(jù)統(tǒng)計,由于不存在事先安排的樣本信息,因此可提高監(jiān)督學習方法的運用率,對機器學習的模式進行整合與加工,具體的機器學習算法圖像分類過程如圖1所示。

圖1 機器學習算法的圖像分類過程
基于機器學習構(gòu)建圖像協(xié)同分類系統(tǒng)體系,借助計算機定量研究圖像信息,對圖像的多個組成部分進行類別判斷,替換人們的視覺感知。圖像協(xié)同分類系統(tǒng)是圖像檢索的內(nèi)在條件,分類系統(tǒng)可自動化地處理樣本圖像,形成對應(yīng)訓練模型,由此全方位預(yù)測其他類型的數(shù)據(jù)圖像。系統(tǒng)的特征以并行性與協(xié)同性為主,按照多種形式機器學習算法設(shè)計模型,關(guān)聯(lián)機器學習預(yù)測結(jié)果并記錄類別歸屬信息。機器學習算法是到現(xiàn)在為止比較穩(wěn)定的思路,尤其是決策樹算法與樸素貝葉斯算法[4]。針對圖像協(xié)同分類系統(tǒng)結(jié)構(gòu),引進C/S模式,圍繞網(wǎng)絡(luò)平臺對客戶端進行設(shè)置,利用C++語言編寫程序,對應(yīng)的服務(wù)器端MySQL數(shù)據(jù)庫在重要信息的保存與預(yù)測中可以發(fā)揮重要作用。
3.2.1 非功能性層面
在設(shè)計圖像協(xié)同分類系統(tǒng)之后,將其保存在一般模式的計算機中,由于系統(tǒng)訓練以及樣本評估體現(xiàn)了信息的不確定性,要思考信息量大的情況,也就是輸入大量圖像,判斷系統(tǒng)是否能穩(wěn)定、安全地運行,并輸出預(yù)測結(jié)果信息。因此系統(tǒng)的設(shè)計應(yīng)滿足以下5點要求:1) 減少內(nèi)存消耗,由于圖像分類過程給予圖像信息的每種處理方式都要保存在內(nèi)存中,科學的保存結(jié)構(gòu)能夠降低大比例占用內(nèi)存的概率,因此可挑選流式加載處理技術(shù)。2) 減少樣本訓練需求的時間,引進并行化理念處理樣本[5]。3) 保證預(yù)測結(jié)果的精準度。傳統(tǒng)的預(yù)測方式僅選取相同機器學習算法,在圖像協(xié)同分類系統(tǒng)設(shè)計中應(yīng)利用多個機器學習方式來提升準確率。4) 保持信息庫的讀寫分離狀態(tài),讀寫分離要求信息庫閱讀操作與寫作操作互相分割,由此緩解信息庫IO的壓力或者將外界環(huán)境中的讀寫請求均勻地分配到多個信息庫中。信息庫結(jié)合事物處理的性質(zhì)完成類別判斷,即主信息庫與從信息庫,前者實施寫作環(huán)節(jié),后者實施閱讀環(huán)節(jié)。5) 高維特征向量引保持降維的特征。數(shù)字圖像加工領(lǐng)域內(nèi)包括許多降維形式,尤其是PCA形式,關(guān)聯(lián)計算均值、方差與協(xié)方差矩陣計算等,需要用到的便是均值計算與方差計算,把矩陣的實際均值與方差信息視作圖像紋理的典型特點。
3.2.2 功能性需求層面
功能性需求是根據(jù)圖像協(xié)同分類系統(tǒng)布設(shè)要求分類別地對系統(tǒng)基礎(chǔ)進行操作與劃分,思考如何設(shè)定參數(shù)、如何計算特征、如何預(yù)測樣本信息與如何統(tǒng)計最終結(jié)果等[6]。
完整的圖像協(xié)同分類系統(tǒng)設(shè)計應(yīng)該包括4層,詳細介紹如下。
3.3.1 設(shè)計系統(tǒng)的第一層——UI界面層
設(shè)計UI界面層,也就是為用戶提供可視化界面,以該界面為基礎(chǔ)對信息數(shù)據(jù)進行傳遞。用戶可以直接感受UI界面層,親自觀察分類系統(tǒng)是如何處理圖像信息的,獲取具有價值的階段性數(shù)據(jù)。根據(jù)桌面應(yīng)用流程進行標準化設(shè)計,體現(xiàn)本地實時計算與迅速訪問的優(yōu)勢[7],它可以執(zhí)行參數(shù)設(shè)置、計算特征、訓練樣本與預(yù)測樣本結(jié)果等操作,用戶可以在興趣愛好的驅(qū)使下進行自主選取。
3.3.2 設(shè)計系統(tǒng)的第二層——邏輯控制層
邏輯控制層作為數(shù)據(jù)處理層以及UI界面層的鏈接媒介,首先是把UI界面層內(nèi)的信息數(shù)據(jù)發(fā)送到處理層結(jié)構(gòu)中;其次,把處理層獲取的結(jié)數(shù)據(jù)轉(zhuǎn)移到控制層中,通過恰當?shù)男问奖4嬖赨I界面層中;最后,控制層有針對性地對信息數(shù)據(jù)進行操作,促使處理層內(nèi)信息的真實性不受影響,安全、穩(wěn)定地運作數(shù)據(jù)處理層。需要注意的是,信息真實性不受影響主要是執(zhí)行模塊在信息傳遞期間不會更改數(shù)據(jù),控制層安設(shè)讀寫鎖,全部的執(zhí)行模塊在傳遞信息之前都應(yīng)通過讀寫鎖的檢驗后再開展繼續(xù)作業(yè),不然會一直保持等待狀態(tài)。在該過程及時納入并行化處理技術(shù),也就是發(fā)揮多線程技術(shù)的作用[8]??刂茖釉诜治鲇布?shù)據(jù)與資源利用情況之后啟動線程數(shù)據(jù),讓系統(tǒng)保持較高的信息處理效率,可以說線程也是工作線程的簡稱。如果某個線程在任務(wù)加工期間出現(xiàn)停止的情況,那么控制層會及時感知異常,啟動其他形式的線程進行替換,以完成尚未被全面加工的任務(wù)。發(fā)布新任務(wù)之后,如果控制層線程數(shù)目不多,就要適當?shù)匾M線程,此時控制層創(chuàng)設(shè)線層模塊來完成任務(wù),控制層規(guī)避線程調(diào)整的數(shù)目,也就是Mater-Worker模式,借助系統(tǒng)的整體資源,在不制約處理層運作效率的基礎(chǔ)上不出現(xiàn)資源浪費的現(xiàn)象,由此妥善完成邏輯控制層的核心任務(wù)。對應(yīng)的邏輯控制核心和相鄰兩層交互結(jié)構(gòu)圖如圖2所示。

圖2 邏輯控制核心和相鄰兩層交互結(jié)構(gòu)圖
3.3.3 設(shè)計系統(tǒng)的第三層——數(shù)據(jù)處理層
將數(shù)據(jù)處理層劃分為線程模塊、讀寫鎖模塊、大信息塊以及階段性信息傳遞模塊等。
3.3.3.1 設(shè)計線程模塊
線程模塊作為圖像協(xié)同分類系統(tǒng)的核心結(jié)構(gòu),大多數(shù)情況下它可以運作多個類型的線程,任何線程都要求分配任務(wù),對應(yīng)任務(wù)涉及計算切割完成的小信息塊與傳遞控制層的信息結(jié)果。
3.3.3.2 設(shè)計讀寫鎖模塊
被加工的信息往往來源于磁盤文件,并且許多信息數(shù)據(jù)被保存在文件結(jié)構(gòu)中,尤其是訓練模型與訓練樣本集文件,利用數(shù)據(jù)處理層的安全來保證讀寫環(huán)節(jié)的正常運作[9],可以將一些讀寫操作存在多個線程之內(nèi),如果在相同時刻進行讀寫,就會缺少保護方案,可能出現(xiàn)文件信息不能真實傳遞的結(jié)果。另外,考慮閱讀文件的概率比較大,因此可擬定讀寫鎖來保障安全性。而不需要文件與讀寫鎖一一對應(yīng),而是適當?shù)卦O(shè)置讀寫鎖的數(shù)量即可,不然大量讀寫鎖會制約系統(tǒng)性能的發(fā)揮。因此協(xié)同分類系統(tǒng)設(shè)計可對關(guān)鍵類型的文件配置讀寫鎖,為信息數(shù)據(jù)傳遞的真實性提供保障。
3.3.3.3 設(shè)計大信息塊
切割大信息塊的第一個形式就是基于個體的形式對樣本庫進行劃分,這樣樣本個體都是單一化的信息塊。第二個形式便是為多維向量設(shè)置一定維度,這樣任何維度中的數(shù)據(jù)信息都是小信息塊。
3.3.3.4 設(shè)計階段性信息傳遞模塊
數(shù)據(jù)處理層主要進行密集化的數(shù)據(jù)統(tǒng)計,涉及樣本訓練信息與樣本分析結(jié)果信息。操作加工的每個環(huán)節(jié)都與階段性信息傳遞存在關(guān)聯(lián),把信息傳遞給邏輯控制層,即保存在本地磁盤內(nèi)。還可以把信息傳遞給保存層,即向信息庫內(nèi)輸入信息數(shù)據(jù)。
3.3.4 設(shè)計系統(tǒng)的第四層——數(shù)據(jù)存儲層
圖像協(xié)同分類系統(tǒng)的設(shè)計與實現(xiàn)。數(shù)據(jù)存儲層是最后一層,存在于信息庫服務(wù)器的端口部位,對數(shù)據(jù)處理層發(fā)布的信息處理指令進行響應(yīng)。數(shù)據(jù)存儲層借助MySQL信息庫,由于信息庫讀寫頻率是存在差異的,因此這一個層次不僅有唯一的信息庫,而且還包括許多信息庫。主信息庫進行請求書寫,從信息庫發(fā)出響應(yīng)度請求。前者促使負載維持均衡,讓信息庫長時間運作;后者借助主從復制實現(xiàn)同步信息統(tǒng)計,根據(jù)讀寫分離技術(shù)強化信息庫整體并發(fā)負載水平,由此完整地設(shè)計基于機器學習的圖像協(xié)同分類系統(tǒng),把信息數(shù)據(jù)的處理作業(yè)推向高層次發(fā)展。
綜上所述,開展對基于機器學習的圖像協(xié)同分類系統(tǒng)的研究具有重要的價值,網(wǎng)絡(luò)發(fā)展讓圖像發(fā)展成為比較關(guān)鍵的信息源,圖像分類作為創(chuàng)新圖像檢索技術(shù)的有效途徑,相關(guān)人員要加大力度對機器學習的性能進行研究,優(yōu)化圖像協(xié)同分類系統(tǒng)設(shè)置,爭取在較短時間內(nèi)獲取數(shù)據(jù)信息處理的最大化效果,增強信息統(tǒng)計的真實性與準確性。