
摘 要 在航天器飛行過程中,多傳感器輸入數據樣本點之間,存在復雜的數據傳輸與計算關系。傳統軟件定義這些數據為矢量或矩陣的形式。通過軟件開發人員人工分析數據之間具有局部聯系,這些工作簡單枯燥,耗費軟件開發人員大量精力。隨著空間飛行器任務越來越復雜,數據量成倍數增長,亟待解決的問題就是:為數據找到新的高效的表示和編碼方法。本文提出一種基于網絡構建技術的方法,為解決空間軟件編碼問題提供了一種新思路。
關鍵詞 網絡構建;空間軟件;編碼
萬維網是以網絡格式表示的海量數據的典范,頁面可以映射為節點,邊就是也頁面之間的鏈接。筆者探索將此種方法引入空間數據處理系統,將傳統的以矢量或矩陣形式表示的數據轉換成網絡表示的形式,解決效率低下的問題。
1空間數據特征
(1)無序數據。例如:位置、速度、角度、角速度、時間信息、軌道信息等。
(2)有序數據:從起飛瞬間開始,執行動作具有順序特征,且不可逆。
(3)數值數據:例如高度和重量。
網絡構建的數據相比以向量表示的數據擁有更多的信息。這些附加信息有幾個部分組成,其中最重要的就是樣本之間的關系結構或者拓撲信息。網絡拓撲結構的優勢還有可以用交互的方式進行編碼。如何改變非結構化數據?本文引入網絡構建技術,作為非結構化數據與結構化數據的橋梁[1]。
首先,處理常用的數據距離定義有:歐氏距離;加權歐式距離;曼哈頓或者城市街區距離;切比雪夫距離閔可夫斯基距離馬氏距離等。本文使用馬氏距離度量目標軟件
接下來處理有序和無序兩類數據,本文引入二元屬性(出現,不出現)的方法來刻畫對象間的相似性。例如:太陽相關數據,地球相關數據,恒星相關數據,飛行器自身產生的數據等。我們定義感興趣的類別為出現,其他類別為不出現狀態。因此,當比較兩個向量時,會有四種不同的情況:
M11:表示兩個向量同時出現的次數;M10:表示僅第一個向量出現的次數;M01:表示只有第二個向量出現的次數;M00:表示兩個向量都不出現的次數
常用的相似度算法有:杰卡德相似度,sorensen相似度,簡單匹配相似度等。通過實驗對比分析各種相似度匹配算法后,本文使用定義buser相似度算法,
因為在這里引入平方根項,可以消除在其他相似度計算公式(杰卡德相似度)中常見樣本大小誤差。方法及步驟如下:
假定相似矩陣S 或相異矩陣D,構建網絡的最直接方法是在兩節點之間建立連邊,連邊權重通過的倒數的函數獲得。這種方法生成的網絡通常是完全網絡且需要滿足以下標準:
(1)為了維持節點之間的相互連接,網絡必須包含一個巨大的單元。
(2)為了更好揭示數據節點之間的關系,應盡可能稀疏,這樣可以增加數據分類處理的效率,增加準確性和魯棒性。
在工程實踐過程中發現,連邊的權重與泛化結果正相關??梢詫嘀匦〉倪B邊看作數據通信中的噪聲,這些噪聲將向算法提供誤導性信息。所以,這些帶噪聲的連邊會扭曲最終的網絡拓撲結構,刪掉這些連邊將是提高算法效率的一個重要預處理步驟[2]。
根據以上推理,可以稀疏化相似性和相異性矩陣使用KNN網絡,這是一種常用的靜態網絡構建技術。簡單地說是將整個網絡剪切成一系列重疊的線性模塊,然后將他們粘貼在一起。構建一個有向網絡,之間互相連接的邊存在的條件是當且僅當兩個點是最相似的k個元素之一。計算過程中,我們需要按照相異矩陣的行進行升序排序,一旦排序完成,就可以用統一的方式對待數據關系密集區和稀疏區域中的數據項。當處于稀疏區域時,knn網絡被激活。實質上是通過啟發式算法完成網絡構建。具體而言采用單鏈路方法,構建連接的稀疏的網絡,同時也可以維持原來數據集的簇結構。實驗表明當K=3時,對目前中等規模軟件網絡拓撲效果最優。原因分析為,函數嵌套堆棧最大深度為8層,數據間距離計算結果為1~8之間的球形分布,對軟件編碼規模和密度非常靈活,實現效果高于傳統軟件工程師人工分析的正確率。
Knn網絡構建技術也可以被描述為優化函數,不需要建立對稱矩陣。每個節點的出度與參數K對應,但是節點入度保持變化(至少是K)。這種實驗現象的產生可以用非對稱特性來解釋。另外,優化函數可以通過循環信念傳播算法實現。使得本算法可以推廣到任意復雜度的軟件。只需要選擇合適的網絡直徑d,就可以表征網絡代替原有的節點相似性度量。
仿真實驗:在某空間軟件設計編碼的過程中,筆者使用KNN網絡構建技術度量數據分類的準確性,所用的核函數均是高斯核,結果表明有4類樣本的類間樣本用直線連接起來,另一類樣本間沒有連接??梢娔繕塑浖?,各類之間的差別是微弱的,本實驗算法把輸入空間的樣本映射到高維特征空間,實現了對軟件樣本在特征空間的優化的目的。
參考文獻
[1] 黃鳳崗,宋克歐.模式識別[M].哈爾濱:哈爾濱工程大學出版社, 1998:79.
[2] 沈清,湯霖.模式識別導論[M].北京:國防科技大學出版社,1991:19.
作者簡介
葛瑩(1983-),女,北京人;學歷:碩士,職稱:工程師,現就職單位:北京控制工程研究所,研究方向:空間網絡軟件。