陳效真,周 姣,董燕琴,魏宗康,王常虹
(1.國家慣性技術產品質量監督檢驗中心,北京100039;2.北京航天控制儀器研究所,北京100039;3.火箭軍裝備研究院,北京100094;4.哈爾濱工業大學空間控制與慣性技術研究中心,哈爾濱150080)
高精度慣性導航系統作為戰略導彈武器系統中制導和控制的關鍵部件,是武器系統實現精確打擊的關鍵[1-4]。高精度慣性導航系統產品的研制、驗收和應用分為4個階段運行,期間生成了海量的數據。第一階段是研制階段,由設計和生產單位完成,生成了大量元件、儀表和單機的測試數據;第二階段是控制系統綜合測試階段,生成了大量的靜動態試驗仿真數據、地面模擬飛行數據;第三階段是飛行試驗和靶試階段,重點在于收集遙外測數據,驗證天地一致性;第四階段是裝備服役階段,生成了大量的儲存、年檢及性能退化數據。不同時期從不同側面反映了產品特性,每個階段數據各具特色,形成不同特征的數據包,但是各階段自成體系,由此形成數據 “孤島”。這些 “孤島”之間缺乏溝通互補,雖為同類,但由于型號不同,組織建設的制約導致慣性導航系統借鑒和應用的藩籬,難以形成高精度慣性導航系統全壽命周期測試大數據體系。
慣性導航測試數據的分析是高精度慣性導航系統研制、驗收和應用中的難題。目前,很大部分數據采用人工判讀集合單機數據庫存儲的方式進行,這種依賴人工的數據分析在面對海量的大數據時,存在耗時、低效、成本高等諸多缺點,并且測試人員很難通過肉眼從海量的原始數據中理解問題的本質。如何將這些海量數據背后隱含的有價值信息挖掘出來,幫助測試人員分析和解決問題,提高慣性導航系統的精度已成為當務之急和應勢之舉。
大數據是指無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產,它具有規模性(Volume)、實時高速性(Velocity)、 多樣性(Variety)、 低價值密度(Value)和真實性(Veracity)5個特征。目前,高精度慣性導航系統在全壽命周期的數據也具備上述5個特征。同時,高精度慣性導航系統還具備新的特征,例如,在出廠階段重點在于對慣性測量裝置低階誤差系數的穩定性考核,在控制系統綜合測試階段重點在于對慣性測量系統高階誤差和動態導航精度的估計和評估,在裝備服役階段重點在于對測試數據的保持能力和飛行試驗的遙外測數據收集和比對,驗證高精度慣性導航系統的天地一致性。高精度慣性導航系統的數據同一產品子樣少,同類型號多;數據生成周期長,同類產品試驗頻次多;數據高密度壁壘致使數據分散,關聯度不緊密,顯性度不夠。因此,亟需建立一個高精度慣性導航系統全壽命周期測試大數據體系,通過數據挖掘實現同類產品數據對比和經驗遞推,以保障慣性導航系統精度、可靠性、壽命及天地一致性等應用性能。
本文首先介紹了大數據發展現狀;其次詳細分析了慣性導航測試系統數據采集、數據管理及數據應用中存在的問題,提出大數據管理分析系統的需求和目標;最后,結合數據管理和分析中的關鍵技術,構建了慣性導航測試系統以數據采集層、數據支撐層和數據應用層為3大模塊的大數據分析平臺基本框架。為高精度慣性導航系統優化設計、提升精度、保障產品可靠性、合理預估系統壽命及適應未來戰爭提供了發展思路。
在試驗不變的條件下,重復試驗多次,隨機事件的頻率近似于它的概率,這是大數據定理的基礎。有規律的隨機事件在大量重復出現的條件下,往往呈現幾乎必然的統計特性。2010年,《Science》刊登文章指出,雖然人們的出行模式有很大不同,但大多數是可以預測的。這意味著能夠根據個體之前的行為軌跡預測未來行蹤的可能性,從此開啟了大數據理論研究的先河。牛津大學網絡學院互聯網治理與監管專業教授舍恩伯格在 《大數據時代》一書中指出,大數據不是隨機樣本,而是全體數據;不是精確性,而是混雜性;不是因果關系,而是相關關系。在這樣一個數據大量產生和積累的時代,從海量的數據金礦中發現暗藏的規律,就能夠搶占先機,先發制人。
隨著信息化與工業化的融合發展,信息技術滲透到了工業企業產業鏈的各個環節。生產和測試線上高速運轉的機器所產生的數據量不亞于計算機數據,數據量大,種類多,實時性高。隨著工業大數據的逐漸積累,數據挖掘將為企業取得更多的價值,促進企業進行經濟效益提升、安全生產和節能減排等方面的改進。
時至今日,一款型號慣性導航系統的輸出已由單一數據轉變為由數據、符號、噪聲等因素多信息的集成。大數據分析平臺能夠跨越視覺、文字、語言、圖形、符號、聽覺、音響、噪聲等不同類型的媒體數據,對現實物理精密結構實體知識、機理、功能、精度、壽命進行統一表征,構建現實物理精密結構實體跨媒體知識圖譜、模型、標準、理論,實現跨媒體現實物理精密結構實體的知識演化、推理、預警、預測、評價、評估、演繹、饋補、優化、簡化,實現數據的深度挖掘和物理機理的深入關聯理解。因此,利用新興的大數據技術分析高精度慣性導航系統測試數據已成為提高測試效率和準確性、實踐和檢驗現代自主智能控制理論、推動慣性技術應用優化的必然手段,是慣性導航技術適應現代多維立體交叉戰爭,實現多元裝備自主智能多信息融合協同精確打擊的有效解決辦法。
當前,我國在高精度慣性導航系統研制仿真測試方面,雖然已經取得了長足的進步,但仍存在很多不足,與慣性導航技術產品的研制需求極不適應,例如機理不清、模型簡單、精度不高、激勵方法陳舊、流程繁瑣、使用復雜等諸多關鍵問題。從技術上講,高精度慣性導航系統在生產工藝上已經將產品的生產精度提高到極致,而目前大部分瓶頸問題在于高精度慣性導航系統測試技術沒有足夠的計算能力,處理海量數據困難,因此,要把這些龐大的工程數據利用起來,為數據分析提供高性能并行計算是必要的基礎能力。大數據是現代信息技術的重要發展方向之一,實現大數據的共享和分析將為高精度慣性導航系統帶來難以估量的經濟價值和工作效率,同時也會對慣性導航技術發展產生巨大的推動作用。高精度慣性導航系統有必要順應當前趨勢,向著互聯共享、虛擬化、自動化、模塊化、集成化、綜合化、智能化、網絡化、協同化、實戰化、標準化的方向發展,將海量的測試數據加以利用,因此,對高精度慣性導航系統大數據測試平臺的建設需求十分緊迫。
數據采集是數據挖掘和分析的前提,同時也是分析解決問題,提升產品性能的第一步。
在目前的高精度慣性導航測試過程中,數據的采集和應用存在嚴峻問題。其中包括:1)數據可信度不強。由于測試過程中環境、操作流程等數據沒有完整記錄,導致測試過程中產生的干擾被帶入采集數據,數據的準確性降低,可信度不強。2)數據與物理行為映射關系不清。數據的產生受到多種物理行為的影響,在誤差的分析過程中,有限的測試數據很難將各種物理因素的影響分離出來,因而在誤差補償過程中物理機理不明確,針對性差。3)全生命周期數據采集積累、統籌分析、系統協同應用管理、風險預測預判不力。其中,生產、測試和貯存各階段中只關心階段內的數據,各階段之間銜接不緊密,缺乏全局總體的數據觀測,導致風險預測能力差。4)行業壁壘嚴重。從元器件到裝配及使用過程中,各部門間數據傳遞缺乏,原始數據和問題被保留,系統整體性差。這些問題導致慣性系統的物理機械性能測試不準確,進而直接降低高精度慣性導航系統精度、可靠性和儲存壽命。
高精度慣性導航系統測試過程中產生的數據具有數據量大、類型復雜多樣及關聯性強的特點,如何在這些數據之間建立連接,為測試人員提供便捷的數據瀏覽界面是測試數據分析是否成功的重要因素。若能夠實現對全部歷史數據的自由追溯查詢,則質量過程控制的力度將大幅度提升,實現高精度慣性導航系統不同階段間所有數據內容的橫縱比對,必然將大幅提升高精度慣性導航系統的測試質量和效率。
慣性導航測試系統目前的數據處理手段和管理手段已經無法適應當前高精度慣性導航系統研制的要求,存在的主要問題包括:1)測試數據量大,但數據采集設備與數據管理服務器不互連,雖然使用TDM對數據進行了處理并存儲在關系型數據庫中,但依然可能導致數據不一致性問題。2)數據類型多,缺乏統一管理,數據導入過程復雜、效率低,導致數據更新的時效性差。3)對于大數據,無法使用存儲介質進行設備與服務器之間的數據交換,導致大量數據浪費。4)數據利用率低,分析困難,無法利用大數據處理方法來進行高精度慣性導航系統可靠性評估與故障診斷。5)高精度慣性導航系統數據處理與分析方法不規范,共享性差,導致推廣困難,重復工作。6)數據自動判讀的深度與廣度不夠,導致測試覆蓋性不全,容易漏掉產品的質量問題。據統計,一個測試任務結束時,往往會產生GB量級的文檔甚至TB量級的測試數據,這些數據的利用還存在著嚴重不足。一方面,數據查找非常不方便,測試人員在資料收集上浪費大量時間;另一方面,一旦設備出現故障,這些數據可能會丟失,給企業帶來損失。
面對高精度慣性導航系統測試過程中產生的諸多問題,大數據技術將成為提升高精度慣性導航系統測試效率和準確性的有效方案。因此,高精度慣性導航系統迫切需要建設一個高效統一的數據管理和分析系統,提升測試準確性和效率,完善企業的知識積累。
在慣性導航測試技術中主要以精度、可靠性、儲存維修指標和退役指標評價高精度慣性導航系統4類重要的應用性能。目前的慣性導航系統數據應用中,每一類指標的數據采集中都存在問題,具體如圖1所示。下面針對高精度慣性導航系統的4類指標,分析慣性導航測試系統數據采集中存在的具體問題。
(1)精度
慣性導航測試系統中精度指標包括設計指標、測試指標、試驗指標和環境指標。其中,設計指標來源于高精度慣性導航系統最初的理論設計,測試指標來源于生產制造過程,試驗指標來源于出廠驗收階段,而環境指標則來源于應用過程。目前,對于各階段精度的測試,指標體系不完善,概念不一致,行業應用存在差異。在行業體系的上下游指標要求不標準、設置不規范不配套、關系不科學、標準體系不完善、參數不配套、量化細化差,導致精度測試數據可操作性差。
(2)可靠性
高精度慣性導航系統的可靠性包括穩定性、可靠性和壽命3個方面。在高精度慣性導航系統可靠性的測試中,由于測試數據有限,小子樣很難對系統的性能有效估計。同時,可靠性的經驗公式通常在少量干擾下能夠較準確地預估,而對于高精度慣性導航系統,結構和應用環境復雜,經驗數據無法準確估計系統可靠性。在實際測試過程中,可靠性的3個方面通常單獨考慮,而忽略了三者之間的物理聯系。
(3)儲存壽命
在儲存過程中,高精度慣性導航系統需要滿足功能的可靠性,同時還要求滿足精度指標的穩定性。這些性能需要在檢測和維修的數據中真實反應,但目前慣性導航測試系統中對于儲存壽命的判讀缺乏可信度。首先,儲存環境中各因素對高精度慣性導航系統組件性能的影響因子無法準確確定;其次,缺乏高精度慣性導航系統失效判據,不能判別系統功能的可靠性,更無法判斷系統精度的變化。
(4)退役
在高精度慣性導航系統退役檢測中包括退役、鑒定和評判3項指標,由于數據積累較少,3項指標的準確性和完備性不足。對于3項指標標準的完善和統一,仍然需要大量試驗和數據的積累。
慣性導航測試系統大數據管理分析系統的建立是為了提供并行計算平臺,并且高效地對慣性導航平臺產生的海量測試數據進行處理,進而對數據進行管理、融合、分析、挖掘,實現慣性導航測試數據分析處理的統一化、批量化、自動化、模板化、重用化。如圖2所示,該目標的實現是完善當前高精度慣性導航系統測試,提高其準確性和高效性不可或缺的步驟。
為了高效合理地管控平臺生產的海量測試數據,需要建立標準統一、體系完善的數據中心。多型號全過程產品數據中心是要將系列型號產品參數、系列品種產品參數生產過程中的原材料性能參數、物理成型幾何參數、元器件性能參數、儀表集成過程參數、測試試驗激勵參數、系統集成性能參數、環境適應性參數、儲存應用過程參數、功能精度失效參數等全方位多角度的產品參數通過測試采集下來,形成融合理論數據、設計數據、制造數據、測試數據、試驗數據、應用數據、失效數據等大量數據的全參數媒體數據庫;建立完善的指標體系和標準體系,解決試驗測試中精度標準不統一、可操作性差、可靠性分析預估不準確、儲存環境影響量化困難、壽命數據缺失等核心關鍵問題。實現數據采集存儲格式統一化、歷史數據縱向分析和橫向對比批量化、平臺數據處理算法重用化、單元測試與總裝測試數據判讀自動化、測試判讀報告模塊化,避免數據遺漏和缺失,顯著提高數據檢索效率,形成各類型號產品數據體系的完整 “檔案”,實現準確高效的取用數據。
如圖3所示,為了更好地挖掘數據價值,有效地積累和利用測試數據,需要依托數據管理分析系統。結合完備的性能參數、過程參數,跨越視覺、文字、語言等不同類型的媒體數據,利用智能動態優化技術,建立慣性導航測試系統大數據網絡媒體推理應用平臺,實現數據的深度挖掘,實現對現實物理精密結構實體知識、機理、功能、精度、壽命的統一表征,實現數據和物理機理的深入關聯和理解。
大數據網絡媒體推理應用平臺的建設需要實現測試數據的機器學習、自主學習、深度學習和強化學習,以智能動態優化(IDO)為支撐,利用遺傳算法、粒子群算法、果蠅優化算法等先進的數據挖掘和分析方法,實現數據價值的深入挖掘,從而解決高精度慣性導航系統中表征體系的統一、關聯映射的理解和推導、標準體系的優化與完善、誤差模型的準確識別和科學模型的預估等關鍵重大問題。
在大數據挖掘和機器學習的基礎上,大數據理論可以進一步推進產品設計改進和性能提升。一方面,依據對慣性導航系統機理、設計、生產、測試及應用過程中大數據的挖掘,可以全面分析系統性能。從產品和型號設計的角度,可以分析慣性導航系統設計精度指標分配是否合理,從而在生產過程中對精度的提升有的放矢;從產品和型號的生產角度,可以分析生產和設計的一致性是否充分發揮,機械和電氣系統是否滿足兼容性的要求,從而完善設計方案;從產品和型號的應用角度,可以分析系統機動性能、準備時長、使用精度等性能是否滿足實際需求。另一方面,相對于過去的樣本代替全體的統計方法,大數據將使用全局的數據,統計出來的結果更為準確。這樣,利用大數據平臺將慣性導航系統的設計、生產和應用環節緊密聯系,實現一體化。
基于這樣的高精度慣性導航系統大數據管理分析系統框架,一方面,從基本原理的角度可以構建現實物理精密結構實體跨媒體知識圖譜、模型、標準、理論,實現跨媒體現實物理精密結構實體的知識演化、推理、預警、預測、評價、評估、演繹、饋補、優化、簡化;另一方面,從實戰應用的角度可以實現現代自主智能控制理論驗證和實踐,從而推動慣性技術應用優化,適應現代多維立體交叉戰爭中多元裝備自主智能多信息融合協同精確打擊模式的需求。因此,高精度慣性導航系統測試技術中大數據管理分析平臺的建立是深入理解數據物理機理、優化系統設計、提高精度、提升產品可靠性及準確預估系統壽命等慣性導航關鍵技術的必經之路。
為了實現高效地慣性導航系統數據管理,分析和挖掘體系,需要高精度慣性導航系統全壽命周期測試大數據平臺。其中,應用的大數據關鍵技術包括大數據形成技術、大數據分析技術、大數據應用技術和大數據資源統籌共享技術這4個方面。
高精度慣性導航系統大數據的形成是大數據數據庫建立的源頭,是數據分析和挖掘的基礎[5-6],數據的形成需要保證數據的可靠性和完備性。可靠性從測試機理、測試方法、測試激勵和測試采集的過程中都要嚴格把關,保證每個環節數據真實有效地反映慣導系統的性能。完備性要記錄和保留高精度慣性導航系統從研制、生產、驗收和應用各環節的測試數據,形成完整的測試鏈條,建立產品和型號的完備檔案。
為實現針對高精度慣性導航系統海量測試數據的有效利用分析,采用以Hadoop為基礎的并行大數據計算分析平臺,進而實現高精度慣性導航系統測試數據的管理、分析、挖掘,完成平臺的可靠性預測與故障診斷等功能。
針對航天大數據的特點和處理需求,目前較多采用分布式文件系統來存儲航天數據。將數據存儲在物理上分散的多個節點上,對這些資源進行統一的管理和分配,并向用戶提供文件系統訪問接口,可以解決本地文件系統在大小、文件數量和打開文件數等方面受限的問題。
在高精度慣性導航系統測試數據存儲方面,為面對不斷增長的平臺測試數據量及分析需求,可采用HDFS分布式數據存儲代替傳統的以Orcale為代表的單點存儲模式。HDFS為流式數據訪問,可以一次寫入,多次讀取,數據通常由數據源生成或從數據源復制而來,非常適合當前高精度慣性導航系統產生的海量數據存儲與分析[7-9]。
在高精度慣性導航系統測試數據分析方面,Hive技術提供了一種類SQL語言(HiveQL),可以查詢存儲在HDFS中的數據。高精度慣性導航系統大數據分析可視為一種數據倉儲應用程序,而傳統的數據倉儲往往使用SQL作為查詢語言。Hive降低了在HDFS上進行慣性導航測試數據查詢的難度,更便于開發人員進行數據庫設計和業務分析[10-12]。
在高精度慣性導航系統大數據分析結果展示以及用戶交互方面,基于JEE+Structs2的Web前端技術可以用來與Hive以及HDFS進行無縫連接。利用當前廣泛使用的JDBC數據操作技術,測試人員可以方便地上傳慣性導航平臺測試數據到分布式系統,并進行存儲分析,分析結果也可以通過Web頁面方便快速地瀏覽。
高精度慣性導航系統大數據測試分析過程中,針對系統數據所涉及的挖掘算法是測試過程的核心[13-18],算法模型的普適性、擴展性、容錯性是設計過程中必須考慮的要素。高精度慣性導航系統測試數據挖掘目標是從海量的測試數據中通過算法搜索出數據中的隱藏信息,再將這些信息用于指導高精度慣性導航系統的生產測試過程,這一過程可以被視為高精度慣性導航系統中的自動化故障診斷。高精度慣性導航系統測試數據的分析挖掘較適合使用基于統計的故障診斷方法,該方法以統計學和人工智能為技術基礎,不需要提供除數據以外的任何先驗知識,采用從數據中提取的客觀規則對問題的不確定性進行描述,將大量數據融合成有序的層次化故障診斷知識。
故障診斷與健康預測是一個復雜的過程,牽涉到大量的試驗數據與復雜的計算模型。故障診斷算法通常與設計、制造、裝配以及維護保障等工作緊密結合,核心是對特定模型進行描述、歸納形成故障模式集。該集合可具備多種形態,如先驗知識集、邏輯規則集、設備功能模型集等,分別從專家經驗、設備運行過程以及設備數學模型等角度挖掘故障模式。
航天數據安全是一個復雜而重要的問題,軍用航天中的關鍵數據通常采用加解密方式傳輸[19-20]。而大數據系統通常是分布式的網絡系統,雖然具有數據高效共享的優點,但在數據安全方面卻存在一定隱患。大數據的特點必然會給加解密方式帶來新的挑戰,但也有一些相應的可行方案,如利用大數據的數據價值密度低的特點,在續傳輸的相同幀圖像中插入少量的密文,從而大幅提高數據的安全性。
結合數據存儲、數據分析、數據展示、挖掘算法和數據安全這5個方面,可以初步構架大數據平臺框架,如圖4所示。
在初步設計框架基礎上,應在后續工作中逐步完善慣性導航測試系統數據分析挖掘功能,完成高精度慣性導航系統數據分析的遠期規劃,最終將高精度慣性導航系統大數據分析平臺應用在生產實踐中,實現高精度慣性導航系統測試的自動化故障診斷,幫助測試人員快速提高測試效率和準確度。
大數據分析系統的整體框架包括多源數據采集層、數據平臺支撐層和數據平臺應用層3大數據模塊[21-22],如圖5所示。在多源數據采集層中,測試設備將各類測試數據采集匯入網絡數據交換設備,通過數據預處理傳遞給數據平臺支撐層。平臺支撐層將數據存儲進入數據庫,并完成數據備份與修復。最后,當數據平臺應用層發送數據請求,數據平臺支撐層通過數據流準確快速地將數據傳遞給平臺應用層。數據平臺應用層一方面通過數據統計和分析生成形式多樣、可讀性好的判讀報告,另一方面通過數據挖掘、機器學習、人工智能等手段分析系統性能,為產品質量的提升、高精度慣性導航系統精度的提高打下基礎。
在高精度慣性導航系統應用及儲存過程中,通過完整的大數據處理平臺可以實現長期的監測慣性導航系統的健康檢測和故障診斷。對于平臺使用數據的異常能夠由頂層到底層精確溯源,異常部位準確判斷,快速精準解決問題,從而實現故障監測的及時性、早期故障檢測的靈敏性、故障定位和評價的準確性及故障診斷的魯棒性[23]。
大數據資源統籌共享技術要求在保證數據安全的基礎上,數據形成過程中的參與者打破壁壘,建立數據云,形成共享。數據共享平臺通常采用分布式系統構架,由一個數據總中心和若干分中心組成,從而實現數據整合、數據交換和數據共享,形成資源統籌共享服務網絡[24-25]。數據的采集、集成和整合由車間、研究所、控制系統、總裝測試和靶場測試等底層元數據單元完成,并上傳至分中心。各階段用戶通過數據總中心索引分中心數據,形成數據多點互通。
對于底層元數據單元,數據的加工處理規范化,形成包含數據標識信息、內容信息、時間和空間覆蓋信息、人員和權責信息、關聯信息、技術信息等各個方面信息的結構化數據,便于用戶檢索查找[26]。
本文依據高精度慣性導航測試系統數據采集和數據管理中存在的大量嚴峻問題,分析了大數據在慣性導航測試系統中的使用需求。結合數據分析中數據采集、數據存儲、數據分析、數據展示、挖掘算法、數據安全的關鍵技術,構建了慣性導航測試系統以多源數據采集層、數據平臺支撐層和數據平臺應用層為3大模塊的大數據分析平臺基本框架。利用大數據資源統籌共享技術進行數據挖掘和決策分析,從而優化產品應用。大數據平臺為高精度慣性導航系統優化設計、提升精度、保障產品可靠性、合理預估系統壽命及適應未來戰爭提供了重要支撐,當以重視。
[1]張炎華,王立端,戰興群,等.慣性導航技術的新進展及發展趨勢[J]. 中國造船, 2008, 49(s1): 134-144.ZHANG Yan-hua, WANG Li-duan, ZHAN Xing-qun, et al.The new advancement and trend of inertial navigation technology [J].Shipbuilding of China, 2008, 49(s1):134-144.
[2] 周世勤.新型慣性技術的發展[J].飛航導彈,2001(6): 70-77.ZHOU Shi-qin.The development of new types of inertial technology [J].Aerodynamic Missile Journal, 2001(6):70-77.
[3]謝世富.導航技術與系統發展述評[J].電子質量,1995(1): 9-16.XIE Shi-fu.The development overview of inertial technol-ogy and system [J].Electronics Quality, 1995(1): 9-16.
[4]薛連莉,陳少春,陳效真.2016年國外慣性技術發展與回顧[J]. 導航與控制, 2017, 16(3): 105-112+84.XUE Lian-li, CHEN Shao-chun, CHEN Xiao-zhen.Development and review of foreign inertial technology in 2016[J].Navigation and Control, 2017, 16(3): 105-112+84.
[5]李水平,陳意云,黃劉生.數據采掘技術回顧[J].小型微型計算機系統, 1998, 19(4): 74-81.LI Shui-ping, CHEN Yi-yun, HUANG Liu-sheng.A technology overview of data mining [J].Journal of Chinese Computer Systems, 1998, 19(4): 74-81.
[6]韓京宇,徐立臻,董逸生.數據質量研究綜述[J].計算機科學, 2008, 35(2): 1-5+12.HAN Jing-yu, XU Li-zhen, DONG Yi-sheng. An overview of data quality research [J].Computer Science,2008, 35(2): 1-5+12.
[7]唐箭.云存儲系統的分析與應用研究[J].電腦知識與技術, 2009, 5(20): 5337-5338+5340.TANG Jian.Research and application of the cloud computation storage system [J].Computer Knowledge and Technology, 2009, 5(20): 5337-5338+5340.
[8]陳全,鄧倩妮.云計算及其關鍵技術[J].計算機應用, 2009, 29(9): 2562-2567.CHEN Quan,DENG Qian-ni.Cloud computing and its key techniques [J].Journal of Computer Applications,2009, 29(9): 2562-2567.
[9]羅春榮.國外網絡數據庫:當前特點與發展趨勢[J].中國圖書館學報, 2003, 29(3): 44-47.LUO Chun-rong.Online databases in foreign countries:present characteristics and development trends[J].Journal of Library Science in China, 2003, 29(3): 44-47.
[10]高翔,王勇.數據融合技術綜述[J].計算機測量與控制, 2002, 10(11): 706-709.GAO Xiang,WANG Yong.Survey of multisensor information fusion [J].Computer Measurement & Control,2002, 10(11): 706-709.
[11]林士敏,田鳳占,陸玉昌.用于數據采掘的貝葉斯分類器研究[J]. 計算機科學, 2000, 27 (10):73-76.LIN Shi-min, TIAN Feng-zhan, LU Yu-chang.Studies on Bayesian classifier in data mining [J].Computer Science, 2000, 27(10): 73-76.
[12]胡金星,吳煥萍,潘懋,等.基于格網劃分的海量DEM數據生成[J].計算機輔助設計與圖形學學報,2004, 16(1): 41-44.HU Jin-xing, WU Huan-ping, PAN Mao, et al.Massive DEM creation with grid partitioning approach [J].Journal of Computer Aided Design & Computer Graphics,2004, 16(1): 41-44.
[13]黃解軍,潘和平,萬幼川.數據挖掘技術的應用研究[J]. 計算機工程與應用, 2003, 39(2): 45-48.HUANG Jie-jun, PAN He-ping, WAN You-chuan.Application research on the technology of data mining [J].Computer Engineering and Applications, 2003, 39(2):45-48.
[14]汪明.數據挖掘綜述[J].河北軟件職業技術學院學報, 2001, 14(1): 48-55.WANG Ming.Survey of data mining [J].Journal of Hebei Software Institute, 2001, 14(1): 48-55.
[15]談恒貴,王文杰,李游華.數據挖掘分類算法綜述[J]. 微型機與應用, 2005, 24(2): 4-6+9.TAN Heng-gui, WANG Wen-jie, LI You-hua.An overview of data mining sorting algorithms[J].Microcomputer & Its Applications, 2005, 24(2): 4-6+9.
[16]呂安民,林宗堅,李成名.數據挖掘和知識發現的技術方法[J]. 測繪科學, 2000, 25(4): 36-39.LV An-min, LIN Zong-jian, LI Cheng-ming.Technique methods of data mining and KDD [J].Developments in Surveying and Mapping, 2000, 25(4): 36-39.
[17]張雪英.國外先進數據挖掘工具的比較分析[J].計算機工程, 2003, 29(16): 1-3.ZHANG Xue-ying.Analysis and comparison of overseas leading data mining tools [J].Computer Engineering,2003, 29(16): 1-3.
[18]馬江洪,張文修,徐宗本.數據挖掘與數據庫知識發現: 統計學的觀點[J]. 工程數學學報, 2002, 19(1):1-13.MA Jiang-hong, ZHANG Wen-xiu, XU Zong-ben.Data mining and knowledge discovery in database:a statistical viewpoint[J].Chinese Journal of Engineering Mathematics, 2002, 19(1): 1-13.
[19]周水庚,李豐,陶宇飛,等.面向數據庫應用的隱私保護 研 究 綜 述 [J]. 計 算 機 學 報, 2009, 32(5):847-861.ZHOU Shui-geng, LI Feng, TAO Yu-fei, et al.Privacy preservation in database applications: a survey [J].Chinese Journal of Computers, 2009, 32(5): 847-861.
[20]張云勇,陳清金,潘松柏,等.云計算安全關鍵技術分析[J]. 電信科學, 2010, 26(9): 64-69.ZHANG Yun-yong, CHEN Qing-jin, PAN Song-bai, et al.Key security technologies on cloud computing [J].Telecommunications Science, 2010, 26(9): 64-69.
[21]李敏強,紀仕光,陳富贊,等.數據倉庫系統的結構與設計研究[J]. 決策與決策支持系統, 1997, 7(2):23-31.LI Min-qiang, JI Shi-guang, CHEN Fu-zan, et al.Date warehouse architecture and system design [J].Journal of Decision and Decision Support Systems, 1997, 7(2): 23-31.
[22]錢曉江.物流信息系統體系結構[J].東南大學學報(自然科學版), 2001, 31(6): 40-44.QIAN Xiao-jiang.Architecture design of logistics information system [J].Journal of Southeast University (Natural Science Edition), 2001, 31(6): 40-44.
[23]王宏鼎,童云海,譚少華,等.異常點挖掘研究進展[J]. 智能系統學報, 2006, 1(1): 67-73.WANG Hong-ding, TONG Yun-hai, TAN Shao-hua, et al.Research progress on outlier mining [J].CAAI Transactions on Intelligent Systems, 2006, 1(1): 67-73.
[24]王常力.分布式控制系統的現狀與發展[J].電氣時代, 2004(1): 82-86.WANG Chang-li.The status and development of distributed computer control dystems [J].Electric Age, 2004(1): 82-86.
[25]蔣良孝,蔡之華.分布式數據挖掘研究[J].計算機與現代化, 2002(9): 4-7.JIANG Liang-xiao,CAI Zhi-hua.The research of the distributed data mining [J].Computer and Modernization,2002(9): 4-7.
[26]連立貴,金鳳,蔡家楣.數據倉庫中的數據提取[J].計算機工程, 2001, 27(9): 61-62+99.LIAN Li-gui, JIN Feng, CAI Jia-mei.Data extraction in data warehouse [J].Computer Engineering, 2001, 27(9): 61-62+99.