王風云++鄭紀業++封文杰++趙佳++李喬宇++阮懷軍
摘要:根據山東省農村農業信息化示范省建設過程中信息資源整合的要求,對信息資源的分析、評價、篩選、類聚、標引、著錄、排序、建庫和存儲等過程進行了分析,研究了農村農業信息資源整合的關鍵技術,以期為其他省份的農村農業信息資源整合提供借鑒。
關鍵詞:山東省;農村;農業;信息化;資源整合
中圖分類號:S126 (252)
文獻標識號:A 文章編號:1001-4942(2015)12-0107-04
2009年,中華人民共和國科學技術部、中華人民共和國工業和信息化部、中共中央組織部聯合啟動了國家農村農業信息化示范省建設工作;通過代表性、工作基礎、工作機制等方面的認真研究、論證,2010年,決定把山東省作為第一個國家農村農業信息化示范省,進行全國農村農業信息化的試點。
基于資源整合、統一接人、分地運營和專業服務構建省級農村農業綜合信息服務平臺是山東省作為國家農村農業信息化示范省建設的重要工作。按照“平臺上移,服務下延”的原則,集成農村科技、遠程教育、農業、市場等各類信息資源,打造省級農村農業綜合信息服務平臺(含各專業信息服務系統,即“1+N”平臺),支持短信、語音、視頻等多通道同時接人,能夠實現對基層農戶、企業和相關農業合作組織的“扁平化服務”。
1 農業信息資源整合定義
農業信息資源整合,就是依據不同層次農業信息用戶的需求,將原本離散的、多元的、異構的、分布的信息資源,通過分析、評價、篩選、類聚、標引、著錄、排序、建庫、存儲、鏈接等一系列邏輯和物理的優化整合,最終形成一個有序的、效能更高的信息資源體系,從而體現出農業領域知識的整體聯系,并利用一個統一的共享平臺,滿足用戶多元化的信息需求,實現一站式服務。
在山東省作為國家農村農業信息化示范省建設過程中,建立了山東省農村農業信息化綜合服務平臺,該平臺既整合了農業自然資源信息,如作物生長的氣候、土壤、水分、長勢及病蟲害信息等;也整合了農業經濟技術資源信息,如農產品市場、技術、政策法規、管理信息等。農業自然資源信息為精準農業發展提供了可能性,農業經濟技術資源信息為實現農業精準化提供了必要保障。通過信息資源整合,有效地解決了當前農業信息資源建設各自為政、分散管理所造成的低水平重復建設和農業知識的割裂現象,使分散在各農業科研院所、高等院校、政府管理部門的信息資源得到有效整合,實現了農業信息資源跨部門應用,特別是為廣大農村所共享。
2 農業信息資源整合過程
2.1 農業信息資源分析
根據農村、農業和農民生產生活的需要,對大量涉農信息進行深層次的加工和分析研究,形成有助于問題解決的新信息,這是資源整合的第一步。對于農業科研人員來說,及時全面地獲取農業信息資源,有助于提高自己的科研水平;農業生產者及時地獲取農業政策法規、農產品生產和市場價格等信息,有利于減少農業市場上的農產品信息不對稱問題,在一定程度上減少農業生產者的損失;對于農業管理者來說,全面地了解與農業相關的信息,能更好地指導我國的農業生產。
在山東省農村農業信息資源數據分析中,主要針對農民對農業生產的需求,分析了大田和設施栽培、水產養殖過程中的自然資源信息,包括農作物的生長環境、病蟲害、長勢等信息。針對農民對市場供求、法規政策、農業技術等信息需求,分析了農業實用技術、政策法規、生產資料、批發市場、農牧專家、農民經紀人、龍頭企業、名優特產、農牧災害、示范園區等信息,建立了農業數據資源中心。
2.2 農業信息資源評價
隨著計算機技術、網絡技術和通信技術的迅猛發展,網絡信息資源爆發式劇增,增加了用戶獲取所需信息的難度,而且信息的可靠性與真實性也影響了用戶對信息資源的利用,因此對農業信息資源進行評價至關重要。主要有定量評價、定性評價和綜合評價三種方法。
訪問量統計、鏈接關系分析、網絡計量學等是信息資源整合中常用的定量評價方法,通過數據分析,可以從客觀量化的角度對網站信息資源進行優選和評價。定性評價則是從主觀角度,按照一定的評價標準,建立相關的評價指標體系,從而對網絡信息資源進行優選和評估。
在山東省農村農業信息化綜合服務平臺建設過程中,從定量和定性兩個方面對網絡信息資源進行綜合評價,即:通過定量分析盡可能多地獲取某一網絡信息資源的相關信息,分析統一資源定位器、該網絡信息資源被鏈接率以及與其它類似或相同領域的信息對比等,然后定性地從覆蓋面、準確性、時效性等方面分析該網絡信息資源的內容以及資源的可獲得性、頁面設計和布局等。
2.3 農業信息資源篩選
根據信息資源評價確定的標準,采用查重法、時序法和類比法等對農業信息資源進行篩選。查重法是篩選信息資源最簡便的方法,可以剔除重復資料,選出有用的信息資源。時序法即逐一分析按時間順序排列的信息資源,在同一時期內,選取較新的,舍棄較舊的,使信息資源在時效上更有價值。類比法是將信息資源按空間、地區、產品層次分類對比,接近實質的保留,否則舍棄,這種方法需要信息資源收集人員有比較扎實的專業知識,熟悉自己的業務范圍,從而根據信息資源的題錄進行取舍。
2.4 農業信息資源類聚
農業信息資源類聚就是將信息資源劃分成群組的過程,即把信息資源對象分成多個類或簇,同一簇中的對象之間具有較高的相似度,而不同簇中的對象差別較大。通過確定數據之間在預先制定的屬性上的相似性來完成類聚任務,這樣最相似的數據就聚集成簇。
2.5 農業信息資源標引
農業信息資源標引是指在分析信息資源內容的基礎上,用某種檢索語言把資源主題以及其它有意義的特征標識出來,作為資源存儲和檢索依據的一種資源處理過程。首先進行主題分析,確定主題的類型和結構;然后在主題分析的基礎上,進行概念轉換,將確定的主題概念賦予檢索標識的過程,形成檢索標識。不同的農業信息資源數據庫可能會使用不同的分類法和主題詞表來標引資源,《農業科學敘詞表》由于能夠提供豐富的農業專業術語以及術語間的關系,成為農業信息資源整合過程中標引和檢索農業信息資源的工具。endprint
2.6 農業信息資源著錄
農業信息資源著錄是指在編制資源目錄時,對資源內容和形式特征進行分析、選擇和記錄的過程。一般是按照某種標準化的格式和要求,對資源的某些被規定的特征進行描述(如來源、作者、題名、日期等),給出信息資源的縮影。為了更好地實現信息資源的共享,著錄時編目人員要遵循統一的格式,使用受控的語言,逐條填寫各個款目的內容。
山東省農村農業信息資源數據中心按15個大目錄122個子目錄進行著錄,包括實用技術(14個子目錄)、政策法規(13個子目錄)、質量標準(6個子目錄)、生產資料(13個子目錄)、批發市場(6個子目錄)、農牧專家(11個子目錄)、農民經紀人(11個子目錄)、龍頭企業(11個子目錄)、名優特產(6個子目錄)、科技項目(5個子目錄)、種質資源(7個子目錄)、示范園區(6個子目錄)、科技成果(3個子目錄)、農牧災害(5個子目錄)和協會組織(5個子目錄)。
2.7 農業信息資源排序
農業信息資源排序就是采用排序算法把一系列的信息資源記錄,按照其中某個或某些關鍵字的大小,遞增或遞減排列起來的操作。排序算法是該過程中使用的主要方法,在處理大量數據時,應用該算法可以節省大量的資源。排序算法一般分為內部排序和外部排序,內部排序是指待排序列完全存放在內存中進行的排序過程,適合記錄較少的序列;而如果待排序列記錄數量非常多,排序過程不能在內存中一次性完成,則必需對外存儲器進行訪問,這種排序被稱為外部排序。
常見的內部排序算法有插入排序、冒泡排序、選擇排序、快速排序、堆排序、歸并排序、基數排序和希爾排序等。在應用中,可根據不同情況、不同要求選擇較適合的方法,甚至可將多種方法結合使用。當待排序的記錄數不大時,可選用插入排序、選擇排序和冒泡排序,方法簡單,容易實現;當記錄數很大,但不強求排序穩定性,且內存容量不寬余時,應選用速度非??斓目焖倥判蚧蚨雅判?;當記錄數很大,且對排序穩定性有要求,內存容量也寬余時,用歸并排序最為合適,這也是山東省農村農業信息資源整合中選用的排序方法。
在對大型文件排序時,由于文件很大,不可能將整個文件的所有記錄都同時調入內存中進行排序,這就需要利用外部排序技術來實現。外部排序最常用的是多路歸并法,主要有兩個步驟:第一步,按內存大小,將外存上的文件分成若干個長度相同的子文件或段,依次讀入內存,并利用有效的內部排序法進行排序,將結果重新寫入外存;第二步,將這些有序的子文件或段由小到大在外存上形成一個排序文件。
2.8 農業信息資源建庫和存儲
農業信息資源整合中的建庫,需要充分調研現有資源,并考慮將來數據庫的擴展性。針對農業信息資源整合中數據量大的問題,主要采用分布式索引建庫方案,對數據進行分布式存儲和計算。分布式索引建庫采用統一服務接口,給用戶提供一個可配置的建庫申請文件,自定義自己的程序信息,保證不同用戶可以并行啟動分布式建庫任務,完成最終的索引并傳輸至指定的機器。
3 農業信息資源整合關鍵技術
農業信息資源整合技術的完善和進步在很大程度上決定著信息資源整合的步調,因此,需要盡力挖掘新技術服務于信息資源整合和利用,保證用戶可以方便、準確、及時地獲取所需信息。農業信息資源整合所需的硬件關鍵技術有服務器虛擬化技術和負載均衡技術,軟件關鍵技術有XML、Web和Web Service等技術。
3.1 硬件關鍵技術
在農業信息資源整合過程中,經常會遇到由于服務器配置高,僅用于部署單一資源應用,無法充分發揮其優越性能,造成服務器硬件資源閑置和浪費的問題。服務器虛擬化技術可以提高服務器利用率,加快應用部署速度,通過提供高可靠性、高可用的資源,為用戶提供穩定、高效地訪問服務,同時還節省了投資和維護成本等。
負載平衡技術可基于現有網絡結構,擴展原有網絡設備和服務器的帶寬,增加網絡吞吐量,加強數據處理,提高網絡的靈活性和可用性。在信息資源整合過程中,負載平衡技術實現了連接的分配與調試,當用戶通過資源訪問地址請求時,根據各目標服務器的性能和網絡運行狀況,選擇性能最佳的服務器響應用戶的請求,并將所有流量均衡地分配到各個服務器,有效地避免了不均衡現象的發生。應用負載平衡技術,農村農業信息化綜合服務平臺明顯地獲得了高性能、高安全性和可擴展性。
3.2 軟件關鍵技術
XML(Extensible Markup Language)是一種用于描述數據的標記語言,主要使用文檔類型定義(DTD)或者模式(Schema)來描述數據,與描述Web頁面的HTML有相似的格式。它可以利用Web瀏覽器進行數據確認,還具備易于生成數據的優點,因此,利用它可以很方便地在部門間和部門內部進行數據交換和利用。XML獨立于平臺,有利于跨平臺的信息交流,完全可以充當網際語言,不僅可以降低應用程序的負擔,也使智能工具的開發更為便捷。
Web是一種超文本信息系統,可以使文本從一個位置跳到另一個位置,有利于用戶從中獲取更多信息;還可以轉到別的主題上,如:想了解某個主題的內容,只要在這個主題上點一下,就可以跳轉到包含這一主題的文檔上。另外,Web具有的圖形化、易于導航、與平臺無關、分布式、動態和交互式的特性,讓信息資源整合的共享機制建設、適時更新和與用戶互動機制建設等問題都能得到很好的解決。Web中的圖形化顯示功能,可將圖形、音頻、視頻信息集于一體,從而使整合后的農業信息資源以非常形象、易懂的形式呈現在農戶面前。
Web Service獨立于平臺和軟件供應商的標準,是創建可互操作的、分布式應用程序的新平臺,且具有跨平臺的可互操作性能,能夠將運行在不同平臺上的各程序進行集成,為用戶提供一個統一的界而,甚至允許重用代碼,從而重用代碼背后的數據。另外,Web Service還可通過Web進行互操作或遠程調用。
4 結論
農村農業信息資源整合是個系統性的工程,包括支撐平臺的軟硬件系統、數據資源、應用系統等。本文介紹了數據整合的分析、評價、篩選、類聚、標引、著錄、排序、建庫、存儲等過程,以及實現數據整合的軟硬件關鍵技術,以期為其它省份的農村農業信息資源整合提供技術借鑒。endprint