廖飛
(重慶市信息通信咨詢設計院有限公司,重慶 400041)
在科學和技術水平高度發達的今天,各行企業都已經逐漸地進入到一個電子和信息化的辦公時期。對于一些政府機構而言,電子信息技術把傳統意義上的事務性辦公方式轉變為一種更加符合新時期潮流的有效性辦公方式。既方便了人民和廣大群眾,又有利于優化組織結構,同時也調動了政務機關的積極性。政府承載著領導和管理整個社會的重要責任,它處置的問題及其解決問題的能力與否直接關系到每個公民的切身利益。尤其是在移動互聯網的今天,大多數部門的資料都是通過網絡進行傳播與存儲。所以我們想要做到更好的處理這些信息,就一定需要進行政府機構的電子辦公化。然后在此基礎上,大力發展與其相關的技術,從而進一步實現經濟社會全局的信息化。本文主要是通過探究如何在電子政務中應用的數據分析挖掘等技術,尋找更加便捷的途徑,為構建和諧信息社會奠定良好的基礎。
數據挖掘技術也可以稱為數據采集或者是數據開發,它主要指的就是一種泛指從各種類型的大型數據庫中收集得到的信息和數據,并且提供給了人們所需要和感興趣的信息,而這些信息和知識都實際上是一種隱藏著事前不為人知和潛在有用資料。原始數據大多是一種結構性的,比如文字、圖形和影像等數據,甚至還包括了各種不同的分布式網絡中的異構化數據。發現其知識的途徑和方法既可以是數學的,也或者是其他的;它既可能被演繹出來,也可能被歸納出來。發現出來的所掌握的知識既可以應用于資料管理、查詢和優化、決策支撐過程控制等,又可以應用于資料自身。因此,它匯聚了不同行業和領域的研究,特別是在數據庫、人工智能、數理統計等各個方面的學者和專家的研究資料。數據挖掘法就是可以從一些實例的數據中直接引入導出法則,用來建立一個知識庫;也就是可在數據庫中針對已經存在的規則性信息進行驗證,因此對于知識庫的維護和更新是有必要的。
大量研發數據需求依靠的是人工智能。它也可以說是充分運用了目前在現代人工智能中一些已經成熟的算法和科學技術,例如:人工神經網絡、決策樹、相鄰搜索方法、規律推理、模糊邏輯等。它與現代人工智能相比,具有很小的復雜性。在數據挖掘系統中所需要利用到的技術量就越大,所得到的結果精確程度也就越高。數據挖掘系統中所利用的技術量越大,所獲得的結果準確度也越高。這主要是由于一個問題的類型以及其中大量數據的各種類型和規模不同,而導致的無論是采用何種技術手段來實現所需要的任務,從其功能上都可以把對數據進行挖掘的分析,大致方法劃分為以下3 種:
基于關聯性的分析:關聯分析的主要目標之一就是通過對隱含數據之間的挖掘和分析來分析這些信息中的相互關系。分類記錄分析:采用分類記錄分析法的數據輸入集就是一組數據記錄的集合和幾個標記,首先給每一個數據記錄賦予一個標記,然后按照所標記的數據進行分類和記錄,最后通過檢查此標記的數據描述來找出這次記錄的特點。聚類分析:聚類分析:聚類分析法的主要特點是輸入集通常都是一組不被標記的數據和信息,即這時對于該數據和信息所做出的記錄尚沒有被用來做出任何的分類。它的目的主要在于根據某種特殊的規律,合理地劃分每一個記錄的數量和集合,并以一種顯式或者隱性的形式將其排列到不同的類別中,而所需要依賴和遵循的這些方法與規律都是由通過集成聚類分析工具來決定的[1]。
電子政務系統是近年來隨著互聯網和電子信息技術的廣泛傳播而逐漸興起的一個新名詞,其基本含義主要是指各級政府部門充分運用先進的網絡信息技術對各個部門重新地進行了規劃和歸集分類,利用先進的電子通信將它們相互地連接,并將它們共同地納入一個網絡的管理之內,利用先進的計算機和電子通信將它們相互連接,并將它們共同地納入一個互聯網的經營管理之內,通過先進的互聯網技術有效地對企業進行流暢、透明地經營和管理,實現對各級地方政府部門資源優化與資產重組。電子政務能夠很好地緩解因為時間、空間所給我們帶來的障礙,實現了各個單位之間毫不隔閡的聯系,共同為社會、人民群眾一個最好質量的服務。此時采取傳統處理方法已經遠遠無法很好地解決問題,需要運用一些新的處理技術。數據挖掘,正是一種符合這一要求的技術,它不但可以準確處理海量的信息,還可以將有效的信息從中獲取出來,使大量的信息資源和數據都得到了維護,從而大大提高了政府的辦公工作效率。因此,在電子政務中對于數據挖掘等新技術的研究和運用,是非常值得各級政府部門深入學習和大力推動的。
電子政務大數據挖掘主要目的就是把有用的大數據進行挖掘直接地折射給各級政府部門,使得各級政府部門的內部資料和外部信息與外部資料之間能夠進行有效的整合和分析,這樣政府部門才能夠更好、較有效地將自己的資料發布出去,向最想要得到他們的社會公眾公布。另外,由于各級政府部門自動化的實施產生了大量的統計資料,對這些統計資料進行了收集分析,可以及時地獲得一些直接影響到政府部門管理工作的重要性和關鍵因素,從而有效地為各級政府部門管理人員的決策工作提供了依據,幫助各級政府部門提升政府信息化的能力和水平,促進整個經濟社會發展。數據挖掘技術在電子政務領域的應用有很多特點,這些技術主要表現在以下幾個層次[2]。
電子政務體系的構建所帶來的直接經濟效益,就是它徹底地打破了各級人民政府之間的文件傳輸信息的繁雜化,用最快捷的手段和電子服務方式向各級人民政府上下級之間傳輸信息,這不但大大降低了人民政府的辦公生活用品和其他相關費用的開銷,而且在無形中也為人民政府減少了巨大的額外開銷。通過對數據的挖掘能夠掌握各個單位的費用和開支情況,并為客戶提出可行的降低成本和有效控制的解決方案。
電子政務大數據挖掘技術可以將各級政務機構在系統的大數據中所收集到的海量信息綜合地進行開采、挖掘和綜合分析,從中準確地識別、抽取它們所蘊含的信息,并充分利用這些信息能夠為各級政府部門和機關重大的決策、法規制定工作提供有效的決策依據。例如,通過對各地方政府、社會公共網站的數據資料進行搜索和收集,然后采用數據挖掘的方法對其他網站進行挖掘,從中獲取出對于提高各類政府工作效率有益的基礎知識,從而給各類政府機構及相關工作人員提供一種科學、實用的幫助以及決策支撐。
政府部門需要做到充分發揮自身的職能,對各單位進行有效的監控與管理,同時也是為了提高民眾和政府之間交流與溝通的準確度,及時掌握有效信息,就必須建立一個能夠有效地對收集、監督和分析獲取的大量資料進行整合的系統[3]。
為了能夠更好地分析和發現在我國的政務系統中網站和瀏覽器對于用戶的各種訪問模式和其行為方向,就需要我們可以通過使用大量的數據挖掘技術,來針對網站和瀏覽器上的服務器和網站日志中所記錄的大量信息和數據進行分析挖掘處理,從中收集得到的信息并有針對性地加以分析。例如,通過對于使用者在某頁面停留的時間,就能夠準確地判斷得出使用者對于這些信息資源有什么特殊的興趣,從而開始進行一種個性化的服務。
為了有效地組織和整合收集政府網站中的信息,我們可以考慮通過對政府網站中的文字資源進行挖掘,主要就是通過對政府網站中的各種文字資源內容。例如,我們就能夠使用聚類技術自動將一個網站中所有的文本內容都由其他信息進行了一個自動的分類和劃定相應的類型,從而使我們能夠很好地實現對一個網站中所有信息的多維度、層次化的組織和方式,便于我們對這些文本內容的搜索進行分類、瀏覽和檢索;同時,還使我們可以充分地結合對于一些網絡上用戶所需要訪問的日志記錄資料信息等數據進行挖掘,把握好了用戶的需求,從而積極地開展一些個性化的信息服務和具有針對性的電子政務等活動,進而吸引人們到更多的注意力。
創新涉及政府制訂發展戰略的實施和公眾政策方面的創新。電子政務大數據的挖掘,增強了我國政府部門應對各種突發事件的迅猛反應能力,提高了我國政府部門工作的自主創新能力和專業技術人才素質。例如,在災害預警系統中運用了數據挖掘的關聯分析和回歸預測等技術,對于歷史資料的分析進行分析,可以準確地預測到與災害有關的影響因素、災害所處地區發生的變化趨勢,并為其制定緊急救援措施[4]。
對過去從事行政管理工作中獲取的數據資源進行分析挖掘可以獲取到許多未知的行政管理經歷和知識,這就是電子政務大數據挖掘的強大魅力。但是,目前關于數據挖掘技術的基礎研究并不是很成熟,距離實踐中的應用仍然存在一些差距,主要體現在以下幾個方面:
第一,知識的表達和解釋機制,對于挖掘得到的知識如何以一種用戶可能接受和理解的方式將其表達得出來,這就要求我們對于知識的表述不能僅僅停留在數字或者符號上,而是應該以一種比較容易被人理解的手段。第二,挖掘的對象規模大而復雜,政府數據采集和管理的變革使得數據開發面臨著更多的數據庫、更多的維度以及各種屬性之間的繁瑣關系,所處理的數據量變得更加龐大了,從而直接導致了組合式的爆炸[5]。目前,主要是通過綜合地利用先進的并行技術或者抽取等方式處理各種大規模數據,以此為基礎來達到較高的挖掘效率。第三,證實技術的局限,主要表現在兩個重要的方面:一個就是對所研究出來的知識進行證實;二是對所有參與挖掘的來源數據進行抽取挖掘,選擇算法本身等是否正確地進行證實。
實施電子政務系統是現代信息科學技術進步的必然產物。在當前全球經濟一體化的背景下,應當進一步加強對于網絡安全的立法以及網絡的監管,積極推動互聯網網絡資源的構建。充分發揮政府的獨特資源優勢,促進管理的革命性創新和科學技術的創新,使得政府能夠運用電子政務更好地為人民服務。