曹先明,王 承,姜明鑫
1.中國聯合網絡通信有限公司濟寧市分公司校園服務中心,山東濟寧 272100
2.濟寧市高級職業學校,山東濟寧 272000
3.中國聯合網絡通信有限公司濟寧市分公司,山東濟寧 272000
數據挖掘的要領是從大量的、不完全的、有噪聲的、不清晰的、隨機化的現實使用數據中,提取隱藏在其中的、人們事前不能預知的、但已經潛在的和可以使用的模式過程。互聯網技術在現代信息社會的大環境下,得到了長足的應用和發展。利用互聯網技術使得現代網絡教育可以充分利用長期以來傳統面授教育積累下來的大量優秀教育資源。網絡中包含了豐富的動態超鏈接信息,以及頁面的訪問和使用信息。隨著WWW的發展,Web數據挖掘在數據挖掘領域中的作用越來越重要。通過挖掘Web使用記錄發現潛在的、有價值的信息,如用戶訪問了哪些頁面,點擊了哪些鏈接、哪些頁面的點擊頻率最高等等,通過對Web日志進行挖掘,可以跟蹤發現用戶的訪問習慣,以此來改進網頁的設計結構,以實現智能化、個性化的用戶界面。目前,數據挖掘的研究重點逐漸從發現方法的研究轉向實際的系統應用,國際上有影響的典型數據挖掘系統有SAS公司的Enterprise Miner,IBM公司的Intelligent Miner,SGI公司的Set Miner等。
數據挖掘利用了如下一些領域的思想內容:1)建模識別、機器語言學習、人工智能的探索算法、理論學習和建模技術;2)利用統計學中的估算、假設檢查和抽樣。數據挖掘容納了一些思想信息在其他領域中,這類領域中包含最先進的可視化信息檢索、進化計算論、電子信號處理、信息技術理論。
隨著數據倉庫技術的迅速發展以及數據庫管理系統的廣泛應用,人們在積累了大量的數據信息后,急切地感覺到需要一種新的技術工具從大量數據信息中智能的、自動的抽取出有價值的符合用戶需要的知識或信息,數據庫知識的發現應運而生。數據挖掘就是對于在一些實際或察看信息的集合中查找模式的政策支持過程,人工智能、機器語言的學習、數據庫理論、統計分析學神經系統網絡、知識庫技術系統、高性能計算應用、數據可視化教學信息查找、模式發現等學科的研究是數據挖掘涉及到的方面,數據挖掘是一個多學科多方面的交叉內容。
我們把數據在網絡上的挖掘應用叫做Web挖掘,在網絡數據使用過程中,利用數據挖掘技術以及與萬維網有關的數據信息庫中的資源、網絡用戶的操作行為,在用戶操作過程中獲取有關部門感舉的信息,搜尋可利用的挖掘模式和潛在的數據信息,相關內容涉及多個領域,例如:計算機網絡技術、數據挖掘技術、計算機科學技術、機器語言學等,是一項現代信息科學的綜合產物。對網頁中的頁面信息,以及頁面后臺數據庫中的操作數據進行統計收集,從網頁文件內容里以及內容中所描述的信息數據里抽取有價值的、潛在的、有用的信息的過程,叫做Web內容挖掘。
電子商務是在全球各地廣泛的商業貿易交易中,在互聯網開放的網絡環境里,基于服務器、瀏覽器使用方式,買賣雙方不見面地情況下進行各種貿易活動,讓消費者完成網上購物、商鋪之間的網絡交易和在線支付以及各種商務貿易及相關的綜合性服務的一種商業運營模式,是當代社會最新型的運營模式。
電子商務是使用計算機技術、網絡技術和遠程通信技術,實現整個貿易過程的電子信息化和數據化;是使用互聯網作為手段,使買賣雙方不見面地情況下可進行各種商務貿易活動。
隨著信息系統的廣泛使用,如何充分利用數據,發掘有用的知識,是廣大擁有大量數據的組織非常關心的問題,在此前景下,需要從數據中找出有用的知識。介于以上情況,人們需要使用一個新的技術工具將數據轉換為自己所需要發知識內容,這便產生了數據挖掘技術。
數據挖掘技術在電子商務中的應用前景廣闊,隨著數據挖掘技術與數據庫技術的不斷發展,對Web挖掘中存在的各種復雜的非結構化數據會有更完善的解決方法。隨著社會的不斷發展,電子商務必將加快中國經濟發展的步伐,電信行業的迅速發展,網絡迅猛普及更為中國的網絡電子商務打下了堅實的基礎。數據挖掘技術在電子商務中的應用前景廣闊,隨著數據挖掘技術與數據庫技術的不斷發展,對Web挖掘中存在的各種復雜的非結構化數據會有更完善的解決方法。
隨著社會的不斷發展,電子商務必將加快中國經濟發展的步伐,電信行業的迅速發展,網絡迅猛普及更為中國的網絡電子商務打下了堅實的基礎。很多城市都在興建自己的數碼港我國上網人數也在快速上升,許多小區都有了互聯網,寬帶的進入,相信會有更多的人采取這種方式來發展自己的營銷計劃。因而可以說,電子商務網站在中國將會有巨大的發展前景。
[1]朱明.數據挖掘[M].中國科學技術大學出版社,2002:75.
[2]余強,張海盛.個性化Web信息服務技術研究[J].四川:計算機應用研究,2006,2:198-200.
[3]毛國君,段立娟.數據挖掘原理與算法[M].北京:清華大學出版社,2005:20-39.