[摘要] 先進的商業管理理念離不開技術的支持。面對企業激增的海量數據,應運而生的數據挖掘技術可使商業決策的制定更及時、更準確。本文從數據挖掘的功能、典型商業應用、管理流程及所面臨的問題等方面討論如何應用數據挖掘技術助力商業決策。
[關鍵詞] 數據挖掘 商業決策 數據分析
一、應用數據挖掘技術支撐商業管理理念的實施
商業管理理論及理念的研究一直沒有停歇,那面是“二八原則”,這面又是“藍平長二”,無論是什么,其宗旨都是為使企業能在激烈的商業競爭中審時度勢,迅速出擊,知己知彼,百戰不殆。任何好的商業決策都必須及時、準確,有真實可靠的事實與數據為依據。商業組織如果感覺不靈敏,很容易陷入“夜半臨深池”的危險境地卻不自知,有先進的管理理念也無濟于事。面對日益復雜的競爭環境,數據挖掘技術應運而生。
數據挖掘技術基于人工智能、機器學習、統計學等技術,可高度自動化地從深層次上分析商業組織在運營過程中積累的海量業務數據,抽取重要信息,使商業組織大大提高認知其組織內外環境的能力,靈活應對突發事件,迅速制定合理決策,使先進的商業管理理念落到實處。
二、數據挖掘功能及其所能解決的典型商業問題
1.關聯分析
關聯分析是從大量的數據中發現項集之間相關關系或因果結構的數據分析方法。通過對大量銷售數據的分析,可以發現兩種或多種商品之間存在的關聯關系,據此可改變商品的擺放位置,制定捆綁銷售等策略。亞馬遜及當當等購物網站在用戶選擇商品后及時給出的其他商品的推介就是利用關聯分析得到的。
2.分類與預測
分類與預測是通過對當前數據集合的描述以識別未知數據的歸屬或預測未來數據的發展趨勢。通過對大量銷售數據的分析,可以確定特定客戶的興趣、消費習慣、消費傾向和消費需求,進而推斷其下一步的消費行為,據此進行定向營銷和推送服務,必將大大節省營銷成本,獲得良好的營銷收益。
3.聚類分析
聚類就是按照事物的某些屬性把事物聚集成類。聚類之前類的數量及類的特征都是未知的。應用聚類技術能發現不同客戶群并刻畫出客戶群的特征,據此制定營銷策略和客戶服務策略,如超市根據客戶聚集地中心點制定班車路線,制定商品宣傳策略等。
4.孤立點分析
數據庫中包含的與其他數據行為或模型不一致的數據對象稱為孤立點,在數據庫中查找識別孤立點的技術即為孤立點分析。在銀行、電信等行業的業務數據中發現的孤立點可能預示著欺詐行為,盡早識別,可以為企業減少不必要的經濟損失。另外可用于網絡的入侵檢測,生態系統的失調檢測,特殊病種檢測等。
5.時序演變分析
時序演變分析是建立事件或對象行為隨時間變化的規律或趨勢的模型。據此方法利用股市交易信息可分析股市的波動趨勢,利用商業交易信息可分析出產品的銷量變化趨勢、目標市場發展趨勢等,利用天氣狀況數據可分析天氣的變化趨勢等。
6.文本信息抽取
文本信息抽取是從非結構化的文本中提取重要信息的過程。利用該技術可獲取競爭情報,可從新聞等文本中動態抽取日期、地點和人物等信息,并借助關聯分析方法進一步識別出產品、企業、人、事件和地點之間的關系,使企業對競爭環境的感知更敏銳。
7.Web挖掘
Web挖掘是指從網絡環境中提取有價值信息的過程。如搜索引擎的應用;如分析網站的參觀者和購買者的高頻率瀏覽路徑,以確定用戶對某產品的需求,發現用戶的個人喜好,發現用戶的去留傾向……據此可改變網頁的設置,為用戶提供個性化服務,改變受歡迎產品的經營和宣傳策略等。
三、數據挖掘流程及所面對的問題
數據挖掘流程可描述為“數據選擇→數據預處理→數據挖掘→模式評估→知識表示”。
數據挖掘首先根據分析目標從數據源中選取與業務相關的數據。數據源是存儲業務數據的數據庫或數據倉庫。選取的數據通常會存在不完整、含噪聲(錯誤數據)、不一致等問題,需要預處理數據使數據適合于挖掘。在這一過程中元數據起了非常重要的作用。
數據挖掘之前必須選定數據挖掘模型,即先做出某種假定,關聯分析、聚類分析及分類與預測為不同的挖掘模型。分析商品銷售數據時假定其中某些商品具有相關性,則選擇關聯分析模型,若挖掘的結果找到了產品A的購買帶來產品B的購買則是具體的模式。最終需要評測這種模式是不是真實有效且對商業決策有指導意義(模型評估,利用興趣度度量加人的識別),保留有意義的模型,并用一種用戶容易理解的方式表達出來(知識表示)。
數據的選擇和預處理會直接影響數據挖掘的結果。另外任何一種挖掘模型和挖掘算法都不是萬能的,不同的商業問題需要用不同的方法去解決。對于特定的商業問題和特定數據可能有多種算法,需要評估以選取最佳算法。
四、總結
數據挖掘作為正在興起并得到廣泛應用的信息技術具有巨大的商業價值,特別是在銀行、電信、保險、交通、網上商城、超市等商業領域都有很好的表現。數據挖掘技術可以組織并深層次分析企業積累的海量業務數據,預測客戶行為,預測產品狀況,預測市場走勢,幫助決策者正確判斷即將出現的機會,調整策略,減少風險。因此利用數據挖掘技術必將大大提高商業組織利用信息的能力,使得信息更好地為決策服務。
但數據挖掘不是萬能的,在實際應用中還要受到許多限制。有足夠的合適的數據,選擇恰當的模型和算法,有決策者的支持等都是有效應用數據挖掘技術的必要條件。
參考文獻:
[1]李佩鈺等:藍平長二 商業理論洛陽紙貴,http://biz.163.com
[2]欒世武:數據挖掘給企業應用帶來什么,http://www.cnki.com.cn
[3]韓嘉偉等:數據挖掘概念與技術.機械工業出版社,2001
[4]蘇新宇等:數據倉庫和數據挖掘.清華大學出版社,2006.10