李發文
山東臨沂煙草有限公司 山東臨沂 276003
隨著我國實體經濟的快速發展,煙卷消費需求不斷擴大,給煙草行業帶來了巨大的發展情景。和傳統的煙草市場不同,煙草客戶行為特更加多樣化,需求也更加個性格化,因此需要對煙草用戶的行為進行詳細的分析,明確把握市場的需求方向,深入理解用戶的潛在特質,從而實現煙草企業“個性化”運營。
在構建煙草客戶標簽庫的時候要嚴格按照以下流程:第一步就是要明確業務的實際需求,根據具體的情況確定相關數據,明確用戶群體。對當前煙草行業進行深入的分析,明確市場需求和業務需求,然后制定相應的策略手段,明確所要深入挖掘的主題以及相應的研究方法。第二步準備數據,包括選取字段、清洗數據、分析數據等,在準備數據階段涉及到了網絡爬蟲技術、信令解析技術等[1]。第三步就是構建用戶行為模型。確定用戶行為模型,然后進行構建。第四步對數據挖掘算法進行恰當的選擇或者是改善,明確進行數據深入挖掘的目的,準備好現有的數據并對現有數據的內容和特點進行分析,然后選取適當的數據挖掘相關算法。第五步對模型進行測驗,根據現有的數據和已經建立的模型對其有效性和可實施性進行檢驗。第六步應用并對運營數據進行分析,當在對模型進行檢驗之后,可以將模型投放到煙草行業市場分析中,然后對得出來的結果進行深入的分析。如果和預期的結果不符,那么就需要對模型進行重新構建和設計。第七步結果反饋,通過模型在市場上的應用或者是用戶決策層對模型的反饋結果進行分析,從而實現對模型的優化。第八步根據分析出來的結果采用文字、PPT等方式將結果展現出來。
煙草客戶標簽庫的實現系統應該具備如下性能:首先,系統要具備良好的可擴展性,能夠考慮到的未來行業的發展、技術更新的趨勢以及長久的實用性。其次,系統要具備良好的運行效率,能夠準確的、有效的實現用戶信息的標簽化,滿足用戶的個性化需求,能夠支持精細化運行。再次,要具備較高的安全性,充分考慮系統要充分保障系統運行的安全性,從而為商戶提供運營商提供技術安全保障,最后,要具備良好的可維護性、便于操作員進行日常的維護,分析運行過程中出現的故障并及時采取措施[2]。
首先,針對標簽庫的系統架構設計。整個設計可以分為四個層面:數據源層、基礎數據融合層、用戶數據分析層、用戶標簽庫和應用層。在數據源層主要是為了給整個系統提供一個較為完備的數據支撐,最初的數據是來源于信令監測系統中收集的數據、運營商提供的經過分析的數據以及系統通過網絡爬蟲獲取的相關數據。其中,信令監測系統主要是提供用戶的位置信息、用戶的各種行為等數據[3]。網絡爬蟲系統主要是為了能夠更加準確的獲取用戶的各種行為。基礎數據融合層來自各個接口的數據。在這一層面中,網絡爬蟲進行數據收集并不斷更新,為后續的用戶行為的精準分析提供基礎。在用戶數據分析層中,就是利用上述收集到的基礎數據,對其進行分析和數據挖掘,從而實現運營業務發展等過程。在用戶標簽庫及應用層中,包含了個性化營銷支撐類標簽信息、基本信息等,通過要這些信息,可以完成日常業務的運營,同時實現對一些新業務層面的擴展。
其次,針對用戶標簽庫體系的設計。根據上述所說的功能需求分析,在進行標簽框架設計的時候要包。業務支撐類標簽、用戶信息標簽、業務信息標簽等。其中,用戶信息標簽和業務關系類簽比較容易獲得,可以通過分析數據直接得到。個性化營銷標簽可以通過信令解析、和網絡爬蟲分析來得到。
具體來說,針對基礎數據融合層的設計,要包括協議解析模塊、聚焦爬蟲模塊。在進行協議解析模塊設計的時候可以分為兩種解碼方式,一個是簡單解碼,一個是詳細解碼。在本研究中,采用的是簡單解碼的方式來提取關鍵字信息,并將得到的數據傳輸到業務識別模塊兒中。針對聚焦爬蟲模塊的設計,根據本研究內容設計了擴展性較好、實用性較強的網絡爬蟲系統,該系統主要是由控制器、應用模塊、數據庫等模塊構成。通過多元化的設計從而實現對多個程序的同時管理。在實際的應用中,只需要修改相應的應用模考就可以實現對信息的獲取,符合相應的設計要求。針對用戶數據分析層的設計,為了確保對用客戶行為的分析的準確性,本設計中主要包括了三個層面的設計,一個是數據預處理,一個是數據分析,還有個數據測試。預處理模塊主要是進行數據整合,分析模塊是主要是進行數據分類和分析。測試模塊主要是進行相應的測試并將測試的結果進行反饋,然后再根據反饋結果對進行優化針對用戶標簽及其應用層的設計,包括數據準備標簽擇表標簽寬表的形成階段等。
通過分析功能和性能方面的需求,對煙草客戶標簽數據庫整體框架進行設計,然后針對基礎數據融合層、聚焦爬蟲模塊等設計進行了詳細的分析,為煙草行業實現個性化服務提供了基礎。