陳娥祥
(福州工商學院,福建 福州 350715)
隨著大數據時代的到來,海量數據高效分析成為了重點與難點。而大數據技術在數據分析中的應用是時代發展的必然趨勢,大數據技術借助計算機計算功能,對大量數據信息進行分析、計算、總結[1],在整個過程中突出了大數據技術全面性、系統化、范圍廣、數據多等特點,揭示信息間有著密切的聯系,因而研究價值較高。大數據分析能夠幫助各行各業預測數據,了解市場動態變化。目前市場體系日益完善,對于大數據技術的數據分析工作提出了更高要求,也使得大數據技術在市場數據整合方面的優勢更加突出。另外,大數據技術的運行方式、價值體現較為特殊,大數據可供政策相關部門作為宏觀調控的重要參考依據。政府部門借助大數據技術能夠對當前社會發展、市場、行業問題、矛盾進行分析,收集、整理、歸納群眾意見,進而改進策略,制定具有較強操作性的發展策略。
電子商務是企業和利益相關方借助網絡平臺完成交易活動的形式,主要以網絡平臺作為交易的渠道,買方、賣方不需要面談交流便能夠將整個交易過程完成。此方式操作簡單,而且效率高。節約買方、賣方時間,無須投入太多精力便能夠達成雙方意愿,而且信息傳遞速度快,管理方便快捷。此經營模式打破了時間、空間的局限性,為企業發展帶來了較大的機遇,加快了我國經濟全球化發展的步伐[2]。借助電子商務經營模式,企業在資金、技術手段、人力成本方面都能得到有效改善,因而可大幅度提高企業的市場競爭力。
此次研究的數據來源于京東平臺貴州茶葉銷售價格、品種、銷量、店鋪名稱等相關數據。數據獲取具體流程如下:利用Python爬蟲第三方庫selenium自動獲取數據,采用的是webdriver工具,抓取數據時使用的是element_by_xpath或者css_selector,處理過程劃分為了六步:一是創建.py文件,并且將其導入至第三方庫selenium、pandas、time、csv、requests、json、lxml、urllib中;二是獲取URL,///;三是設置代碼自動點擊登錄按鈕,采用掃碼登錄的方法,在程序處于5 s休眠狀態下進行掃碼;四是登錄以后通過完成內容搜索操作;五是構建空白詞典,其中包含留言時間、內容、標題;六是抓取數據,點擊F12以后便會進入到開發者選項中,通過所需的數據源,設置代碼時將滾動條移至最后,以便于能夠將全部數據獲取。此次研究在京東平臺一共獲取到了5 800條貴州茶葉銷售的相關數據,下一步操作前要預處理獲取到的數據,其中涉及殘缺值、相似值處理等,將數據處理好后以表格的形式保存至csv文件中。
茶葉品種相關數據的分析中使用的是“Wordcloud詞云”計算方法,篩選處理目前消費者比較喜歡的貴州茶葉品種。“Wordcloud詞云”計算方法主要針對網絡文本中出現的關鍵詞的頻率,進而構建了“關鍵詞云層”或者“關鍵詞渲染”,將大量文本信息過濾,瀏覽者在較短時間內便可以便捷地獲取數據分析結果,大幅節約信息成本。此次采用詞云圖的形式呈現貴州茶葉產品名稱,給消費者呈現出強烈的視覺沖擊,結合獲取到的文本特殊性對新停用詞表進行設置,篩選以及剔除影響研究結果的文本影響因子,比如“口糧茶”“官方”“京東”等文本影響因子,在將文本處理好以后,借助jieba分詞第三方庫處理分詞,進而構成可視化的圖譜。如圖1所示。

圖1 貴州茶葉品種詞云圖
在“Wordcloud詞云圖”中云霧嫩芽、貴州綠茶、明前春茶、都勻毛尖等在京東平臺中都是比較受消費者青睞的貴州茶葉品種。結合詞云圖可了解到貴州綠茶要比紅茶更受歡迎,而且很多消費者選擇的都是明前新茶。以下是關于貴州茶葉價格數據的分析,具體見圖2所示。

圖2 貴州茶葉價格區間圖
從圖2可以看出,0~100元茶葉占比達到了48%,將近占據了一半市場份額;100~200元占比28%;200~500元以上的高端茶葉占比較小,僅為24%,說明高端市場有待進一步開發,發展空間較大。尤其是最近幾年,我國經濟穩定增長,人民群眾消費水平進一步提升,對于茶葉的需求、要求也在不斷提升,低端市場向高端轉變是發展趨勢,以低端茶葉吸引消費者,將目標客戶中的回頭客以及潛在客戶轉變為高端客戶是貴州茶葉生產企業需要關注的重點,通過大數據技術分析便能夠直觀地呈現貴州茶葉銷售情況,可幫助茶業企業精準調整營銷策略。
大數據時代數據發揮的作用以及價值是不容忽視的。對現有的數據進行分析,能夠準確預測未來的發展趨勢,捕捉到隱藏在數據背后的重要信息[3]。很多貴州茶葉企業與時俱進,在很多電子商務平臺都投入了自己的茶葉產品,所以這也在很大程度上積累了很多消費者的消費數據,可通過運用大數據技術分析消費數據,將不同需求、類型的消費者分組,進而實施個性化營銷。通過客戶分類,茶葉企業可為不同消費者提供有針對性的、差異化服務,及時發現市場變化、消費者消費行為的改變,進而做出相應調整。茶葉企業還可借助大數據后臺內容,整理及分析消費者行為,結合消費者消費時間、時長、購買頻率等全面了解客戶需求,在消費者購買產品以后,定期回訪,調查消費者滿意度,通過問卷形式收集需求。將消費者在線反饋相關數據與企業客戶管理數據庫對接,通過整理分析,為準確做出決策提供數據依據。對消費者反饋數據進行分析能夠增強其黏性,提高滿意度,進而將其轉變為忠誠客戶,形成持續消費行為,從而促進企業經濟效益進一步提升。
雖然當前電子商務企業能夠利用大數據技術對海量的數據進行分析,但是由于正處于數據分析摸索階段,對于大數據技術的重要功能以及價值的發揮還未實現深入挖掘[4]。在互聯網高速發展的當今社會,人們的消費理念發生了變化,電子商務平臺成為他們購物的主要渠道,必然會產生大量的數據,而電子商務企業在運用大數據技術時未能對這些數據進行有效的歸納與整理,使其優勢難以更好地發揮,反而使得消費信息、數據混亂無章,很難根據實際需求將這些數據充分利用。
為了能夠促進電子商務企業更好地發展,基于客戶需求,將服務質量大幅度提升,就應該對收集整理的消費者信息、喜好等數據進行分析,確保對消費者實際需求有更好的了解及掌握,進而為其提供有針對性的、個性化的服務。但是網絡環境是虛擬且復雜的,電子商務企業在借助大數據技術對數據進行分析時,必然會涉及企業數據,而有些隱秘數據信息對于企業而言是非常重要的。在數據分析過程中,如果企業未將安全防護措施做到位,會導致數據安全隱患風險的發生,數據信息安全性難以得到保障,極易被非法分子竊取。當出現此情況以后,電子商務企業會面臨著經營風險、生存危機、經濟損失。
大數據技術在電子商務數據分析中的優勢是有目共睹的,要想做到靈活運用,電子商務企業應該強化數據化意識,站在決策以及管理運行層面構建大數據平臺[5]。同時還應該將大數據技術置于發展戰略層面,意識到其重要價值,強化內部數據整合能力,深層次挖掘數據信息,根據目前企業發展需求,結合市場發展趨勢,在運營管理中高效落實大數據技術的運用。電子商務企業可借助大數據構建相應系統,并以此為媒介,使整個電子商務行業互融互通,數據信息有效共享,促進高質量數據深度整合。在對這些數據進行分析的過程中,要快速提取關鍵且真實的消費者信息,使電子商務企業在運行中能夠結合收集的信息快速做出經營決策,及時調整發展戰略。
電子商務企業可通過構建安全防護屏障的形式,全面保障大數據、企業內部數據信息的安全性。為達到更好的效果,電子商務企業要構建相應的安全數據網,特別是一些重要機密性文件數據要采用加密形式,全方位把控數據安全,大幅度提高安全防護水平。電子商務各企業間要形成良好的溝通氛圍,在強化互動的同時,共同深層次研究以及探索大數據技術相關知識,相互促進、互相借鑒、共同提升,確保大數據技術優勢能夠充分發揮。電子商務企業也可以信息技術為基礎,構建預警及監督系統,實時監控消費者信息,結合數據網動態變化,對數據信息安全重要影響因素進行分析。如果發現數據網出現異常,預警系統會自動提示,發出報警信號,開啟安全防護系統,將非法侵入者攔截,提高數據信息安全性。
大數據時代最為典型的特點便是采用大數據技術對電子商務信息的快速收集、整理、處理,這也在很大程度上為市場精準化營銷奠定了良好的基礎,確保消費者能夠享受到多元化服務[6]。采用大數據技術可對消費者消費心理、行為等數據進行獲取,進而使電子商務企業能夠準確捕捉到其中有價值的數據信息。在分析過程中要分類管理消費者,推進精準化營銷,確保產品推出的針對性更強,使電子商務企業經營水準、經濟效益大幅度提升。
將大數據技術應用于電子商務數據分析中,不僅為行業發展提供了強有力的支持,而且推進了企業數字化發展,使企業能緊跟時代步伐,動態了解市場變化和消費者消費傾向,以此為依據及時調整經營模式。電子商務的發展對于企業而言是非常好的機遇,但是往往機遇與挑戰是共存的,這就需要通過電子商務平臺經營的各個主體緊緊抓住這個機遇,充分利用大數據技術優勢,實現數據分析精準化、高效化。■