本文首先介紹了大數據時代的主要發展特征,并結合電子商務的發展現狀,分析大數據背景下的電商的營銷特征和優勢。本文分析了大數據的發展誤區——大數據不一定是我們需要的,要通過有效數據來定位電子商務企業。提出了大數據發展的方向——解決數據安全的問題。通過對結構化和非結構化的匿名方式的介紹,指出大數據背景下的電商企業在數據安全性上應作出的完善。
【關鍵詞】大數據 電子商務 有效數據 數據安全
早在上個世紀80年代,就有人預測大數據將成為第三次新的科技浪潮。如今,互聯網、云計算、電子商務等新興信息技術蓬勃發展,信息技術的廣泛應用,使得全球數據量呈現出爆炸式的增長狀態。隨之而來的,大數據也逐漸成為全社會的關注熱點。最新的數據顯示,全球數據增長量已經接近了摩爾定律“每18個月翻一番”的規律。數據量的飛速增長,標志著“大數據”時代的到來。對數據的收集、統計和分析,將會顛覆電子商務、物聯網等領域的傳統發展模式,為社會發展提供新的捷徑。
1 大數據的概念及特征
大數據最初是由美國人提出,Gartner將大數據定義為:大數據是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
大數據的特征在各個領域都有不同的認知和定義。目前,大數據的“4V”特征得到了較為廣泛的認可。
1.1 數據總量巨大
目前,全球數字信息總量已經達到ZB級別。我國的網民數量位居全世界之首,每天產生的數據量也位居全世界第一。如淘寶網站的訂單數,百度的搜索請求次數,微博、微信等的狀態更新,這些都將產生每日TB級別的數據量。除此之外,醫療領域、交通狀態、金融業等都會都會有大量的數據生成。由此可見,這些大數據已成為重要的生產要素。
1.2 數據種類繁多
例如互聯網的視頻庫,照片;微博、微信等社交網站的狀態;通話錄音,監控錄像等。而且這一種類還在呈上升趨勢。這些數據在大小、類別、形式上各有不同,這也給大數據的分類處理、分析帶來了很大的困難。
1.3 數據的價值率低
正是因為現在數據總量大,種類繁多,在浩瀚的數據海洋中找到有效的信息難度越來越大。如何快速準確的找到所需數據成為大數據技術的一個核心問題。例如,監控錄像往往24小時都在記錄,但是破案的關鍵點總是會集中在幾秒鐘;例如谷歌每天有上億次的搜索請求,但是如果不將搜索的關鍵詞與政府的相關數據進行對比,就無法預測到2009年H1N1的爆發;再比如現在人們所關心的地震、火山等自然災害的預測,都是通過精準數據的分析得到的。所以,提高數據的價值率,將核心數據進行處理分析才能得到有效的處理方案。
1.4 數據的快速處理能力
基于以上三點,可以了解到,大數據技術若想得到長足的發展,需要有快速的信息處理能力。傳統的數據統計,過程過于繁瑣復雜、時間周期長,已經不適合于當今社會的需求。大數據時代,需要數據具有及時性和有效性,很多場合下,數據處理不及時,那么先進的收集整理方法也毫無意義,數據也失去了它的意義。這種需求下,IBM提出了“大數據級的流計算”概念,旨在對數據進行及時的分析并得出結果,來提高數據的實用價值。所以說,數據的快速處理并分析能力,是大數據的一個重要特性。
2 電子商務的概念及特征
電子商務從興起到家喻戶曉雖然只發展了短短十幾年,但是已經成為國家經濟建設和社會發展的一個重要組成部分和發展方向,成為新經濟的主流。電子商務不僅改變了傳統的商業交易模式,更是一場經濟和社會領域的革命;它徹底打破了制造業和商業分離、供應商和消費者信息不對稱、買方和賣方對立以及大工業時代傳統商品供應鏈的固有格局,改變了人們日常生活、工作和消費的習慣。
現階段對電子商務有諸多理解和定義,通常來講,指的是在利用開放的覆蓋全球的互聯網,利用現代通信技術進行數據交換和處理,從而實現賣家與買家之間在線各種數字貿易、數據傳輸、電子支付、交易服務和相關服務活動的一種商業運營模式。借助于互聯網與生俱來的全球化優勢,廉價、高效、開放、共享等特點也成為電子商務的固有屬性。電子商務所涉及到的用戶之廣、交易形式之多變使其產生的價值遠非任何一種傳統貿易形式可以比擬。其特征可以概括為以下四點:
2.1 交易效率高
現代的通信手段可以使得商業活動突破時間和距離的限制,縮小了生產、流通、分配、消費之間的距離,大大提高了物流、資金流和信息流的有效傳輸和處理,從而降低了交易雙方的時間和資金成本,來提高交易的效率。大數據、云計算和人工智能等新興技術的完善更是進一步提高了效率,全球化的加劇使企業和消費者可以隨時通過互聯網線上交易。
2.2 交易成本低
電子商務打破了傳統的交易方式,突破了地域和中間商的障礙,使得買賣雙方的交易成本大大降低。其中,距離越遠,網絡上進行信息傳遞的成本相對于信件、電話、傳真而言就越低。此外,沒有了時間和距離的限制也大大降低了信息成本。突破了中間商的障礙,買賣雙方直接通過網絡進行交易活動,減少了交易所需的環節。同時在線上進行的宣傳、產品介紹活動所需的人力、物力成本大大節約了資金;電子商務貿易平臺所需的規模大小較之傳統店面減少很多,降低了店面的租金。最后,互聯網使買賣雙方即時溝通供需信息,使無庫存生產和無庫存銷售成為可能,從而使庫存成本降為零。
2.3 開放性
開放性是在指目前電子商務發展趨于透明化。電子商務使企業之間的溝通和聯系更加便捷,買賣雙方從交易的洽談、簽約以及貨款的支付、交貨通知等整個交易過程都在網絡上進行。快捷的信息傳輸可以保證各種途徑的信息之間可以有據可查,能夠有效的防止信息偽造。
2.4 更加優化的用戶體驗
電子商務的大平臺提供了企業和用戶更多選擇。電子商務為消費者的個性化服務提供了條件,使人們購物辦公不再受到時間和地點的約束。企業也利用網絡追蹤和分析每一位消費者的偏好、需求和購物習慣,同時將消費者的需求及時反饋到決策層,促進企業針對消費者而進行的研究和開發活動,使企業對客戶的了解和認知更為透徹,更有針對性地為他們提供個性化服務,提高他們的滿意度和忠誠度,為企業增加贏利。endprint
3 電子商務跨入大數據時代——電子商務的發展趨勢
電子商務與大數據的結合,是互聯網時代的必然產物。
大數據能夠吸引消費者的核心點在于,能夠較大程度上的優化電子商務的用戶體驗。全球數據量每18個月增長一倍,巨大的信息量使得傳統的網絡營銷方式不能夠滿足用戶“快、準”以及時刻變化的購物需求,大數據的產生,優化了電子商務平臺的這一問題。大數據優化的電子商務平臺的主要運營模式是——大數據通過對海量數據的統計、分類、總結,將用戶和產品進行有機串聯,對用戶的產品偏好進行個性化定位,為用戶提供精準高效的服務。并且通過大數據技術,可以隨時根據消費者在網上的瀏覽情況,及時的更新制定合理的營銷方案,從而達到利益最大化。同時,用戶可以通過多種渠道(關注度、好評率、店鋪等級、信譽積分等等)來鎖定自己想要購買的產品,精準全面的營銷模式優化了用戶體驗,提高了用戶的忠誠度。
4 電子商務跨入大數據時代——如何發揮大數據“潛能”
4.1 大數據時代,我們還有隱私嗎?
數據是一個企業的核心資源,也是企業競爭力的主要體現,加強信息安全對企業的持續發展至關重要。尤其是對于電子商務企業,由于互聯網本身就存在安全隱患,其信息容易被盜取利用,所以信息安全和隱私保護一直是電子商務企業的重點問題。大數據時代,網絡用戶的圖片、評論、個人信息、證件信息、興趣愛好、家庭住址、交易記錄等都會被企業記錄在案。隨著數據總量的大大增多,數據的安全問題逐漸成為廣大網民最關心的問題。正如美國計算機專家狄博德說的,在信息時代,計算機內的每一個數據、每一個字節都是構成一個隱私的血肉。信息和數據的組合,對用戶隱私的穿透力很多時候是“1+1>2”的。大數據時代,傳統的數據保護方法已經不再適用,大數據的安全面臨嚴峻的挑戰。
大數據時代,數據的安全問題包含兩個方面:一個是個人隱私的保護;一個是個人隱私數據在存放、傳輸和使用過程中被泄露的風險。隨著大數據技術的發展,每個人都希望電子商務平臺能夠提供個性化的精準服務。這樣一來,用戶就需要在互聯網上提供自己較為詳細的信息,有時候在不知不覺間,你的行為也會以數據形式被身邊的電子產品記錄下來:當你拿著你的iPhone休閑度假的時候,蘋果早就通過定位系統把你行程信息收羅到你的數據庫中;當你享受這社交網絡的便捷和巨大的信息量時,你所發表的言論、你的動態以及你家人朋友的相關信息數據也會被儲存起來;當你覺得城市的邊邊角角布滿攝像頭十分安全的時候,你的言行舉止也會被記錄下來;當你享受著各大電商平臺的物美價廉的促銷時,你的需求和愛好也會被平臺所知曉……以往,這些記錄并不會對絕大多數的人的生活造成影響,因為數據量巨大,除非有特殊需要,否則每個人的數據庫如滄海一粟,找起來十分困難,想要將一個人的數據收集完整也是一個非常龐大的工程。但如今,隨著大數據技術的不斷進步,一個人的一生仿佛都可以用數據來展現,每個階段,甚至精確到天、分鐘,每個行為都有據可查,大數據不僅能夠洞察你以往的行為,甚至還可以準確的預測到你未來的消費行為、你的健康狀況等等。
所以在這種情況下,完善的大數據的安全機制變得尤為重要。就結構化數據而言,要有效的實現用戶數據安全和隱私保護,數據發布匿名保護技術是核心。數據發布是將數據庫中的數據直接展示給用戶,在數據交流共享的過程中會有數據暴露出所有者的個人信息,因此現在在數據發布前要對數據進行匿名化處理。匿名化方法是一種安全有效的數據隱私保護方法,它能很好的平衡數據的有效性和隱私性。數據發布匿名化的基本思想是將原始數據進行某種轉換,使攻擊者不能從轉換后的數據中輕易分析出某個元組的敏感屬性值,從而不能根據敏感信息來識別到具體的信息所有者,來達到隱藏用戶信息的目的。但是,其設定的環境大多是用戶一次性、靜態地發布的數據,而現實中數據是多變的,數據發布大多是連續、不間斷的。所以在大數據復雜的環境下,攻擊者可以通過不同的發布點,不同的渠道來獲取信息。所以說,數據發布匿名化這項技術在未來還是有很大的發展空間。
對于非結構化數據,比如說社交網絡,每日產生的海量數據要想實現用戶的安全和隱私保護,尤其是包含了大量用戶隱私的非結構化數據(圖結構等),可靠的社交網絡匿名保護技術就尤為重要。在社交網絡的在社交網絡模型中,需要匿名保護的主要對象包括:身份隱私、社交關系隱私和屬性隱私。在社交網絡中,用戶的這三類隱私信息之間互相覆蓋,關聯度較強,環環相扣,所以給社交網絡匿名化技術增加了難度。最為典型的方法是基于結構變換的匿名方法。這種方法的特點是對社交網絡中的邊、節點進行增刪減除等變換來時間用戶數據的匿名化。一般攻擊者都會利用點和邊的相關屬性,通過分析整合,來鑒定出用戶的先關隱私信息。而這種方法的核心思想是盡量的模糊各個關系節點的個性化特征,讓部分虛擬節點盡可能相似。典型的度節點方案是通過調整度數相近的節點,進行增加或刪除節點相連的邊個數,使得每個節點至少與其他K-1個節點的度數相同。
4.2 “大數據?”“有效數據!”
一分鐘內,Twitter上新發的數據量超過10萬,Facebook的瀏覽量超過600萬,這些數據還是在呈上升的趨勢。毋庸置疑,能否利用“大數據”優化和定位企業發展方向已經成為電商企業發展的關鍵因素。新媒體帶來的新的網絡運營方式是以“大數據”為坐標的。信息時代的核心價值就是信息,而數據就是測量信息是否被有效傳播的標尺,來告訴電子商務企業某種產品信息在多大程度上被消費者接受,并讓這些企業分析消費者是否還會再光顧以及不光顧的原因是什么。
然而這種“大數據”分析出來的結論并非每次都能達到預期的效果。2012年8月15日,京東CEO劉強東向蘇寧宣戰,拉開了京東、蘇寧、國美的家電價格戰。低價的促銷行為使這次價格戰被網民抬向高潮,“你敢1元,我就0元”等口號給網民留下深刻印象,這些信息的轉發、評論次數成了普通信息難以比擬的數據量。但是很快,檢測數據顯示,各個商家參與競爭的商品重合度僅有10%,還有超過10萬商品的折扣幅度低于10%,過半的低價商品顯示“無貨”。這一結果使用戶的好感度大跌,之前所宣傳渲染的“大數據”起到了相反的效果。之前的關注度有多大,現在商家所面臨的危機就有多大。及時三個商家進行及時的危機公關處理,但是消費者的品牌忠誠度大大降低了。
作者簡介
張涵(1997-),女,河南省新鄉市人。大學本科學歷。北京郵電大學國際學院學生。主要研究方向為大數據研究。
作者單位
北京郵電大學國際學院 北京市 100876endprint