郭濤
作為一家以處理機器大數據見長的公司,Splunk追求的最終目標是讓大數據可取可用,發揮其最大的價值。Splunk正在努力打造一個大數據生態。
如果讓你擁有超凡的大數據能力,你最想改變的是什么?我猜想,在暑期這個旅游高峰,可能很多人都希望飛機不要再延誤。英國的蓋特威克(Gatwick)機場借助大數據公司Splunk提供的底層技術支持,給人們的外出帶來了一種全新的體驗。旅客出門前會收到機場發出的提醒,給出建議的出門時間或航班延誤通知;95%的旅客可以在5分鐘之內完成安檢;行李車上裝有傳感器,可以讓旅客在第一時間拿到自己的行李……
除了蓋特威克機場,丹佛機場、迪拜機場等也因為應用大數據技術從而提升了人們出行的效率,大數據的應用也從局部擴展到機場服務的方方面面,包括天氣預報、航班準點查詢、安全檢查、行李提取、機場周邊交通狀況等。這樣的應用體驗也是Splunk追求的最終目標,就是讓大數據可取可用,發揮其最大的價值。
不會被超越
大數據這個概念是由著名咨詢公司麥肯錫率先提出的。大約從2010年開始,大數據形成了一股熱潮,席卷世界各地。創立于2003年的Splunk作為一家“現象級”的大數據公司,于2012年4月成功登陸納斯達克,成為全球首家上市的大數據公司。Splunk的上市在當時引起了巨大轟動,大數據的商業價值逐漸顯露,也吸引了眾多后來者蜂擁而至。大數據因來源不同分成很多種,比如商業大數據、社交大數據等,而Splunk的拿手好戲則是機器大數據的處理,比如各種設備的日志數據、傳感器數據等。
從上市到現在,5年過去了,全球大數據市場已今非昔比,大數據已經被公認為是實現數字化深刻洞見的基本工具,而Splunk又發生了怎樣的變化呢?“我們仍然是一家大數據軟件解決方案提供商,只不過平臺解決方案的種類越來越多,既可以在本地部署,也可以在云端部署。”Splunk公司總裁兼首席執行官Doug Merritt(道格·梅里特)話峰一轉,“從2012年上市之后,公司的發展速度加快了。上市之前,公司的年收入大約為1.5億美元,員工人數不足500人。但是去年,公司的年收入已經達到9.5億美元,員工增長到2800人左右。”
上市后的Splunk成了眾多公司模仿的對象,包括技術、商業模式等。對此,道格·梅里特倒并不擔心:“沒有一家公司能夠做到我們所做的一切,他們只是在做其中一部分業務。另外,我們的技術能力與積累也是其他公司不能模仿的。比如,我們的產品無需‘建模即可完成調查和分析。另外,我們十分重視生態體系的構建,這其中既包括合作伙伴,也包括用戶。商業的成功沒有合作伙伴的支持是不可能實現的,而客戶的需求則是我們前進的驅動力。在我們的生態體系中已經有1500多個方案。未來,我們會繼續在自己核心的技術領域進行大量投入。”
大數據意味著什么?大數據代表一種智慧,可以讓IT產品邁向智能化。大數據安全就是將大數據的處理和分析能力應用于安全防御的一個新興領域。大數據將成為下一代智能安全不可或缺的一個因子。因為具有出眾的大數據分析能力,以及在機器數據方面的先天優勢,Splunk也被視為大數據安全領域的一個代表,成為國內一些初創的大數據安全企業學習的對象。
當前,Splunk的業務線眾多,主要包括IT運營、應用程序性能分析、安全和合規、業務分析、物聯網等。“我們在安全方面的投入非常大,目前安全業務的收入已占公司總收入的40%左右。”道格·梅里特自豪地說:“安全是一切數據活動的基礎。在安全和合規方面,我們積累了大量數據和經驗,可以為用戶業務的方方面面提供幫助和支持。”
Splunk的一個獨特之處在于,它采集到的數據不僅可以用于安全,而且還可以應用于改善企業的業務應用、提升開發效率、提供完整性體驗等很多方面。就像一句廣告語所說:“一直被模仿,從未被超越。”Splunk的業務覆蓋更全面,包括業務監控、日志管理甚至物聯網,而其他廠商只能做到其中一部分而已。
“無需建模”
最讓道格·梅里特津津樂道的是Splunk的技術獨特性,比如無需建模即可以實現調查的功能。這也被認為是Splunk難以被模仿的關鍵一點。
通常來講,大數據需要算法和建模相結合。其實,Splunk所說的無需建模,并不是舍棄了建模這一步,而是把其他人通常放在第一步要做的事情推后了。傳統的大數據分析是先建模,再導入數據,然后進行其他處理。Splunk認為,先建模的做法,既耗費功夫,又容易導致之后的分析結果出錯。因為在還不了解需要解決的問題是什么之前就先建模,可能在之后導入數據時,將一些有用的數據屏蔽了,所以有可能導致分析結果出錯。
使用過Splunk產品的用戶有這樣的感受,傳統的先建模的方式,就像是先設定好一個Excel的內容,然后再根據Excel的要求導入數據,而Splunk的方式是先將所有原始數據采集起來,然后再輸入Excel,這樣可以保證所有有效數據被用于分析。兩種做法可能會導致不同的結果。Splunk的方式保證了分析結果的準確性,數據的價值可以得到更充分的發揮。
用戶不必擔心,先收集所有數據會給企業的存儲容量帶來壓力。因為Splunk提供了優化的存儲設計,采用了數據壓縮、分層等技術,可以將數據存儲量壓縮至實際容量的三分之一。實踐證明,Splunk的產品受到了廣泛歡迎,全球知名的托管云服務商Rackspace、中國領先的互聯網金融平臺快錢公司等都通過采用Splunk的產品改善了管理,保證業務的高效、安全運營。
打造一個中國的生態
與其他跨國企業一樣,中國也是Splunk十分看重的一個市場。在2012年上市前,Splunk在全球范圍內已經擁有3700家客戶,其中就包括30家來自中國的企業。這30家企業也成了Splunk在中國快速發展的“星星之火”。
據Splunk公司亞太區副總裁梅正宇介紹,公司重要的產品線在中國都有落地,其中最受歡迎的核心產品是Splunk Enterprise。它是一個運維智能平臺,通過使用預定義規則或通過專門搜索,深入了解數據,驅動安全分析,以及對現代威脅進行持續監控。安全、IT運維、APM(應用性能管理)是中國用戶采用最多的Splunk的產品。Splunk還嘗試在中國開拓物聯網方面的應用,目前還處于起步階段。
文章開頭已經提到,Splunk的大數據產品已經廣泛應用于全球各地的機場。中國也有一個機場采用了Splunk的產品和服務,主要用于安全和日常運維。Splunk深入了解并與用戶溝通的方式是舉辦“黑客松”這樣的培訓活動,通過面對面的交流,讓用戶對自己的數據有更深入和全面的認知,并將數據充分利用起來。其實,很多用戶已經積累了大量的數據,存儲在Excel文件或數據庫中。Splunk給用戶的建議是,將這些不同來源的數據整合在一起,放到一個平臺上,就可以用于某一特定用途的分析。比如,機場可以將這些數據用于分析周邊交通擁堵情況,或者縮短行李提取的時間等。
Splunk的重要作用是,為用戶提供一個匯集和處理數據的平臺,讓業務人員發揮自己的創意,利用平臺上的數據解決自己實際業務中的問題。這樣的方式可以在機場以外的更多行業和領域進行復制,比如金融、制造等。
為滿足不同用戶的需要,Splunk的產品既可以在本地進行部署,也可以用于云端。“中國的企業客戶更傾向于在本地進行部署。也有一些在中國的跨國企業采用了云端部署和應用方式。”梅正宇介紹說,“我們希望在中國推動云應用模式,目前正在計劃之中。”在云服務方面,Splunk已經與AWS實現了合作,其軟件許可證可以在AWS公有云中進行管理。
梅正宇向記者表示,Splunk提供的是一個平臺,它在中國的發展離不開各類合作伙伴的支持。除了發展傳統的銷售渠道以外,Splunk正在加強與OEM伙伴的合作:一方面,在一些特定的產品應用領域尋找OEM伙伴,比如安全網關、應用性能管理、虛擬化數據中心的自動化管理等,上個季度Splunk剛剛與3個此類合作伙伴簽約。另一方面,在一些重點拓展的垂直行業尋找OEM合作伙伴,比如交通、醫療、制造等行業。
當前在中國,人工智能是最熱的話題。大數據與人工智能是不可能分割開單獨存在的。Splunk已經完成了多個與機器學習相關的公司的收購,并且早在兩年前便推出了機器學習工具包。道格·梅里特表示,大數據和人工智能對于Splunk來說至關重要,未來也會齊頭并進。