安德烈·哈久 朱利安·賴特
許多高管和投資者理所當然地以為,利用客戶數據,可以獲得無與倫比的超強競爭優勢。客戶越多,能夠收集到的數據就越多。公司運用機器學習工具分析數據,就可以提供更好的產品,繼而吸引更多客戶。如此一來,公司又可以收集更多數據,最終像擁有強大網絡效應的大企業一樣,將競爭對手邊緣化。但事實往往并非如此,大部分情況下,人們都過度高估了數據帶來的優勢。
數據驅動的機器學習創造出的良性循環,乍看之下與一般的網絡效應相似:用戶越多,價值越高(如社交媒體平臺),最終獲得大量用戶,令競爭對手望塵莫及。然而在現實中,一般網絡效應持續時間更長,影響更大。要打造強大的競爭力,企業需要同時具備網絡效應和數據驅動型學習,但能夠同時發展這兩項的公司少之又少。不過,即使沒有網絡效應,只要具備相應條件,公司也可以利用客戶數據建立防御壁壘、應對競爭。本文介紹利用客戶數據打造競爭力的條件,以及評估其是否適用于公司的方法。
以數據為基礎的公司原本就有很多,并不是近年才興起的,如信用機構及信息匯總公司律商聯訊(LexisNexis)、湯森路透(Thomson Reuters)和彭博(Bloomberg)等。這些公司受到行業準入門檻保護,因為獲取和整理大量數據需要規模經濟才能實現,但這些公司的商業模式并不涉及從客戶處收集信息并分析、了解如何提供更好的產品或服務。
收集客戶信息加以利用,進而提供更好的產品和服務,也是一種由來已久的策略。但以前這個過程十分緩慢,范圍有限,而且很難擴大規模。汽車制造商、包裝消費品公司以及其他許多傳統制造商,若想采用這一策略,就要研究銷售數據,開展客戶調研和焦點小組討論。然而銷售數據一般與顧客個人無關,調研和焦點小組則要花費大量時間和金錢,因此傳統公司只收集到一小部分客戶的數據。
云端技術和新科技的發展,讓公司能夠迅速處理和解讀大量數據,以上的狀況也隨之發生了巨大的變化。現在的聯網產品及服務,能夠直接收集客戶信息,包括個人詳細資料、搜索行為、內容選擇、交流、在社交媒體發布的內容、GPS定位以及使用習慣。用機器學習算法分析過這種“數字化排放”之后,公司提供的產品或服務可以根據用戶情況自動調整,乃至實現自動定制化。
這樣的科技發展,使得數據驅動型機器學習比以往公司的客戶洞察更加強大,但不一定能幫助公司建立防御壁壘。
要確定數據驅動型學習提供的競爭優勢是否可持續,公司應當回答以下7個問題:
1.與產品或服務的獨立價值相比,客戶數據為其增加了多少價值?增加的價值越高,建立持久競爭優勢的可能性就越高。我們來看一個客戶數據帶來極高價值的例子:先進駕駛輔助系統(ADAS)一流供應商Mobileye,為汽車提供防撞輔助系統和車道偏移警告系統。該公司主要向汽車制造商出售其輔助系統,制造商會在實際投入應用之前進行大量測試。輔助系統必須有失效保護,而測試數據對于產品改進必不可少。Mobileye從數十個客戶處收集相關測試數據,將ADAS的準確率提升至99.99%。
智能電視則恰恰相反,學習客戶數據獲得的價值相對較低。現在一些智能電視裝有相關軟件,可以根據用戶觀看習慣和各個節目的人氣,提供定制化的電視節目或電影推薦。目前消費者還不甚在意這個功能(亞馬遜和網飛等網絡流媒體供應商也提供這個功能)。消費者考慮購買時,主要考慮的是電視屏幕尺寸、畫面質量、易用性和耐用性。學習客戶數據無法為智能電視公司增加多少競爭力。
2.數據驅動型學習的邊際價值下降有多快?換言之,對于公司而言,客戶數據無法再增加價值的臨界點在哪里?邊際價值下降速度越慢,基于數據的學習帶來的競爭力就越強。注意,回答這個問題的時候,不要根據其他應用程序的特定衡量標準(如自動應答機器人正確回答問題的比例、電影推薦獲得點擊的次數等)判斷基于數據的學習的價值,要重點關注客戶的購買意愿。
將Mobileye的ADAS準確度和客戶使用率(汽車制造商測試ADAS的總里程數)制成函數,你會發現部分制造商和中等水平的測試就能夠達到90%的準確度,但要想達到99%,就需要更多制造商的更多測試,99.99%就更不用說了。在這里認為客戶數據的邊際價值會迅速下跌,當然是不準確的:要在90%的準確度以上再增加9%(乃至0.99%),價值依然非常高,因為這是生死攸關的事。即使是最大的汽車制造商,僅憑一己之力也很難獲得足夠的數據,而Mobileye的潛在競爭對手也很難復制如此海量的測試數據。Mobileye能夠在ADAS市場獲得主導地位,吸引英特爾于2017年以150億美元的價格將其收購,原因正在于此。
如果學習客戶數據帶來的邊際價值在已經獲得大量客戶的情況下依然居高不下,產品及服務就會擁有顯著的競爭優勢。預測罕見病專用的系統(如RDMD提供的系統)和百度、谷歌等在線搜索引擎體現出了這一點。微軟投入多年時間、數十億美元開發搜索引擎必應,卻無法撼動谷歌的地位。搜索引擎和疾病預測系統都需要大量用戶數據,才能持續提供可靠的結果。
3.用戶數據的“貶值率”如何?如果數據很快就會過時,那么在其他條件都相同的情況下,競爭對手進入這個市場會更加容易,不必忌憚在位企業積累的數據驅動型學習能力。
Mobileye多年以來從各汽車制造商處獲得的大量數據,對于產品的當前版本依然有價值。谷歌數十年來積累的搜索引擎用戶數據也一樣。雖然對某些術語的搜索可能會逐漸減少,用戶漸漸開始搜索新事物,但擁有多年歷史搜索數據對于服務今天的用戶有著不可否認的價值。Mobileye和谷歌搜索引擎的用戶數據貶值率較低,是這兩家公司基業長青的一大原因。
然而在電腦和手機休閑社交游戲領域,用戶數據驅動型學習的價值會很快降低。2009年星佳(Zynga)推出的種田偷菜游戲FarmVille大獲成功,休閑社交游戲行業由此開始迅速發展。星佳公司雖然以高度依賴用戶數據分析進行設計而聞名,然而從一個游戲中獲得的用戶洞見難以運用到另一個游戲:休閑社交游戲只是風靡一時,用戶偏好會迅速改變,因此公司很難依靠收集用戶數據打造可持續的競爭優勢。繼FarmVille2和CityVille等作品之后,星佳無法再推出新的熱門社交游戲,在2013年流失了近一半客戶。它被其他游戲廠商如Supercell公司(代表作Clash of Clans)、Epic Games公司(代表作Fortnite)取代。星佳市值在2012年達到高峰(104億美元),隨后就低迷不振,至今6年的大部分時間里都不到40億美元。
4.數據是否屬于公司獨有,無法從其他來源獲取,無法輕易復制及破譯?擁有無可替代的獨家客戶數據,對于打造競爭優勢至關重要。例如我們投資的一家初創公司,波士頓地區的Adaviv。該公司提供的農作物管理系統,讓種植者(目前主要是大麻種植商)可以持續監測所有植株的狀態。這個系統依靠AI、計算機軟件和獨家的數據注釋技術,檢測人眼看不到的植物生物學指標,如疾病或營養不良的前兆,隨后解讀數據,為種植者提供預防疾病暴發、提高產量的建議。使用Adaviv系統的種植者數量越多,系統能夠學習的性狀差異、耕作環境等各種因素的范圍就越廣,預測的準確性隨之提升。相比之下,垃圾郵件過濾器提供商可以更為輕松地獲取用戶數據,所以有了很多類似的提供商。
5.基于用戶數據的產品改進是否難以模仿?即使數據難以復制,且能提供有價值的用戶洞察,但如果借由數據驅動型學習實現的產品改進能被沒有相關數據的競爭者輕易照搬,也很難打造持久的競爭優勢。
公司要克服這一難題,主要受兩個因素影響。其一,相應改進是否深藏于復雜的生產過程中難以復制。音樂流媒體服務潘多拉(Pandora)受益于此。潘多拉公司獨家開展“音樂基因組項目”(Music Genome Project),根據約450個特征為幾百萬首歌曲分類;公司提供的服務利用該項目,為用戶提供個性化的音樂電臺。用戶收聽潘多拉上的音樂電臺越多,為歌曲打的分越高或越低,潘多拉就越能更好地為用戶定制曲目。競爭對手無法輕易復制這樣的個性化服務,因為該服務與音樂基因組項目緊密結合。與之相比,通過學習用戶使用多種辦公效率軟件產品(如日程軟件Calendly和向眾人征求意見確定會議時間的Doodle)的情況做出的設計改進,則很容易觀察和模仿,因此提供類似軟件的公司很多。
其二,通過用戶數據獲得的洞見是否會迅速變化。變化速度越快,模仿難度就越大。舉例來說,谷歌地圖界面的許多設計特點都很容易模仿(蘋果地圖和很多其他地圖軟件都模仿了谷歌地圖),但谷歌地圖的核心價值是其預測交通狀況、推薦最優路線的功能——這個功能利用了隨時變化的實時用戶數據,因此很難復制。只有用戶基礎能與谷歌比肩的競爭對手(如蘋果在美國)才能復制這一功能。蘋果地圖在美國正在縮小與谷歌地圖的差距,但在其他地區的用戶基礎不足,無法與谷歌匹敵。
6.來自一位用戶的數據是否有助于為同一用戶或其他用戶改進產品?理想狀態下,這兩個方面都可以實現,但兩者之間的差異很重要。倘若來自一位用戶的數據能夠讓產品更加符合這位用戶的需求,公司可以提供個人定制,提高用戶的轉移成本,借此留住用戶。如果來自一位用戶的數據能夠促進產品實現更加符合其他用戶需求的改進,就可能實現網絡效應(但也可能實現不了)。這兩種改進都有助于提高市場準入門檻,但前者是增強現有用戶的黏性,后者則有利于爭取新用戶。
舉例來說,潘多拉是數字音樂流媒體領域出現的第一個巨頭,但隨后就被Spotify和蘋果音樂超趕,而且這兩家公司仍在繼續成長。如前所述,潘多拉的主要賣點是根據用戶喜好定制的個人音樂電臺,但這個方向的數據驅動型學習僅限為一位用戶提供更好的服務,在不同用戶間并不通用:一位用戶的評分讓潘多拉了解該用戶喜歡的音樂特征,進而為該用戶提供具備這一特征的其他歌曲。與之相比,Spotify更加重視分享與發現功能,比如讓用戶搜索和收聽其他用戶的音樂電臺,以此實現直接的網絡效應,吸引更多用戶。潘多拉的服務至今依然僅限于美國(美國有潘多拉的忠實用戶群體),而Spotify和蘋果音樂已經走向全球。潘多拉于2019年2月以35億美元的價格被SiriusXM收購,而Spotify于2018年4月上市,截至2019年11月初的市值是260億美元。很明顯,通過用戶數據驅動型學習實現的定制化可以留住已有用戶,但無法實現網絡效應帶來的指數級增長。
7.從用戶數據中獲得的洞見應用于產品的速度有多快?學習周期夠快,可以將競爭對手甩在身后,平均用戶體驗中有多項產品改進同時進行時尤其如此。但如果基于數據的改進需要幾年時間或連續幾代產品才能實現,那么競爭對手在此期間自行收集用戶數據實現創新的可能性就會提升。因此,積極利用從當前用戶處獲取的數據,加速為當前用戶實現產品改進,獲得的競爭優勢會比關注未來用戶更強。前文提到的地圖、搜索引擎、AI農作物管理系統等例子都可以迅速升級,將當前的數據驅動型學習成果應用于實踐,為當前用戶提供更好的服務。
這方面的一個反例是LendUp、LendingPoint等網絡貸款提供商。這些公司考查用戶的還款記錄,以及還款記錄與用戶資料、行為等多個方面的關聯性,以此做出更好的貸款決策。這里,與當前借款者有關的唯一數據洞察是來自以前的借款者,而這部分信息體現在當前借款者的貸款合同和利息上。借款者沒有理由關心讓提供商未來會從中獲益的任何洞察,因為目前的貸款合同不會受到任何影響。因此客戶在考慮尋求貸款時,并不關心還有多少人會向特定提供商貸款。于是借款者會傾向于一直與原本的提供商合作,因為該提供商比其他提供商更加了解自己的需求,而爭奪新客戶的競爭依然十分激烈。
對最后兩個問題的回答,會告訴你數據驅動型學習能否實現真正的網絡效應。如果基于一位客戶數據的學習有助于為其他客戶提供更好的體驗,而且可以迅速協助改進產品,立刻為現有客戶提供價值,那么客戶就會關注還有多少人選用該產品。這個原理與在線平臺的網絡效應十分相似,區別在于,平臺用戶傾向于加入更大網絡的原因是想與更多人互動,而非更多用戶可以提供更多洞見、協助產品改進。
我們再來看看谷歌地圖的例子。駕駛者使用谷歌地圖,部分原因是希望其他更多的人使用。谷歌地圖通過用戶收集到的交通數據越多,對路況和所需時間的預測就越準確。谷歌搜索和Adaviv的AI作物管理系統也一樣,通過收集數據實現網絡效應。
數據網絡效應跟一般的網絡效應一樣可以提高行業準入門檻。這兩種網絡效應都會讓潛在競爭對手遇到“先有蛋還是先有雞”的冷啟動問題:想實現一般網絡效應的公司需要先吸引一定數量的用戶才能啟動網絡效應,想實現數據驅動型網絡效應的公司則需要先獲得一定數量的數據才能啟動數據驅動型學習的良性循環。
然而,一般網絡效應與數據驅動型網絡效應還有關鍵區別,這些區別使得前者的優勢更強。其一,數據驅動型網絡效應的冷啟動問題通常不如一般網絡效應那么難解決,因為購買數據比購買客戶簡單。新的競爭對手要實現數據驅動型網絡效應,不需要龐大的用戶基礎,只需要找到數據來源,即使不完美,也足以與在位企業匹敵。
其二,要想實現可持續的數據驅動型網絡效應,公司必須不斷努力發掘客戶數據。而一般網絡效應,用Intuit創始人斯科特·庫克(ScottCook)的話來說,“擁有(一般)網絡效應的產品在我睡覺的時候自己就能越變越好。”有了一般網絡效應,哪怕平臺停止創新,用戶之間(可能還有提供配套產品和服務的第三方)的互動也能創造價值。現在即使出現一個新的社交網絡,向用戶提供客觀上比Facebook更好的服務(比如隱私保護更完善),也還是很難勝過Facebook強大的網絡效應——用戶只想留在其他大多數用戶都在用的社交平臺上。
其三,在許多情況下,通過學習客戶數據實現的幾乎所有優勢,對客戶數量的要求都相對比較低。在一些應用(如語音識別)中,AI的迅速發展會降低對客戶數據的需求,甚至讓數據驅動型學習帶來的優勢徹底消失。而一般網絡效應則更加穩固,影響范圍也更廣:在已有眾多用戶的情況下,新增一名用戶依然能為已有用戶提供價值(已有用戶可以跟新用戶交流或交易)。