劉枬,郝雪鏡,陳俞宏
1.重慶交通大學經濟與管理學院,重慶 400074;2.重慶市軌道交通(集團)有限公司,重慶 401120
隨著人工智能、物聯網、云計算等技術的發展,全球數據量正以指數型增長。據國際數據公司(IDC)預測,到2025年,全球數據量將增至175 ZB[1]。與此同時,數據經濟應運而生,大數據正成為數據時代的重要財富。2011年,IDC和麥肯錫研究院對大數據的潛力和關鍵技術等進行了分析[2-3],指出數據為企業帶來決策價值,將成為企業的關鍵競爭力。數據價值在企業中直觀的體現是財務報表中日趨擴大的“賬面價值”和“市場價值”之間的差距,如Facebook首次公開募股時,實際估值高出報告的傳統資產(977億美元)的部分即為數據價值[4]。對于此,Mayer-Sch?nberger V等人[4]指出數據被納入資產負債表是必然的。為了釋放數據價值,美國政府2012年啟動“大數據研發計劃”,投資2億美元來改進從數據中獲取價值的能力。2015年我國國務院頒布《促進大數據發展行動綱要》,將大數據戰略上升為國家戰略。2019年十九屆四中全會更是將數據列為一種生產要素。由此可見,大數據的發展勢不可擋,如何分析利用海量數據以創造價值成為社會各界關注的重點課題。
盡管數據量級巨大,但是目前對數據的使用卻極為有限。數據領域存在天然的割據和壟斷現象,“數據孤島”和供需錯配仍阻礙著數據價值的兌現[5]。如Naisbitt J[6]所言,數據是海量的,但真正有用的知識卻很匱乏。因此,亟待形成規范化的數據定價機制,以促進數據資源流通、合理分配以及數據價值釋放。而價格是由價值決定的,大數據價值具有密度低[7]、不確定性和共享性等特點[8]。大數據價值密度低體現在大數據中通常包含大量的無用內容,且數據價值隨著數據量的增加呈現邊際效用遞減甚至變為負增長,因此數據價值密度與數據量成反比[9]。價值不確定性主要表現于3個方面。首先,大數據價值必須以數據的分析和處理為前提[10]。其次,大數據價值具有雙向不確定性:一方面,數據成本信息僅由賣方掌握,交易信息不透明導致“檸檬市場”(信息不對稱下的好商品被淘汰、劣等品占領市場,最后導致市場萎縮的情況)[11];另一方面,數據價值取決于買方對數據的具體用途[12-13]。最后,大數據價值難以從企業原有的產品和服務收益中單獨分割出來[8]。此外,由于大數據所有權和使用權分離且邊際成本低[14],不同主體可共享同一份數據而不影響各自的效用,數據具有“共享品”屬性[15]。這些獨特的價值特征造成大數據定價的諸多困難。目前市場最普遍的是協議定價,即交易雙方通過反復協商達成一致價格,如中關村數海大數據交易平臺的買賣雙方自由定價,貴陽大數據交易所的平臺撮合、買方定價。協議定價簡單可行,但交易效率低、信息嚴重不對稱,交易也多由賣方主導。因此,如何建立有效的數據定價方法,釋放數據價值,是亟待解決的問題。
大數據固定成本高且為沉沒成本,邊際成本趨近于零[16-17],導致傳統商品定價機制失效。眾多研究者對大數據定價進行了研究。國外研究成果主要分為大數據服務定價、大數據產品定價兩方面。
隨著人們對大數據概念的深入理解,數據即服務(data as a service,DaaS)被人們廣泛接受。數據被視作一種寶貴的資源,經分析處理后被提供給具有不同數據需求的系統及用戶[18],帶來決策價值。基于此,一些企業開始轉型,開始發展數據分析服務的業務,數據市場逐漸發展起來。DaaS定價多是在實踐中發展起來的定價策略,主要分為以下3種類型[19]。
● 公司訂閱[19]是市場上最流行的定價模式,即提供商向商業組織收取訂閱費,提供指定時間段內和訂閱范圍內的數據服務產品。例如,數據公司AggData以固定價格銷售位置數據,但同時也以訂閱的形式為用戶提供公司其他業務的數據;Datacoup通過收取每月費用來提供不同來源的數據,如Facebook、LinkedIn和Google等公司對用戶在線賬戶的訪問。這種定價模式類似捆綁定價[20],不是針對單一產品進行定價,而是將多個數據以打包的方式進行標價,從而以同質的數據在吸引更多用戶的同時,獲取更高的利潤。但隨著客戶需求的多樣化和復雜化,此方法將不可避免地出現數據資源浪費的情況。
● 基于數據類型的定價[19]是一種細粒度的定價模型,其按數據類型或自身屬性將DaaS定價層分開。例如微軟Azure為研究人員提供COVID-19研究數據集,美國國家海洋和大氣管理局(NOAA)為氣象學家提供不同價格的綜合地面數據等。此模型難點在于分類管理復雜,需要找到針對性的細分市場和客戶,實施和推廣難度 大。
● 基于容量的定價[19]是基于提供的數據量進行分層定價的。該定價模式適用于數據使用量低的用戶[21]。例如,亞馬遜網絡服務/彈性計算云(EC2)按傳輸量(以GB為單位)或每小時使用的隨機存取存儲器(RAM)收費;微軟Azure按小時收取處理能力費,按傳輸量收取存儲費?;谌萘康亩▋r有利于維護賣方利益,如通過雙重費率[22]能保證供應商對成本的回收。此外,有研究顯示,按用量付費在壟斷條件下能產生更高的利潤[23]。此方法的優勢在于容易實施,能避免對數據質量的直接量化[18]。但如果邊際成本收斂到零,基于容量的方法將失去說服力,且該方法缺乏從需求角度對用戶利益的考 慮。
此外,Schomm F等人[24]對數據市場上的數據服務提供商進行了調查,總結了一些定價模式,除上述提到的3種外,還有免費、統一費率、免費增值等模式。其中,免費模式通過提供免費數據吸引潛在客戶,且較為靈活,但不具有營利性;統一費率模式則收取固定費用,允許用戶在該時間段內無限制地使用服務,此方法交易成本低,但對于用戶來說缺乏靈活性;免費增值模式通過免費的基礎服務吸引用戶,再以收費的附加服務實現盈利。
隨著各行各業對數據需求的日益增長,越來越多的數據產品在網上交易,人們對數據的需求也越來越多樣化。數據市場活躍不僅能緩解“數據孤島”現象,還能發揮規模經濟效應,釋放更大的價值。在DaaS定價的基礎上,研究者提出了一些新興的數據產品定價方法,分為以下兩大類。
(1)基于版本的定價
基于版本的定價是基于數據壟斷者實施的價格歧視策略,營利性和交易效率較高[25]。數據產品版本的劃分依據可以是數據特征或用戶需求[26],兩者均能實現市場細分、增加利潤。如廣聯達科技股份有限公司將其推行的軟件劃分為低價的學習版和高價的專業版,這便是對不同用戶群體實施的價格歧視策略。此外,數據的低復制成本和買方異質性使得捆綁定價應用普遍[27-28],如將不同數據質量的商品進行捆綁[29],以獲取更高的利潤。為了實現進一步的市場細分,Balazinska M等人[30]將數據版本看作視圖,按用戶選擇的任意組合的視圖來分配一個價格。此后,Koutris P等人[31]將基于版本的定價進行了擴展,提出了基于查詢的定價模式,通過預設視圖價格實現了對買方任意查詢的自動定價,避免了套利和折扣。Li C等人[32]進一步提出線性聚合交互式查詢定價模式,該模式滿足無套利、非披露、無后悔3個屬性。為了突破上述基于查詢的定價中只能通過預定義視圖查詢數據這一限制,Li C等人[33]開發了一個基于擾動查詢的定價模型,并建立了更加靈活的無套利定價函數。而TANG R M等人[34]則為元組設定價格,由元組生成滿足用戶查詢最小的視圖,從而為任意查詢定價。但此改進后的基于查詢的定價仍存在諸多障礙。首先,單個元組本身幾乎無價值,以此組合而成的數據價格無說服力;其次,如何選擇視圖并對其進行定價缺乏明確的方法,從而造成實際操作中的障礙;最后,該模型是離線交易模型,而數據的更新是迅速的,預設價格視圖無法覆蓋新生成的數 據。
(2)基于效用的定價
基于效用的定價即基于數據自身屬性和效用對其進行定價。前文定價多由賣方主導,強調供應商的利潤,缺乏對數據效用的考慮。鑒于此,Heckman J R等人[35]和Harmon R等人[36]分別基于數據的內在價值和客戶感知價值建立了數據定價模型,均強調了定價時對用戶利益的考慮。Liang F等人[37]指出基于客戶支付意愿的定價有利于供應商更長遠的利益,關鍵在于如何對此意愿進行量化[20]。而數據質量的高低通常決定了用戶的支付意愿,因此質量因素常被用作數據效用的度量標準[38-39]。數據質量維度之間存在線性和集成兩種關系,線性關系表示各質量維度對數據質量的獨立影響,集成關系[40]表示數據質量維度之間的相互影響。基于數據質量的定價考慮了數據本身的價值和消費者效用,公平且透明,但仍然存在一些不足。首先,它只考慮了質量因素,忽略了數據容量等其他重要因素[11];其次,數據質量維度及維度之間的關系是難以量化 的。
2012年李國杰等人[41]率先指出了大數據對未來發展的重大意 義。大數據價值引起了各行各業的重視,數據交易和數據定價成為研究熱點。而數據價值化是按照資源化、資產化、資本化3個進程推進的[42]。本文從數據產品定價和數據資產定價兩方面進行總結。
王文平[43]梳理了數據產品的標準化和確權問題,并整理出平臺預訂價、固定定價、協議定價、實時定價以及拍賣定價5種常用的定價模式。陳筱貞[44]研究了數據交易的市場類型和定價,提出生成級別、信息領域以及應用端用途3類數據價格決定因素。趙子瑞[45]指出當前定價策略中缺乏對數據成本的考慮,構建了基于成本論的大數據價格指標體系。胡燕玲[46]認為數據定價的難點在于其價值不確定性,并提出大數據預處理定價策略。在以上研究的基礎上,數據產品定價研究取得了不少成果。
(1)基于生命周期理論的定價
數據的價值是隨時間波動的。閔華松等人[47]最早提出數據的生命周期管理概念,構建了一個動態價值評估模型。王衛等人[48]分析了數據產品的生命周期價值特征,對數據進行了分階段定價?;谏芷诶碚摰亩▋r靈活性高,且能提高數據資源的利用效率和社會總體效益。但在實踐中操作復雜,技術要求和實施成本較 高。
(2)基于效用的定價
由于使用者對數據價值具有決定性作用,效用價格論應用廣泛。劉朝陽[10]以成本價格和效用價格為上下限,在區間內通過定價策略來確定最終價格。熊勵等人[49]指出基于用戶感知價值的定價有利于滿足用戶的個性化需求。李貴孚等人[50]構建了信息商品的價格特征模型,得到了使廠商利潤和消費者效用同時最大化的最優價格。孫玲芳等人[51]提出將用戶效用納入企業目標函數,并立足于客戶的版本偏好進行動態定價??姺借52]指出了消費者效用的影響因素,構建了定價函數。由于傳統的基于效用的定價多依賴于線性效用函數這一假設,而現實中,消費者的邊際支付意愿通常是遞減的。因此,周木生等人[53]提出了非線性支付意愿假設,并基于此構建了更具普適性的定價模型。此外,韓海庭等人[54]指出數據的價值在于其減少不確定性的決策效用,以“信息熵”進行了數據定價?;谛в玫亩▋r常以數據本身的特征、質量以及客戶感知價值為定價基礎,兼顧了數據本身的價值和消費者需求。如貴陽大數據交易所就將數據質量作為價格的決定性因素,數據質量包括數據品種、時間跨度、數據深度、數據完整性、數據覆蓋性和數據時效性6類。然而,在實踐中,由于大數據效用的預先客觀量化是十分困難的,此定價方法有待進一步的研 究。
(3)基于博弈論的協議定價
數據的共享性允許交易雙方以協議定價的方式促進成交量[8],這是目前應用最廣泛的數據定價方法[55]。劉洪玉等人[56]考慮了成本價格、商品特性以及買方價格承受能力等因素,建立了魯賓斯坦模型用于數據定價。張曉玉[8]給出了交易平臺、買方、賣方三方的靜態博弈過程,構建了討價還價模型,得到了數據均衡價格。趙森[57]在用成本法和收益法得到的價格區間內,通過“一對一”討價還價模型進行定價。陳俞宏[58]建立了基于機器學習的效用函數,用斯坦伯格博弈模型實現大數據定 價。此外,汪靖偉等人[59]指出,借助區塊鏈技術能實現數據市場的去中心化,減少第三方干預,實現買賣雙方直接交易,有助于協議定價的進一步發展。可以看出,協議定價方法的目標性和數據的針對性較強,溝通機會多,成交率高。但協議定價方法也存在一些弊端,首先,數據交易雙方漫長的博弈過程會增加時間成本,降低交易效率,如武漢長江大數據交易所通常需要長達數月的時間才能撮合一個交易[45],交易的時間成本極高;其次,數據領域的壟斷性導致賣方主導,忽視了數據的真實效用;最后,信息不對稱導致數據的真實價值難以評估,價格偏差會引發非法套利。另外,拍賣的定價策略能同時兼顧賣方利潤和市場原則,常用于不能進行廣泛傳播或買家想獲取一定獨占性的大數據產品,實施此模式的有貴陽大數據交易所等。基于此,陳志注等人[60]修改了傳統Vickrey拍賣模型和序貫拍賣定價模型,能在確定拍賣數量的同時實現收益最大 化。
(4)捆綁定價
數據產品的低邊際成本使得捆綁定價成為常用的銷售策略,作為版本定價的一種特殊形式,其包括純捆綁、不捆綁、混合捆綁3種類型[61]。如杭州錢塘大數據交易中心和數據堂等借助定制化或半定制化的數據交易模式,將多種互補或相互關聯的數據產品進行打包出售,以降低用戶支付意愿的分散度,獲得更多用戶剩余,占有更多市場份額[62]。但此方法可能導致用戶購入不需要的數據,損害消費者利 益。
數據資產現已成為企業的重要資產。其與無形資產有許多相似特性,如無實物形態、價值不確定性、時效性、非競爭性[63]等,因此,一些學者主張將成本法、收益法和市場法等無形資產評估方法沿用到數據資產中。
(1)成本法
在無形資產的評估中,成本 法是反映企業經濟效益的最基本方法[64]。其以生產費用價值論為理論基礎,將數據資產的重置成本作為其價值計量基礎,適用于市場不活躍的情況。劉玉[65]對數據的無形資產屬性進行了確認,認為對于企業外購和主動獲取的數據資產,應將成本法作為會計計量。成本法雖簡單易操作,但存在許多局限。首先,數據邊際成本趨近于零,且高固定成本難以實現單位產品均攤,數據成本量化難;其次,數據成本與價值之間的對應關系弱,僅靠成本并不能衡量其獲益能力,成本法估值偏低;最后,由于數據獨特的生產過程,數據資產不存在平均化的社會必要勞動時間,衡量數據價值不能僅考慮成本而忽視具體使用情境。此外,也有研究指出,數據資產難以計量的功能性貶值也是成本法的應用障礙之一[66]。
(2)收益法
由于數據資產不具有物理功能,其價值取決于其帶來的收益[67]。收益法是評估大數據資產價值的首要方法[7],以效用價值論為理論基礎,將待估數據資產的預期收益現值作為價值計量。此方法的前提是已知數據預期收益、折現率和效益期限,這也是該方法的障礙所在。首先,由于數據價值的不確定性,數據的效益依賴于數據處理技術等具體條件,預期收益難以量化;其次,信息不對稱導致數據難以得到不同主體都認可的合理價值,評估主觀性較大[68];最后,折現率的確定難度 大。鑒于此,目前多數企業將數據使用熱度作為收益的計量維度[69],具體指標有數據使用次數、調用頻數 等。
(3)市場法
市場法從市場獲取指標,考慮了市場供求,更具客觀性和公平性。以均衡價格論為理論基礎,參照市場上類似數據交易案例的價格,利用技術水平、價值密度、評估日期、數據容量等[70]可比因素進行修正,以得到待估資產價格。隨著數據市場的日趨活躍,市場法更具適用性[71]。但目前市場法仍然存在諸多挑戰。首先,我國的數據交易尚處初期實踐中,市場不成熟,交易案例少,且案例多為協議定價,主觀性強,參考性低;其次,大數據產品個性化程度高,難以尋找具有相似特性的交易案例;最后,修正系數確定困難,某些修正項(如數據質量)難以量化,且難以確保數據差異修正全 面。
(4)實物期權法
實物期權法適用于不確定性較大的無形資產,本質是對資產生命周期內的潛在價值進行動態評估。鑒于此,翟麗麗等人[72]建立了數據資產的B-S期權定價模型。但由于數據資產本身成本特殊、風險高、價值不確定等特點,期權模型并不完全適用于數據資產評 估。
多數學生自己做動作時,往往不轉身或轉身不充分,身體正對來球做擊球動作沒有利用協調轉身加速的力量。練習方法:原地做轉身,雙臂自然上舉前臂與上臂成90°做轉身挺胸動作,重復練習到下肢與上肢相協調使學生學會轉身挺胸動作,包括擲球游戲、蹬轉跳。
鑒于單一方法難以量化數據價值因 素,戴炳榮等人[73]指出應在無形資產評估方法的基礎上,考慮數據的價值密度、應用場景等因素,制定綜合定價方法。針對這個方面,黃樂等人[74]對成本法、市場法以及收益法的結合應用進行了初步嘗試。此外,考慮到數據資產本身的價值特征,一些研究者 指出數據資產的評估應體現其特殊性,需設置單獨的“數據資產”會計計量科目和專門的數據資產評估模型[75-76]。因此,張志剛等人[77]指出數據資產價值取決于其成本和應用,利用層次分析法構建價值評估模型。王建伯[78]則通過構建神經網絡 得到反映實際數據資產應用價值的客觀價格。
大數據定價這一研究領域由于研究時間較短,研究體系尚不完整。但隨著研究的不斷開展,也呈現出比較豐富的研究成果。從上述對國內外相關研究的梳理可以看出,按照對數據屬性的界定,大數據定價客體可被劃分為數據服務、數據產品以及數據資產3類。而定價方法上,以導向型定價法為理論基礎,大數據定價主要被劃分為成本導向、顧客導向、市場導向、利潤導向、基于生命周期5種定價類型。
● 成本導向型:以成本為依據,將成本補償放在首位的定價方式,多由賣方主導。包括大多數據服務定價,如固定費率、基于容量的定價、免費增值等;國內數據資產中的成本法等。目前較為主流的是國內的數據資產成 本法。
● 顧客導向型:以價值為基礎,將消費者對產品價值的理解和需求強度作為定價依據,強調從需求端考慮用戶效用,如國內外數據產品中基于效用的定價和國內數據資產中的收益法。關于基于效用的定價,國外文獻多從數據本身屬性出發,常將數據質量作為衡量用戶支付意愿和數據效用的指標,且能夠實現量化;而國內則更加注重用戶對數據價值的決定作用,研究客戶的感知價值,且大多在定性層面。此類型中國內研究較多的是數據資產中的收益法,而較先進的是國外基于質量的 定價。
● 市場導向型:以市場上相互競爭的同類型商品價格為定價依據,考慮市場供求狀況,在較成熟和活躍的交易市場中具有較強的適用性。國內數據產品中基于博弈論的協議定價和數據資產中的市場法定價屬于 此類型。
● 利潤導向型:以企業自身利潤最大化為目標進行定價。在大數據定價中主要表現為數據壟斷者針對客戶偏好和支付意愿實施的差異化定價,最大限度榨取消費者剩余的價值,如國外數據產品中的版本定價中基于查詢的定價,將同質的數據產品針對不同消費者制定不同的價格。這很容易引起“大數據殺熟”[79]的問題,在這里不 做闡述。
● 基于生命周期:根據數據在生命周期內的不同特點進行動態定價,如國內數據產品中的生命周期分階段定價、數據資產中的實物期權法等。由于數據本身的價值隨著時間會呈現較大的波動,動態定價法具有重大意義。
數據定 價方法分類 見表1。

表1 國內外大數據定 價方法
目前具有代表性的較主流的方法有成本法、協議定價、市場法、收益法、基于質量的定價方法以及基于查詢的定價方法6種,下面對這些方法進行對比分析,見表2。

表2 主流大數據定價方法 對比
前文對數據定價方法進行了對比,為今后合理地制定數據價格指明了思路和方向。為了更好地展現不同定價方法在不同視角下具有的特點及優勢,下面 根據前述定價方法的指導,初步構建一個確定價格區間在前、實施定價策略在后,考慮市場供求和價格反饋實時性的大數據定價流程,并且根據上述對定價方法的分類將定價流程劃分為需求、成本、利潤、市場、動態5個模塊,如圖1所示。首先,數據供應商進行數據供給的前提是數據的生產成本能得到充分補償,因此,基于成本導向法得到的價格是賣方避免虧損的價格下限。與此同時,需求對價格的決定性作用是不可忽視的。通過分析用戶自身的需求以及數據對用戶的效用,進而把握消費者的支付意愿,并據此來制定數據價格上限是必要的。在上述價格區間中,供應商可以通過進一步的定價策略來獲取最大利潤,這部分涉及的主要是版本定價、捆綁定價等利潤導向型定價方法。此外,隨著大數據市場日趨成熟,市場會根據供求狀況對價格發揮調節作用。此時,應將市場上其他同類數據的價格作為參考,因為只有當定價不高于市場價格時,該數據才具有出售的競爭力。上述4個模塊通常也適用于傳統商品的定價,而對于大數據還需考慮其價值的時效性,因此必須保證及時對數據進行定價并反饋,此處可以依據基于查詢的定價方法等。

圖1 大數據定價流程分析
大數據為企業帶來了機遇,同時也使其面臨更激烈的競爭環境、更分散的市場和更個性化的消費者偏好,數據定價成為企業獲取競爭優勢的關鍵。目前的研究主要依賴于一些特定假設,許多實際問題并未得到解決,如評估人員的主觀性和定價所需的實時性。國內研究還存在一些不足,今后可以從以下幾方面進行研究。
● 完善數據定價理論框架:鑒于單一的指標或模型在數據定價中存在的不足, 目前亟待構建一種考慮利潤、市場供求、數據產品特征和成本結構等的多指標體系,從而為數據定價提供可靠的支持。 數據定價應以成本導向的定價為價格下限,顧客導向的定價為價格上限,以市場導向的定價為價格參照,以利潤和消費者福利最大化為目標。在實際工作中,需根據大數據本身的價值特點,在數據經濟和產品定價以及資產評估的理論指導下,建立大數據定價的理論體系,綜合利用多種定價手段聯合進行,實現數據的科學客觀定價。
● 滿足多樣化和復雜化的用戶需求:針對用戶偏好的差異化定價將是大數據市場化發展的必然趨勢。 通過對潛在客戶進行問卷調查以及訪談等,對客戶的個性化需求進行深入分析,再借助捆綁定價、基于查詢的定價、基于數據類型的定價等方法,形成差異化的定價機制。
● 量化用戶效用:從更加長遠的角度來看,用戶效用不應該被忽視?;诖?,應注重數據的本身價值和用戶效用??蓪祿|量等數據特征作為用戶效用的度量指標,建立普適的、可解釋的數據質量評價體系和數據質量量化模型。
● 實現大數據動態定價。目前大多數定價方法為靜態定價,而大數據的價值是隨著時間波動的。為了提高實際性和合理性,可以假定數據價格是時間的函數。對于如何將價格及時反饋給用戶,可以通過創建在線數據查詢服務并開發相應模型來實現。
總體來說,大數據定價需要確定價格區間,然后通過各種定價策略,實現大數據市場的規范化和透明化。