王 妍 朱家明 王欣宇 張一鳴
(1.安徽財經大學統計與應用數學學院,安徽 蚌埠 233030;2.安徽財經大學金融學院,安徽 蚌埠 233030)
當今社會,隨著移動互聯網的發展,各種基于網絡平臺的APP應運而生。“拍照賺錢”是移動互聯網下的一種自助式服務模式,用戶下載APP,注冊成為APP的會員,然后從APP上領取需要拍照的任務,便可賺取APP對任務所標定的酬金。這種基于移動互聯網的自助式勞務眾包平臺,為企業提供了各種商業檢查和信息搜集,相比傳統的市場調查方式可以大大節省調查成本,而且有效地保證了調查數據的真實性,縮短了調查周期,成為當下發展的一種新潮流。這種基于移動互聯網的自助式勞務眾包平臺,APP是該平臺的運行核心。而APP中,任務定價又是整個APP運行的核心要素。如果定價不合理,有的任務就會無人問津,而導致任務的失敗。因此筆者對“拍照賺錢”任務的定價問題進行研究,從而分析任務未完成的原因并設計一套新的任務定價方案。
本文數據來源于2017年全國大學生數學建模競賽B題中附件一:已結束項目任務數據;附件二:會員信息數據;附件三:新項目任務數據;2016年廣東省統計年鑒。為了便于研究問題,提出以下幾條假設:⑴假設題目中的數據全部來自于同一款APP,用戶不存在體驗感受上的差異;(2)假設所有會員領取的拍照任務均是親自拍攝所得,不存在他人遠程幫忙的可能;(3)假設每一位會員只有一個賬戶,不存在一位會員開設多個賬戶的情況;(4)假設在對所有任務進行區域劃分時,每一個任務都屬于某一區域內,不存在某一任務出現在區域邊界線上的情況。
為了探究任務定價規律與任務未完成的原因,首先為便于距離計算需將經緯度的坐標轉化為二維距離。其次需要對數據進行分類整理,結合數據可視化圖表探究任務點的分布規律與價格分布規律;繼而建立任務定價模型,在模型中引入決定價格變化的參數并對模型的優劣性進行驗證;最后對任務未完成的原因進行具體的分析。
2.2.1 經緯度坐標到二維距離的轉換
由于任務點與會員的位置信息都是以經緯度坐標給出的,而且任務與會員之間的經緯度差距不大,緯度主要集中在北緯22.49308312~23.87839806度之間,經度主要集中在東經112.6832583~114.4936096度之間,經緯度的差值過小,直接利用角度差表現距離會造成較大誤差。加之考慮到地球表面曲面性的特點,為了便于直觀地反映各個點之間的位置關系,需要參考GPS導航軟件中將經緯度轉化為實際直線距離的原理,把各個點的經緯度坐標轉化為直線距離[1]。原理如下:
地球赤道的周長是40075.04公里,則每度在赤道上的長度計算公式為:

結合位置點的經緯度坐標,任意兩點的距離計算公式為:

其中,A、B表示需要計算距離的兩個點,λ表示緯度,φ表示經度。
根據上述原理,利用MATLAB進行編程,分別得到任意兩個位置點之間的平面距離。
2.2.2 任務點的分布
首先為了實現數據可視化,便于直觀地看出結果,將任務點經緯度坐標批量導入地圖規劃軟件中(本文使用的是地圖無憂平臺),將全部任務點坐標標注在地圖上,得到平面圖如圖1所示。

圖1 任務點地理位置分布圖
從圖1任務分布圖中可以直觀地看出,所有的任務點都分布在廣東省,并且任務點呈現聚類趨勢,集中分布在廣州、深圳、佛山、東莞四個城市。對任務點的經緯度坐標進行聚類分析,得到四個任務點群體的中心坐標為:深圳(114.061355,22.629373)、廣州(113.252081,23.172494)、佛山(113.130199,23.034212)、東莞(113.755707,23.042726)。
2.2.3 任務點的價格分布
對附件一的數據進行整理。為便于計算,將23種價格分成四個分布區間,并得到如表1所示的各個價格區間任務的分布情況。

表1 任務價格區間分布
由表1可以看出,超過一半任務的價格集中在66~68價格區間內,68.5~75價格區間中的任務占38.6%,80~85價格區間的任務占總體任務的5%不到。
將不同價格區間的任務點分布反映在地圖上,得到如圖2所示的分布圖,其中紅色表示66~68價格區間的任務,藍色表示68.5~71.5價格區間,紫色表示72~75價格區間,黑色表示價格是80和85的任務點。

圖2 不同價格區間內的任務分布圖
從圖2可以看出:紅色的點集中在四個城市的中心區域,藍色和紫色的點沿道路向外分散在城市的郊區地帶,而黑色的點散亂分布,沒有明顯的分布規律。價格所呈現的特點為:任務集中在城市中心繁華地段時,定價會偏低,離市中心越遠,定價越高。
根據經緯度坐標,對價格高的點進行數據挖掘,發現價格高的點一般都是政府機構、銀行、高檔賓館和大型商貿城等,這說明價格高的任務可能與任務自身的難易與屬性有關系,并且數量較少,分布具有隨機性。
2.3.1 任務定價模型
根據上述對價格分布規律的探究,得出:任務的價格主要是受到任務點地理位置和任務自身的難度兩個因素的影響。將地理位置對任務價格的影響定義為某點的繁華程度,它受到人口密度情況和經濟狀況的綜合作用,不同城市具有不同的取值且越偏遠的地方取值越小。將任務自身難度定義為任務點的特征屬性,它的出現與否具有隨機性,所以特征屬性需要與隨機虛擬變量(0-1變量)結合使用。
現給出任務定價模型:

其中,P表示任務的價格,70表示基礎價格,
為城市繁華度帶來的價格變動,wj表示各城市由人口密度、GDP、人均消費水平等因素通過層次分析法得到的各城市繁華度權重,fij表示城市j對任務i的繁華度指標,g表示價格波動影響參數;λi為任務自身因素而帶來的價格變動,為0-1隨機變量且1出現的概率為5%,b為[0,20]的隨機數。
一個任務點的地理位置越靠近市中心,繁華程度參數越大,價格越低;當虛擬變量為1的時候,任務點因自身原因加價,價格越高。
2.3.2 模型的完善
首先,選取人均GDP、平均工資、人口密度、工業總產值這四個指標來衡量城市的繁榮程度。2016年的四個城市指標數值如表2所示。

表2 四個城市經濟與人口的指標數值
然后,使用層次分析法[3],將決策問題分為三個層次:目標層O、準則層C、方案層 P,每層有若干個元素,如圖3所示。

圖3 層次分析圖
其中,目標層:城市繁華程度。
準則層:人均 GDP、平均工資、人口密度、工業總產值。
方案層:廣州、深圳、佛山、東莞四個城市。
綜合實際經驗和參考文獻分析可近似得到以下系數:
a12=1:2,a13=1:3,a14=1:4,a23=2:3,a24=2:4,a34=3:4,
從而得到正互反矩陣:

經過MATLAB歸一化處理,得到標準化特征向量:
w=(0.2857,0.3571,0.1429,0.2143)
即四個城市的權值分別為:0.2857,0.3571,0.1429,0.2143。
其次,由于同一個城市不同的區域繁華程度也各有差異,任務點的分布主要集中在每個城市半徑30公里之內。通過對任務點價格的分析,發現價格在同一個城市呈現向外遞增的趨勢,而且繁華程度每五公里遞減一個等級(即每五公里價格遞減0.5單位),并且部分點落在兩個不同的城市任務圈內。
由于高價位任務分布存在隨機性的特點,且高價位的任務占總體的5%左右。按照固定的5%的比例,隨機設定高價位的任務點,即為0-1隨機變量且1出現的概率為5%,并設定他們的特征屬性值為[0,20]的隨機數。
根據模型參數設定規律,通過MATLAB軟件進行編程,對每個任務點利用上述任務定價模型進行定價計算,得到預測價格。由于數據過多,現給出部分任務點的原有價格與預測價格數據,如表4所示。

表4 部分價格預測值與原有價格的比較
2.3.3 模型的檢驗
為了能直觀地反映我們給出的任務定價模型是否符合原有規律,做出原假設:價格預測值與原有定價有顯著差異。利用SPSS將全部任務點的價格預測值與實際標價進行配對樣本的T檢驗[4],得到如表5所示的計算結果,結果拒絕原假設。

表5 成對樣本檢驗
(1)價位越高,完成率越低。根據表1任務價格區間分布情況可以看出,任務價格在65~68區間內完成率為46.61017%,完成率最高。價格越高,完成率反而低,這可能與高價位任務難度大,地理位置偏遠,鮮有人特意為完成任務而到達某地有關。
(2)人均收入越高,完成率越低。結合已完成任務與未完成任務分布點的分布圖 (如圖4,紅色方塊表示未完成,紫色方塊表示已完成),可以看出東莞的任務完成率最高,廣州和佛山次之,深圳的任務完成率最低。綜合考慮城市的人均經濟水平與邊際生產力分配理論,發現人均收入越大的地方,對任務的執行率越低,即任務是否完成與地區的人均收入有關。

圖4 已完成與未完成任務分布圖

圖5 會員與未完成任務分布圖
(3)任務區域內會員數量越少,完成率越低。通過對比未完成任務點的分布及會員位置的分布,不難看出,有些區域任務完成率低與會員分布稀少緊密相關。在局部地區軟件推廣不足,會員注冊人數較少,導致任務未完成,如圖5所示(其中紅色圓點表示未完成的任務分布,藍色星表示會員分布位置)。
(4)任務附近會員的信譽值越低,完成率越低。為了比較會員之間的差異,首先根據會員信譽值的大小將會員粗略地分成四類,然后根據四種不同的等級會員分布情況對比任務未完成點的分布圖,發現低等級會員分布越集中的地方任務未完成率越高,如圖6所示(灰色星代表會員信譽度較低的會員分布點,紅色表示未完成的任務分布)。

圖6 會員等級分布圖
首先綜合考慮會員的各項指標建立模糊綜合評價模型,將會員分成不同的等級,并賦予每個等級不同的數值,在原有的定價模型上加上會員等級這一新的影響因素。此時會員等級越高,可完成的任務數量越多,單價越低。最后利用所得的綜合得分對會員進行分級,再結合每一位會員的GPS經緯度,便可得到四個城市會員的分級情況。
附件二中給出的會員指標存在多個,故先利用熵值法[3]對會員的幾個指標計算權重。
構建原始指標矩陣。假設有m個會員,n項指標,則原始指標數據矩陣為:

為了消除各評價指標的量綱影響,需對原始數據進行無量綱化處理。對于正向指標,計算方法為:

對于負向指標,計算方法為:

式中:Xij為無量綱化后的數據值,maxXj和minXj分別為j項指標的最大值和最小值。
對無量綱化后的數據進行歸一化處理,方法為:

式中:gj為差異性系數,ej為熵值。
選取附件二中會員的預定任務限額、預定任務所需時間、信譽值這三個指標,經過MATLAB軟件編程,得到權重矩陣為:
w=(0.3371,0.6271,0.0358)
在附件二中,代入求出第i項指標的權重,求出每一位會員的綜合得分,以此來對會員進行分級,得到各個等級會員的數量。再結合每一位會員的GPS經緯度,可得到四個城市會員的分級情況,結果如表6所示。

表6 各城市各等級會員數量百分比
原有的任務定價模型為:
P=70+g(wj·fij)+λib
結合問題一中對任務未完成原因的分析我們可以發現,會員的數量和信譽值均會對任務的完成率產生影響,而原模型中并未考慮到會員的影響因素。考慮到附件二中會員的信譽值和完成任務的時間等指標,以及上文得出的會員在各個城市的分布情況,因此需從會員的質與量兩個方面進行分析。
設j地區第i個任務會員的影響度為 hij,I是對應的價格影響參數,各城市權重為設改進后的任務定價模型為:
P=70+g(wj·fij)+I(wj·hij)λib
經過新的模型求解,得到新的定價方案部分如表7所示。

表7 部分任務點新預測價格的數值
通過表7可以看出,已完成任務的新舊定價差別不大,說明定價合理;未完成任務的新定價方案大多都高于原價格,推測對任務完成情況有利,綜上所述,新的定價方案優于原定價方案。
改進后定價計算公式:

其中g和I分別為繁華度和會員因素對價格波動變化的修正參數,wj·fij和 wj·hij為城市 j分別對任務i的繁華度指數和會員綜合指數,將地區對任務的兩種因素指數作為自變量,變動范圍在[0,10]、[0,5]之間,最終定價視為因變量,隨機變量λ取0,任務的定價方案取經緯度為113.9356769,22.51592012的定價為65.75。針對I和g的不同取值,運用MATLAB軟件編程進行靈敏度分析,得到結果如圖7所示。
由靈敏度分析可知,在價格變化出現波動時,等量的對應因素修正參數所引起的價格變化很小。故此次靈敏度分析效果較好,即兩種因素對價格變化的波動參數對最終價格的影響很小。

圖7 靈敏度分析圖
本文的突出特色是運用數據可視化和定性數據定量化分析。前者將GPS經緯度轉化為平面地圖上多個點的分布,能更簡便、直觀地對數據進行觀察分析;后者將影響價格的不同因素定量化處理,能更直接地對定價產生影響。本文模型的應用背景是基于智能手機和移動互聯網的勞務眾包平臺,如外賣應用、滴滴打車、快遞跑腿服務平臺等都涉及到商品定價與地理位置、會員積極程度的關系,以上各模型在建模過程中通過相應的軟件檢驗,具有一定的合理性。