劉忠青,昝道廣
(山東科技大學電氣信息系,濟南 250031)
“拍照賺錢”是基于移動互聯網下的一種自助服務模式,用戶通過下載并且注冊App成為會員后,可以在App上領取拍照任務來賺取App對任務所標定的酬金。相比傳統的市場調查方式,通過這種基于移動互聯網的自助式勞務眾包平臺來為企業提供各種商業檢查和信息搜集,能夠更加節省調查成本,并且能夠有效保證調查數據的真實性,且縮短了調查周期。因此APP成為該平臺運行的核心,而APP中的任務定價又是其核心要素。如果定價不合理,有的任務就會無人問津,而導致商品檢查的失敗。
根據附件中所給出的數據,由此考慮以下三個問題:
(1)通過研究附件一中項目的任務定價規律,分析任務未完成的原因。
(2)給出對附件一中的項目設計新的任務定價方案,并與原方案進行比較。
(3)在實際生活中,多個任務可能分布位置十分相近,導致用戶會爭相選擇,可以將多個任務組合在一起打包發布。請思考在該種情況下如何修改前面的定價模型,會對任務的完成情況帶來怎樣的改變。
(4)請設計出針對于附件三中的新項目的任務定價方案,同時評價定價方案的實施情況。
(1)假設任務定價不考慮所在位置經濟水平與交通因素。
(2)假設每個會員的位置信息、信譽度以及預定限額在完成問題四的新項目時不發生變化。
(3)假設問題三、四中同一類任務的定價相同。
首先進行數據清洗,剔除數據異常項,對附件一、二中的經緯度歸一化處理。利用GPSspg軟件將附件一中所有經緯度信息導入,查詢出已結束任務位置所對應的具體地點。考慮到附件一中任務定價和任務經度、任務緯度、每個任務到所有會員的平均距離有關,故假設任務經度、任務緯度、每個任務到所有會員的平均距離與任務定價之間呈多元線性關系進行分析,建立多元線性回歸模型進行定量分析。

圖1 歸一化處理結果圖

圖2 已結束任務地理分布圖
首先查閱文獻[1]得出由兩點的經緯度得出兩點的實際地理距離公式:

其中Δ為兩點之間的距離,λ1,λ2分別為兩點的經度,?1,?2分別為兩個點的緯度。利用Python得到每個任務到所有會員的平均距離:

y=ax1+bx2+cx3+ε
其中y表示每個任務定價,a、b、c指偏回歸系數,x1為緯度,x2為經度,x3為每個任務到所有會員的平均距離。
對附件一中的已結束任務選取前500個樣本進行分析。利用MATLAB軟件得出各個系數的值,所以多元線性回歸模型為:
y=68.6692+1.1129x1+4.4192x2-0.1818x3
R2=0.0239,F 統計量為 6.7809,p值為0.0002,誤差方差s2為19.9503。根據回歸模型,當p的值大于0.05時,表示所求的系數為合理,顯然所得的p<0.05,則根據數據建立的多元線性回歸模型成立。
綜上,該多元線性回歸模型可以定量的描述任務定價與任務位置以及平均距離之間的關系。因此,將此模型作為附件一中已結束任務定價規律的模型表示。
通過劃分任務定價區間,利用MATLAB、Excel得出以下結果圖和價格區間完成情況表得出任務未完成度與任務定的高低、任務的位置、會員的位置,以及會員的預定限額與信譽度之間的關系。

圖3 已結束任務分布圖

圖4 會員分布情況圖

圖5 定價區間[68,70.5]

圖6 定價區[68,70.5]

圖7 定價區間[71,73.5]

圖8 定價區間[74,85]
結合未完成原因分析,對會員到任務ti的距離li小于等于平均距離Li的每個任務到所有會員的平均距離為半徑的范圍內的會員的平均信譽度Cˉ與平均預定限額,并歸一化處理:
運用MATLAB軟件使用BP神經網絡模型,來建立任務定價與任務的經緯度、每個會員到任務的平均距離,以及平均信譽額度與平均預定限額的關系模型,分為輸入層、隱藏層與輸出層。

圖10 BP神經網絡模型構造示意圖
(1)輸入層
通過以上對附件一中的數據處理和優化最終得到513條任務完成度為1的數據,將其中的400條數據作為訓練集輸入,123條數據作為測試集輸入用于驗證關系模型的正確性。
(2)隱藏層
通過建立兩層隱藏層進行訓練,第一層為15個神經元,第一層為20個神經元。使用tansig(s)函數和purelin(s)函數對每個隱藏層的接收到的數據進行處理。
(3)輸出層
使用輸出層輸出任務定價的預測數據,即任務的定價值。
通過MATLAB運行訓練集的數據得到任務定價模型:
Y1=f2(f1(x1W1+b1)×W2+b2)
其中:

然后對神經網絡模型利用123條測試數據進行驗證,則得到以下結果:

圖11 數據擬合曲線圖
最后以300條任務完成度為0的數據作為輸入,得到一個新的定價方案為:

圖12 新價格方案任務價格示意圖
對附件一所有已結束任務進行邏輯回歸模型的建立,以任務經度、任務緯度、每個任務到所有會員的平均距離、每個任務的會員平均信譽值、以為自變量及任務定價為因變量,建立完成度回歸模型。將數據導入SPSS,得出完成度F模型:
F=1.21x1+3.219x2-0.098x3+0.013x4+0.095x5-9.24
式中:x1為任務經度,x2為任務緯度,x3為每個任務到所有會員的平均距離,x4為可能做該任務的所有會員的平均信譽值,x5為可能做該任務的任何會員平均預定限額。
利用F 模型僅對附件一中任務完成度為0的任務進行重新定價,得出重新定價之后的任務完成情況表

表1 重新定價完成情況比較
由表1可知,該方案的定價比原方案更合理,在一定程度在提高了任務完成率。
由于已結束任務分布十分密集,可以通過在同一時間點發布任務進行打包,即通過提高同一時間點打包發布的任務數目來降低競爭程度大小。通過聚類分析將任務劃分為k類,使k類任務中的每一類的發布時間相同。聚類分析的具體步驟如下:
(1)通過附件一得出已結束任務經度范圍屬于[22.49,23.87],已結束任務緯度范圍[112.68,114.49],分別在兩個經度、緯度范圍內通過Python程序隨機k次,得出k個初始中心經緯度位置(ci,bi)(i=0,1,2,…,k)。
(2)首先對每個任務在k個中心點中找出距離最近的中心點ki,則A0j任務屬于以ki為中心的一類。通過求出中心點ki與每個任務的中心點作為新的ki。
(3)然后再進行下一個任務的計算,重新進行第二步。將最后一個任務歸類完畢。得到每個任務類的中心點經緯度和每個任務的分類結果。
所有任務分為23類,通過將聚類得到23個中心點的經緯度(ci,bi),同問題二利用Python編程求出每類任務到所有會員的平均距離、每個任務到所有會員的平均距離、每個任務的平均信譽值,如下圖:

圖13 任務中心所求示意圖
再利用定價模型Y得出k類任務定價,假設每一類中的任務定價相同,即屬于第i類的所有任務定價均為zi,利用問題二中已求數據平均距離、平均信譽值、平均預定限額分別代入到問題二任務完成度模型F中,得出每類任務中的完成數目,得出附件一中已結束任務打包前后任務完成情況表以及每個任務中心點的定價方案:

圖14 任務中心定價方案情況示意圖

表2 打包前后效果分析圖
由表2可知,打包之后任務完成度提高了20.03%,所以通過在同一時間點內打包發布任務有利于提高完成度。
用Excel畫出新任務的分布,可以看出任務分布極其集中,這樣會使用戶爭相選擇,會嚴重增大會員的競爭激烈程度。故采用在同一時間點發布的原則進行打包,通過聚類分析分為K類,利用Python編程求出每一類任務的中心點的經緯度位置(ci,bi),并數據處理求解出可能做該任務的所有會員的平均信譽值、可能做該任務的所有會員的平均預定限額,進而運用定價模型Y得出每類任務定價,將K個定價分別代入F模型,得出K類中每類任務的完成個數,將K類所有的任務中心點,最后得出結果:

圖15 新任務中心定價方案情況示意圖

表3 新任務效果分析圖
本文通過研究已有的任務定價,分析未完成任務原因,在原基礎上改進任務定價方案,對任務進行打包分布,重新得出定價方案,應用于不同的任務定價中。經過驗證,改進后的任務定價方案提高了任務完成度。
[1]韓忠民.知經緯度計算兩點精確距離:科技傳播:2011,11.
[2]姜啟源,謝金星.數學模型,北京:高等教育出版社,2010,9,
[3]韓婷,王金寶.數學建模入門與提高,北京:國防工業出版社,2013,8.
[4]葉其孝姜啟源.數學建模,北京:機械工業出版社,2009,8.
[5]方道元,韋明俊.數學建模,杭州:浙江大學出版社,2011,2.