李婷婷
(河北省石家莊鐵道大學,河北 石家莊 050043)
眾包平臺是一種自主式服務的商業模式,用戶安裝APP后,可以領取相關任務,賺取酬金。使用者可以在上面瀏覽各種商業公司的相關信息,例如飯店的相關菜價、好吃與否等信息。在一定程度上,這種方式代替了問卷調查;而且其具有較好的真實性,實時性。
在眾包平臺中,核心問題是針對每個任務需要制定價格,在定價的過程中,需要考慮以下因素:
①考慮任務的位置、完成情況信息。
②還應該考慮到任務位置附近的會員信息,如其信譽度、經驗等因素,這樣才能對任務給出合理的價格。
③在具體場景中,對于地理位置相對較近的多個任務,可以打包進行發布。
首先需要對數據進行預處理,將經緯度轉換為XY坐標,由于位置經緯度中緯度和經度所代表的距離不相同,無法直接計算兩個位置之間的距離,所以先對經緯度進行了高斯投影變換,將經緯度轉化為X、Y值。利用Matlab導入會員和任務的位置X、Y坐標,利用兩層循環求位置之間的距離。在Matlab中,結合冒泡排序法對每一個任務的距離進行從低到高排序,求出最小的16個距離以及相應會員的榮譽值和預期任務限額。
通過對任務在地圖中的實際分布圖分析可知,任務的地點主要分布在四個城市,利用SPSS軟件對給定數據進行K平均值聚類,將數據分為四類。并且每一類都有周圍任務的數量、平均距離、最大最小距離等十二個影響因素,對每一類進行回歸擬合。
上述擬合過程已經考慮12個因素對價格的影響情況,還需對擬合結果進行調整,調整的目的主要有①將未完成的任務價格提高,從而吸引會員來完成該任務;②將已完成的任務價格降低,從而增加收益。
對于已經結束的任務,完成情況只有0或1,即未完成或者已完成。而對于新任務的價格預訂,應該考慮該任務被完成的可能性,進而引入成功率的概念。設某一個新任務周圍2.5km以內的任n務總個數為n,n個任務中已完成的任務個數為n1、未完成的任務個數為2,則成功率p=n1/n,這里引入成功率的基準p0值為80%,則調整的價格為Δm=(p-p0)×r。其中,r為價格變化與成功率變化的比值,求解擬合得到r=33.546。調整后的價格為m′=m-Δm,即m′=m-r×(p-p0)。
任務分布上,有的地點任務相對集中,用戶爭相選擇,對這種情況的考慮是將任務聯合發布。對于聯合發布,不僅可以提高任務完成的效率,減少完成任務所需的時間,而且還能促進任務的完成質量,提高任務的完成率。
對于任務打包聯合發布的情況,首先考慮對哪些任務進行打包,然后考慮如何進行打包,最后如何為打包后的任務包進行定價。基于上述考慮,選擇任務打包時,主要通過選擇相距較近的任務來進行打包發布,即對于給定任務A0,對其周圍的任務iA距A0的距離D0i進行判斷,若D0i小于一個給定標度l,則認為該任務可以與給定任務進行打包,在上述標度l范圍內若存在多個任務,則一起打包發布;若A0周圍l范圍內不存在其他任務,則該任務不進行打包,直接帶入原定價方案。對于定價,考慮的主要因素是包內各個任務之間的距離關系,采用包內平均距離Dj來衡量,若Dj較小,認為該包內任務都相距較近,完成起來更快捷、方便,所以相應的整包價格也會比相應的包內任務價格之和Sj要降低;反之,Dj較大,則認為包內任務相距相對較遠,完成起來更費時、費力,整包價格則會相應上漲,最終給出合理的定價方案。對于給定任務Ai(i=1,2,3...,n)依次與其他任務Aj進行距離的對比,若有對應Dij<l,則將Aj歸入Ai所在包,若不存在Dij<l,則Ai不進行打包。
在每個打好的包中,可以求得包內任務的平均距離(t為包的編號)和包內的所有任務價格之和St,對于平均距離,給定參考值D0=300.5(當=D0時,St即為該包的定價Mt),存在如下調節關系:Mt=St+(Dt-D0)×β×t,Mt即為該打包任務的定價。β為調節系數,值為0.03。
①經度和緯度每一度對應的距離變化不同,所以采用高斯投影將經緯度轉換成XY坐標,使得模型更為準確。
②在對價格的影響因素研究中,通過相關行分析,篩選出相關性較小的因素,模型擬合結果合理可靠。
③打包時,確定出打包的范圍較為合理;并且在定價時,使用平均距離判斷包內任務的分散程度。
本文通過利用聚類、回歸擬合等方法對數據進行數據挖掘,將打包理念融入定價方案得出最終的定價方案。對于經緯度進行高斯投影變換,提高了準確度。對于未完成的任務,引入調節系數,進一步合理地定價,提高了完成率。