何洪亮,趙 珂,王子群,婁貴紅
?
基于層次分析與多元曲線擬合法的眾包任務定價模型研究
何洪亮,趙 珂*,王子群,婁貴紅
(昆明理工大學城市學院,云南 昆明 650051)
作為影響眾包任務完成率的重要因素,眾包任務定價受到眾包任務決策者的高度關注,成為了眾包過程中的重要難題。針對眾包任務定價過低將直接導致任務接單率低下,而任務定價過高則會增加任務發布者的支出成本的定價難題,本文提出了一種基于層次分析法和多元曲線擬合法的眾包任務定價模型,研究了會員密度、會員至任務之間的距離、任務地理位置、經濟發展水平以及交通情況五個主要因素對眾包任務定價的影響情況,并通過概率統計分析論證了眾包任務定價與任務完成率之間的線性關系,為提高眾包任務完成率提供了理論方法。實驗表明該模型適用于各類任務發布地區,具有普遍的適用性,能夠幫助決策者制定出合理的任務定價方案。
眾包任務完成率;層次分析法;多元曲線擬合;定價模型
隨著經濟全球化和網絡科學技術的發展,近年來以自由、開放、創新、共贏等作為主要特點的眾包模式受到了國內外企業的歡迎。眾包模式對企業起到降低成本、提高生產效率、優化企業結構和提高公司競爭力的作用[1-2]。美國《連線》雜志記者杰夫·豪(Jeff?Howe)在2006年6月首次提出了眾包的概念:指一個機構或公司把過去由正式員工執行的任務,以自由、自愿的形式外包給非特定的網絡大眾去完成的做法[3-4]。眾包模式包括任務發布者、眾包平臺和任務執行者三大主體,由任務發布者通過眾包平臺發布需要被完成的眾包任務并設定任務的價格,由大眾網民構成的任務執行者來接單完成任務并獲取相應的酬金,眾包平臺是整個眾包模式的中間樞紐[5-6]。
眾包任務定價作為影響任務完成率的重要因素,受到了任務自身屬性、任務發布地經濟水平、交通水平、會員密集程度等因素的影響。歷史研究中,Pengkun Wu等[7]提出了一種實時空間眾包(RB-TPSC)任務包分配模型,其目標是提高任務完成率和最大限度地滿足預期預算,該模型為任務尋找最佳的任務執行者同時考慮了針對不同任務執行者任務定價問題。陳逸凡等[8]研究了一種基于多元回歸的眾包任務定價規律,采用聚類方法為各個地區制定了針對性的定價模型。Umairul Hassan等[9]提出一種基于組合分數編程方法的距離可靠性比(DRR)算法,能最大限度地提高任務可靠性并最大限度地減少空間眾包中的差旅費,以減小眾包的支出成本,該算法可將價值成本降低80%。Chunyan Miao等[10]提出了一種用于空間眾包的預算意識任務分配法(Budget-TASC),幫助決策者為(1)應向誰分配任務;(2)應向任務執行者付多少錢;(3)何時停止尋找額外的工作人員完成任務這三個問題提供了解決方案,其中的第二點研究了眾包任務定價策略。
本文針對眾包模式中的定價模型進行研究,重點對眾包任務發布者新區首發任務和已發布任務地區的增發任務的不同的定價需求進行了相關探索,以得出更為合理的定價模型,既能充分保障任務發布者的經濟利益,又可以提高眾包任務的完成率。
經過市場調查,本文選取集中分布于廣州、深圳、東莞和佛山市四個地區的“拍照賺錢”眾包任務數據進行研究,包括1877組會員數據和2901組任務數據。研究數據字段主要集中于:會員位置(經度信息和維度信息)、會員預定任務限額、任務經度信息、任務維度信息、任務標價和任務執行情況。

圖1 眾包任務地理位置圖
眾包任務完成情況除受任務定價影響外還受任務分布地的經濟、交通以及人口密度等因素影響,為進一步研究不同因素對任務定價的影響情況,將眾包任務分為已完成和未完成兩類,利用MATLAB軟件以經度和緯度為坐標將任務點和會員點繪制在圖2中。
采用聚類分析法對各區域完成任務情況進行分析,可見已完成任務和未完成任務在不同區域的分布情況存在明顯差異:A區會員密度較高任務完成率較低;B區會員密度低任務完成率較高;C區會員密度高任務完成率低;D區會員密度較低任務完成率高。

圖2 眾包任務分區圖
(1)整體分析
綜合考慮總體任務的數據信息,其中任務點的分布為離散變量,利用求取總體任務點價格的平均值和方差的方法來對任務定價進行離散概率研究,眾包任務定價平均值、方差的計算公式如公式(1)、(2)所示。


為進一步準確分析出任務定價對任務完成情況的影響,引入任務完成率來表征任務定價對任務完成情況的影響程度,如公式(3)所示。

計算總體任務的定價平均值和定價方差,如表1所示。
表1 總體任務的定價平均值和定價方差

Tab.1 Pricing averages and variances for all tasks
(2)局部分析

在四個區域間比較定價平均值和任務完成率可得:區域的任務定價平均值越高,任務的完成率也越高。對各區域間進行比較分析之后,再對A、B、C、D四個區域進行內部分析,數據計算結果如表3-6所示。
表2 各區域的任務定價平均值和任務完成率

Tab.2 Average task price and task completion rate for each region
表3 A區域內部對比圖

Tab.3 Internal comparison chart of area A
表4 B區域內部對比圖

Tab.4 Internal comparison chart of area B
表5 C區域內部對比圖

Tab.5 Internal comparison chart of area C
表6 D區域內部對比圖

Tab.6 Internal comparison chart of area D

經過1中的整體和局部分析均可知,任務定價是直接影響任務完成率的重要因素之一,任務定價的適當提高可增加任務的完成率,但任務定價過高又將直接增加決策者的投資成本,尋找到兩者兼顧的合理定價是定價模型的關鍵。此外,眾包任務定價直觀上還受到任務點所處地理位置的影響,實際中地理位置因素對定價的影響程度是任務發布地經濟水平、交通水平以及人口密度等因素綜合作用的結果。
針對未曾發布過任務的新區域,決策者應當綜合考慮經濟水平、交通水平、人口密度、位置等因素對眾包任務定價的影響,制定出合理定價以保證任務的完成率,對于發布了任務但未取得理想效果的區域也可當作該類新區域處理。針對已經發布了眾包任務的地區,經濟、交通水平、人口密度等因素短期內不會發生較大變化,眾包任務決策者可參照該地區已取得理想效果的眾包任務,直接據眾包任務的經緯度變量為增發任務制定出合理定價。
眾包任務定價除了受自身經緯度影響外,同時還受到會員所處地經緯度的影響。對于新任務發布區域,已注冊會員區與新任務區的距離是影響新發布任務完成率及完成效率的重要因素。若新任務發布區域之前沒有會員積累,新發布任務需要等待該區域有會員積累后才可能被執行,這將嚴重影響任務的完成率。這種情況下,決策者在盡量減小新任務被執行的客觀阻力的同時,應當采取新的任務定價方案,以增加已存在會員前往執行新發布任務的概率,提高新任務被執行的可能。
文獻[12]總結了過去20年層次分析法取得的相關研究,指出了層次分析法靈活、廣泛的實用性和主要應用領域。采用層次分析法研究眾包任務定價同時受到任務經緯度和會員經緯度的影響,任務經緯度和會員經緯度對任務定價的影響程度是會員密度、任務距會員之間的距離、地理位置、當地經濟發展水平以及交通情況綜合作用的結果。構建層次分析圖如圖3所示。

圖3 定價層次分析圖


Step2:對平均隨機一致性指標進行查找所得結果如表7所示。

表7 平均隨機一致性指標

Tab.7 Average random agreement
表8 任務、會員經緯度與定價的成對比較矩陣

Tab.8 Pairwise comparison matrix between price and task location and membership location

同理可得C層各因素對B層任務經緯度和會員經緯度兩個準則的權重。C層各個因素對會員經緯度和任務經緯度的權重結果分別如表9和表10所示。
根據C層各因素對B層因素的影響權重以及B層因素對O層因素的影響權重,可得到方案層對目標層的組合權向量為:

表9 C層各因素會員經緯度的成對比較矩陣

Tab.9 Pairwise comparison matrix between C-level factors and membership positions

表10 C層各因素任務經緯度的成對比較矩陣

Tab.10 Pairwise comparison matrix between C-level factors and task locations

并進行組合一致性檢驗,結果如公式(8)所示。

表11 各影響因素的權重

Tab.11 The weight of each influencing factor
可得任務發布地的會員密度、任務距會員之間的距離、地理位置、當地經濟發展水平以及交通情況對任務定價的影響系數分別為0.1744、0.0630、0.1605、0.1639和0.4383,可見不同因素的影響系數各不相同,其中交通情況對任務定價的影響程度最大,距離因素對任務定價的影響程度最小。
由此決策者可充分調研不同地區的以上五個因素的實際數據,并與本文研究區域的數據進行比較,根據各影響因素的變化程度以及各影響因素所占權重系數來為已經發布未被執行或者還未發布的任務制定出合理的定價。
眾包任務定價的直觀影響因素是任務發布地的地理位置。對于已經取得理想效果的眾包任務,發布者近期欲在該區域增發同類任務時,可直接根據任務點的經緯度以及每個任務的定價分析任務的定價規律。將任務點的地理位置經度和維度作為兩個影響因素,基于多元曲線擬合[8]計算這兩個影響因素對任務定價影響程度的權重系數,如公式(9)所示。



決策者在未知其他影響因素及其權重系數,欲在本區增發任務時,可依據公式(10),根據眾包任務需發布的實際地理位置的經度和維度信息,制定出初步的任務定價方案,在首批任務獲得反饋信息后再進行相應調整即可獲得較理想的任務定價。
本文通過對眾包任務市場數據進行挖掘和分析,采用概率統計方法論證了任務定價和眾包任務完成率之間的線性關系,采用層次分析法和多元曲線擬合構建了為新區首發任務和已取得理想結果地區增發任務定價的兩種不同需求的眾包任務定價模型。通過選取該地區2066組任務數據進行模型定價實驗,無論是基于新發任務定價模型和已發布任務的增發任務定價模型都取得了較好的結果,其中通過新發任務定價模型制定定價的任務整體任務完成率達到了76.61%,而應用增發任務定價模型發布任務的整體任務完成率為71.27%,遠大于原始完成率63.59%。實踐應用證明本文提出的定價模型能有效激勵眾包市場,適用于不同的任務發布地區,能夠幫助決策者制定出合理的定價方案、提高了任務完成率。但論文僅研究了影響定價的數個主要因素,未能研究影響定價的更多因素,可在未來的研究工作中繼續完善。
[1] 張利斌, 鐘復平, 涂慧. 眾包問題研究綜述[J]. 科技進步與對策, 2012, 29(06): 154-160.
[2] 馮劍紅, 李國良, 馮建華.眾包技術研究綜述[J]. 計算機學報, 2015, 38(9): 1713-1726.
[3] Howe J.The rise of crowdsourcing.Wired magazine, 2006, 14(6): 1-4.
[4] Howe J. Crowdsourcing. New York: Crown Publishing Group. 2008.
[5] 趙江華, 穆舒婷, 王學志, 等.科學數據眾包處理研究[J].計算機研究與發展, 2017, 54(2): 284-294.
[6] 嚴宏基, 李兵, 詹偉, 等.基于眾包模式的POI數據采集方案研究[J].地理空間信息, 2017, 15(12): 41-44.
[7] Pengkun Wu,Eric W. T. Ngaib, Yuanyuan Wu. Toward a real-time and budget-aware task package allocation in spatial crowdsourcing[J]. Decision Support Systems[J]. 2018, 110: 107-117.
[8] 陳逸凡, 陳碩, 劉婉靜, 等. 基于多元回歸的眾包平臺定價規律研究[J]. 軟件, 2017, 38(12): 279-282.
[9] Umairul Hassan,Edward Curry.Efficient task assignment for spatial crowdsourcing: A combinatorial fractional optimization approach with semi-banditlearning.Expert Systems With Applications[J]. 2016, 58: 36-56.
[10] Chunyan Miao, Han Yuc,Zhiqi Shena,Cyril Leung.Balancing quality and budget considerations in mobile crowdsourcing[J]. Decision Support Systems. 2016, 90: 56-64.
[11] 浦東平, 樊重俊, 袁光輝, 楊云鵬. 精英蜂群算法及考慮利益相關者的眾包定價模型. 計算機應用研究. 2019, 36(5).
[12] Ho, Williama, Ma, Xin. The state-of-the-art integrations and applications of the analytic hierarchy process. European Journal of Operational Research. 2018, 267(2): 399-414.
[13] 金曉溪, 李義鑫, 潘澤旭. 互聯網“自助勞務”眾包平臺下的定價模式研究[J]. 經營謀略, 2018, 1: 171-172.
[14] 盛驟, 謝式千, 潘承毅, 概率論與數理統計[M]. 浙江大學: 高等教育出版社, 2009.
[15] 陳瑞澤, 周正, 朱力. 眾包平臺的任務定價規律模型[J]. 經貿實踐, 2017, 21: 308.
[16] 張瑾. 基于層次分析法的個人信息安全評估研究[J]. 價值工程, 2018, 5: 57.
Research on Crowdsourcing Task Pricing Model Based on Analytic Hierarchy Process and Multivariate Curve Fitting
HE Hong-liang, ZHAO Ke*, WANG Zi-qun, LOU Gui-hong
(City college, Kunming University of Science and Technology, Kunming 650051, China)
As an important factor affecting the completion rate of crowdsourcing tasks, crowdsourcing task pricing has been highly concerned by crowdsourcing task decision makers and has become an important problem in the crowdsourcing process.In order to solve the problem that low crowdsourcing task pricing will directly lead to low task ordering rate, and too high task pricing will increase the cost of task publishers. This paper proposes a crowdsourcing task pricing model based on analytic hierarchy process and multivariate curve fitting method, and studies the influence of five main factors on the pricing of crowdsourcing tasks. The five main factors are membership density, distance between members and tasks, mission location, economic development level and traffic conditions.Then, we use probabilistic statistical analysis to demonstrate the linear relationship between crowdsourcing task pricing and task completion rate.This paper provides a theoretical method for improving the completion rate of crowdsourcing tasks.Experiments show that the model is applicable to all kinds of task release areas, has universal applicability, and can help decision makers to develop a reasonable task pricing plan.
Crowdsourcing task completion rate; Analytic hierarchy process; Multivariate curve fitting; Pricing model
O212.1
A
10.3969/j.issn.1003-6970.2018.10.027
何洪亮(1996-),男,昆明理工大學本科生,主要研究方向:信號與信息處理、大數據挖掘。
趙珂(1978-),女,碩士,講師,主要研究方向:信號與信息處理、大數據挖掘。
何洪亮,趙珂,王子群,等. 基于層次分析與多元曲線擬合法的眾包任務定價模型研究[J]. 軟件,2018,39(10):139-144