摘 要:關于測量市場和消費者行為的方法,現(xiàn)有的研究大都是用李克特量表直接測量,然而這種方法有很多弊端,據(jù)此得到的調(diào)查數(shù)據(jù)質(zhì)量并不高。基于此,有學者發(fā)明了一種更加準確的方法——Best—Worst Scaling。文章主要介紹了Best—Worst Scaling方法的背景與內(nèi)涵、該方法的具體操作步驟、后期數(shù)據(jù)分析的方法以及該方法在各個領域的具體運用。
關鍵詞:市場;消費者行為;Best—Worst Scaling方法
中圖分類號:F713.5 文獻標識碼:A 文章編號:1008-4428(2018)05-66-02
一、 Best—Worst Scaling方法的背景與內(nèi)涵
Best—Worst Scaling方法是對成對比較法的一種改進,早在20世紀20年代Thurstone博士就建立了一套關于測度的理論方法,他將其稱為“比較性判斷準則”(Law of Comparative Judgement)。這套準則是讓被調(diào)查者將所有的對象進行兩兩比較,最終計算出每個對象的測量分數(shù),后來的學者根據(jù)這種方法的特點將其命名為“成對比較法”,但是這個方法實施起來效率比較低。
當時Thurstone博士任教于芝加哥大學,彼時芝加哥犯罪頻發(fā),學者們開始研究應該如何減少犯罪,如何量刑。Thurstone博士就非常關注量刑方面的問題,他選擇了19種當時比較常見的犯罪行為,以此來調(diào)查人們對這19種犯罪行為的嚴重程度的看法。一般來說,大多數(shù)人會選擇打分的方式進行測評,但Thurstone博士認為通過打分得到的結果往往差異化程度不夠,而且容易受到被調(diào)查者自身習慣的影響,因為有些被調(diào)查者傾向于打高分,有些則傾向于打低分。同樣,如果采用排序的方法,被調(diào)查者很難準確地完成排序。一般來說,當需要排序的對象超過7個時,被調(diào)查者就很難做出準確的判斷了,何況這里有19種犯罪行為。最終,Thurstone博士采用了成對比較法,將這19種犯罪行為進行兩兩比較,總共有171(19×(19-1)÷2=171)次成對比較。盡管這意味著需要花費更多的時間完成更多的問題,但被調(diào)查者并不會覺得乏味和困難,而且依此得到的數(shù)據(jù)分析會更加有效和準確,能獲得更有意義的具有顯著差異性的結果。
在此基礎上,F(xiàn)inn & Louviere于20世紀90年代初發(fā)明了Best—Worst Scaling方法,簡稱為BWS,又稱為Maximum Difference Scaling,被翻譯為最大差異測量。這種方法是讓被調(diào)查者分別從多組備選選項中指出“最好的”和“最差的”,然后研究者對其進行賦值,計算出每個對象的所得分數(shù)并進行排序,便可得出相應的結果。Best—Worst Scaling這種方法就不需要將所有對象進行兩兩比較,被調(diào)查者需要回答的問題數(shù)量也大大減少,這樣既保留了成對比較法的優(yōu)點,又極大程度地提高了成對比較法的效率。
二、 Best—Worst Scaling方法的具體操作步驟
在開始進行操作之前,首先需要下載一個輔助軟件,將需要比較的多個對象k進行分組。在此可以利用例如SAS、R等軟件,但其中最權威、功能最豐富、最容易使用和速度最快的軟件是Sawtooth Software。使用Sawtooth Software的MaxDiff模塊時,只需要輸入需要比較的對象列表,設置好相關參數(shù),軟件就會自動生成問卷。
下一步就是設置相關參數(shù),首先列舉出多個需要比較的對象k,由多個對象k組成“最好/最差”任務。一般來說,一個任務中包含3—5個需要比較的對象m,且要保證每個對象至少出現(xiàn)了3—5次。據(jù)此可以推導出一套MaxDiff問題中任務個數(shù)t的公式:3×k/m≤t≤5×k/m,根據(jù)這個公式,便可以快速確定所需要的任務數(shù)量。當然,BWS方法對于樣本量n也有要求,一般來說,必須保證各個對象出現(xiàn)的總次數(shù)不少于500次,即(n×m×t)/k≥500。假設在單個被調(diào)查者層面上每個對象出現(xiàn)至少3次((m×t)/t=3),那么需要的最小樣本量n為167(500÷3)。從實際角度來說,如果能夠保證每個對象出現(xiàn)3次的話,樣本量n設為200是一個比較可行的選擇。如果為了進行一些分組分析或人群細分分析,需要滿足每個組別或每個細分人群都能滿足上述條件。舉個例子來說,假設最終的細分人群為4—5個,且需要比較這些細分人群之間計算結果的差異,那么相應的樣本量應該是800—1000。最后,還有一個參數(shù)需要注意,就是MaxDiff問題的版本數(shù)。版本數(shù)越多,獲得的比較信息就越全面。但是,過多的版本數(shù)也沒有必要。一般來說,版本數(shù)控制在4—10左右。同時,每個版本對應的樣本數(shù)量不需完全一致。因為每個受訪者完成的Maxdiff版本是隨機派發(fā)的,這樣就可以保證每個版本對應的樣本數(shù)都非常接近。設置好以上參數(shù)后,Sawtooth Software會自動生成問卷。
在生成問卷之后,可以通過以下四個原則來判斷MaxDiff實驗設計的優(yōu)劣:①每個對象出現(xiàn)的次數(shù)均等;②兩兩對象同時出現(xiàn)的次數(shù)均等;③對象出現(xiàn)在每個任務中每個位置的頻率相等;④所有對象均可相連接。以上這4個條件實際體現(xiàn)了兩個核心要素——公平和效率。保證公平是為了測度結果準確,保證效率是為了節(jié)省時間和精力。如果不滿足“每個對象出現(xiàn)的次數(shù)均等”這個條件,將會導致“出鏡率低”的對象的測量誤差增大。“兩兩對象同時出現(xiàn)的次數(shù)均等”,這也是為了公平起見。“對象出現(xiàn)在每個任務中每個位置的頻率相等”,是為了消除位置因素導致的影響。因為人在觀察事物時,眼睛掃描對象存在一定的方向傾向,第一眼看到的內(nèi)容給人留下的印象往往更加深刻。所以,排在不同位置的對象往往會受到這種被關注次序的影響。“所有對象均可相連接”,這實際指的是成對比較信息的可傳遞性問題。假設只有2個Maxdiff問題,題目一需要在A/B/C/D中指出“最具影響/最沒有影響”的對象,題目二需要在“E/F/G/H”中指出“最具影響/最沒有影響”的對象。這時無論如何也無法推算這兩個題目的比較信息,因為第一題中4個對象的比較關系無法和第二題中4個對象的比較關系建立任何“連接”。
三、 Best—Worst Scaling方法的后期數(shù)據(jù)分析
談到數(shù)據(jù)分析,分層貝葉斯算法是目前被采用最多的方法,但這種方法比較耗時,且原理不太容易理解。相對來說,最簡單的分析方式是計數(shù)分析,該方法不僅容易理解,而且計算方便、簡單。因為分層貝葉斯算法和計數(shù)分析這兩種方法最后得到的結果并沒有顯著差異,所以使用計數(shù)分析方法進行數(shù)據(jù)分析會更加方便。
計數(shù)分析是指統(tǒng)計每個對象被選擇為“最好的”和“最壞的”的次數(shù),然后把前者的數(shù)值減去后者的數(shù)值就可以得到每個對象的偏好分數(shù)。比如:某個對象在其所出現(xiàn)的4個任務中均被選為“最好的”,則其偏好分數(shù)被記為最高分4分,如果在其所出現(xiàn)的4個任務中均被選為“最壞的”,則其偏好分數(shù)被記為最低分-4。一般來說,最后得到的偏好分數(shù)的分布會是正態(tài)分布,也就是說總會有少數(shù)幾個對象獲得高分,少數(shù)幾個對象獲得低分,盡量拉開最好和最差的區(qū)別,也即Maximum Difference。這也是為什么這種測度方法最終被命名為Maximum Difference Scaling的原因。
四、 Best—Worst Scaling方法在各個領域中的運用
BWS方法在全世界范圍內(nèi)得到了廣泛認可,最近由Marley & Louviere(2005)對其進行了詳細闡述。此后,該方法得到了廣泛推廣,多被運用在醫(yī)療保健、社會科學等多個領域(Cohen,2009)。
Auger、Devinney、Louviere(2007)采用了BWS方法,調(diào)查了超過600位來自六個國家的消費者對社會和道德問題態(tài)度的差異,結果表明,這六個國家的消費者對社會和倫理問題的態(tài)度確實有一些差異。但是總的來說,被調(diào)查者最看重的是:人權、童工、安全的工作環(huán)境、良好的生活環(huán)境;最不看重的是:回收包裝、使用動物副產(chǎn)品、使用可回收的材料、使用轉基因材料。
Lusk(2009)利用BWS方法來確定消費者的食品價值系統(tǒng)。文章編制了一個內(nèi)含十一種食物價值的表格,通過實證結果表明,在消費者看來,食品的安全性、營養(yǎng)、口味和價格是最重要的,而公平、傳統(tǒng)和原產(chǎn)地等食品價值是最不重要的。
Sun et al.(2009)在研究中運用了BWS方法,在北京的各大超市門口隨機采訪了超市購物者以及大學生,調(diào)查影響消費者購買葡萄酒的因素,調(diào)查結果表明,事先品嘗、葡萄酒產(chǎn)地和品牌是影響消費者購買決策的三個最重要的因素。
Louviere et al.(2013)在文章中舉了兩個運用BWS方法的實證案例,其中在第一個案例中,被調(diào)查者是420名悉尼、澳大利亞的居民,讓他們從6個備選旅游地中選出周末最想去度假和最不想去度假的地方,最終根據(jù)每個旅游地的得分將其進行排序,從而得出被調(diào)查者對這6個備選旅游地的偏好。
Costanigro、Deselnicu、McFadden(2016)列出了牛奶生產(chǎn)企業(yè)的九個維度的CSR活動,使用BWS的方法來評估消費者對牛奶生產(chǎn)企業(yè)的CSR活動的看重程度,最終發(fā)現(xiàn)消費者最看重的CSR活動是動物福利和可持續(xù)農(nóng)業(yè)實踐,而水資源的消耗與社區(qū)活動是最不看重的CSR活動。
總的來說,Best—Worst Scaling方法的應用非常廣泛,尤其是在企業(yè)社會責任的研究領域,克服了打分法、排序法、李克特量表在多個對象的比較方面的弊端,希望通過文章的介紹能為相關領域的研究提供一定的參考和指導。
參考文獻:
[1]MARLEY A A J, LOUVIERE J J. Some Probabilistic Models of Best,Worst, and Best. Worst Choices[J]. Journal of Mathematical Psychology,2005,49(6):464-480.
[2]COHEN E. Applying best.worst scaling to wine marketing[J]. International Journal of Wine Business Research,2009,21(1):8-23.
[3]AUGER P, DEVINNEY T M, LOUVIERE J J. Using Best—Worst Scaling Methodology to Investigate Consumer Ethical Beliefs Across Countries[J]. Journal of Business Ethics,2007,70(3):299-326.
[4]LUSK G. Food Values[J]. American Journal of Agricultural Economics,2009,91(1):184-196.
[5]SUN H, GOODMAN S, YU Y, et al. Chinese Choices:A Survey of Wine Consumers In Beijing[J]. International Journal of Wine Business Research,2009,21(2):155-168.
[6]LOUVIERE J, LINGS I, ISLAM T, et al. An introduction to the application of(case 1)best—worst scaling in marketing research[J]. International Journal of Research in Marketing,2013,30(3):292-303.
[7]COSTANIGRO M, DESELNICU O, MCFADDEN D T. Product differentiation via corporate social responsibility:consumer priorities and the mediating role of food labels[J]. Agriculture and Human Values,2016,33(3):597-609.
作者簡介:
張芳,女,湖南衡陽人,廣州工商學院工商管理系教師,碩士,研究方向:市場營銷、企業(yè)管理。