宋金倍
(南京大學 信息管理學院,江蘇 南京 210046)
信息技術的發展給我們的生活帶來了極大的便利。電子商務的興起就是信息技術改進人們生活的顯著代表之一。電子商務平臺連接賣家和買家,向消費者展示商品詳情、價格、評價等信息,以供消費者進行挑選,使人們可以足不出戶地購買來自世界各地的多元化商品。根據中國互聯網絡信息中心發布的《中國互聯網絡發展狀況統計報告》,截至2020年3月,我國擁有7.10億的網絡購物用戶規模,在網民整體中占據78.6%[1]。電商平臺連接消費者和商品,提高人們對生活水平。電商平臺的檢索系統匹配用戶需求和商品,關系到用戶是否能便捷地獲取想要的商品,檢索系統的水平與用戶體驗息息相關。
相關性是對生活世界進行研究的重要問題,它意味著探究個體如何理解他們周圍的物體和事件[2]。在信息檢索領域,相關性是指檢索結果和用戶需求之間的關聯程度,是評估信息檢索系統功能和效果的重要指標,是信息科學領域的重要研究范疇,也是情報學基礎的、核心的概念[3]。相關性判據研究影響用戶判斷相關性的因素,是相關性研究領域的重點之一。
目前的相關性判據研究主要集中在對文本、音頻、視頻等媒介的相關性判據研究,而對電商這一新形勢下的新平臺的檢索相關性判據研究有著重要的理論意義和實踐價值,但相關研究比較少。因此,本文通過文獻調研、訪談法、扎根理論等多種方法,以淘寶為例,探析電子商務平臺的相關性判據,構建淘寶商品檢索相關性判據理論框架模型,為消費者系統性地了解自己選擇商品時的判斷標準,以及電商平臺的優化改進提供參考。
美國計算機學家Van Rijsbergen認為,信息檢索是指檢索得到所有的相關性文獻和盡量少的不相關文獻[4]。隨著信息技術的飛速發展,信息檢索是信息活動乃至日常生活中的重要組成部分,人們對信息檢索提出更高、更多元的要求[5]。隨著信息檢索的發展,用戶檢索與查找結果之間由直接匹配轉變為相關性衡量,相關性成為信息檢索發展中的重點概念。
總體來說,相關性研究分為兩類,分別是面向系統的相關性和面向用戶的相關性。面向系統的相關性主要指用戶提交給信息系統的檢索請求和信息系統反饋的結果文檔之間的相關關系;面向用戶的相關性則指用戶的信息需求和檢索到的結果文檔之間的相關關系[6]。隨著網絡信息資源的迅速發展,網絡成為信息用戶的主要信息檢索環境,網絡環境、語義視角、面向用戶需求、用戶行為的相關性實證研究[7]成為相關性領域研究的重點研究方向。
面向用戶的信息檢索相關性研究主要探索用戶判斷檢索結果與其需求之間關聯程度的方法和影響用戶的相關性判斷的因素。Saracevic[8]認為,面向用戶的信息檢索相關性研究分為相關性線索、相關動態性、相關性反饋。其中,相關動態性研究相關性判斷標準隨時間的變化;相關性反饋研究個性化服務、用戶交互等[9];相關線索即相關性判據(relevance criteria),研究用戶如何判斷信息相關性,探析用戶判斷信息相關性的影響因素[10]。
自20世紀90年代以來,相關性判據研究進入學者的視野,這些研究大多采用訪談、案例研究、實驗等方法。早期的相關性判據的研究主要基于學術信息環境,研究學者關于學術信息資源的相關性判據。進入21世紀后,網絡環境和多媒體信息資源等方面的相關性判據研究逐漸增多。
相關性判據的研究大多從圖片、視頻、音樂等多種信息資源類型出發,探索其信息資源檢索過程中用戶判斷相關性的依據。例如,Choi等[11]對38名參與者進行圖片檢索測試,使用了測試前和測試后兩種類型的相關性標準問卷,對圖像用戶在進行相關性判斷時應用標準的調查,發現話題性是信息尋求階段最重要的因素,圖像質量和清晰度也很重要;Albassam等[12]通過30名參與者的自然主義日記,研究YouTube用戶如何判斷視頻在休閑環境中的相關性,研究得出以主題性為最主要標準的視頻相關性標準,并總結休閑環境中的視頻相關性標準與普通的相關性標準較為相似,但也產生與休閑環境相關的新標準;Inskip等[13]對音樂檢索專家的音樂檢索進行實驗,并使其判斷搜索結果和查詢請求之間的相關,以此研究用戶檢索音樂時的相關性判據,發現文本檢索系統的相關性判據和音樂檢索系統的相關性判據存在聯系。
除了對各種不同類型的信息資源的相關性判據進行研究外,也有學者對信息檢索的相關性判據進行更細致的研究,例如面向檢索的不同階段、不同任務復雜性、不同人群、不同性別下的相關性判據研究。例如,成穎[14]通過內容分析和相關性研究,發現任務復雜性明顯影響用戶對相關性判據的選擇,而性別的影響比較微弱。
目前,相關性判據主題的研究涵蓋學術資源、網絡資源、休閑環境、日常生活、新聞網站、社交平臺等多個領域,文字、圖片、音頻、視頻等多種媒介形式。電商平臺商品檢索的相關性研究與上述各領域和媒介形式的研究有一定的共同處,但也有以商品作為檢索結果獨有的特征。目前很少有研究從用戶角度探索電商系統的相關性判據,筆者基于文獻調研、訪談法、扎根理論等方法,以淘寶為例,探析電子商務平臺的相關性判據。
筆者根據相關性判據已有的理論基礎和研究成果,結合扎根理論研究方法,選擇研究對象,擬定訪談提綱,進行訪談,并將訪談記錄整理為文字,作為本文開展扎根理論分析的基本資料。
本次訪談對象為在讀大學生群體,并有淘寶信息檢索經歷。在進行訪談時,圍繞“影響淘寶檢索結果排序的因素”以及“影響個人判斷淘寶檢索結果相關性的因素”開展,以訪談提綱為基礎進行直接提問和假設提問,充分挖掘被訪者觀點?;谖墨I理論研究和生活經驗,筆者擬定訪談問題提綱如表1所示。

表1 淘寶商品檢索相關性判據訪談提綱
由于疫情影響,本次訪談主要通過微信、QQ等線上社交平臺通信工具進行。訪談時間為2020年7月下旬和8月中上旬,共計對25名樣本對象進行有效訪談,樣本對象基本資料如表2所示。在訪談開始之前,提前向被訪者提供訪問提綱,并解答訪談對象對的問題,以便于訪談對象了解訪談主題,提高訪談效率;在訪談過程中,根據對話內容適時追問,進一步了解細節;在訪談結束后,經被訪者的同意,對訪談過程進行整理,將其轉化為文字資料,作為開展扎根理論研究的第一手數據來源。

表2 被訪者基本資料統計
質化研究即定性研究,主要指在自然情境的背景下,對被研究者的行為和思想進行觀察、訪談、文獻調查等,了解其中蘊含的知識規律內涵及意義構建的過程。質化研究與量化研究最大的區別是量化研究將數據轉化為標準化的數字代碼,而質性研究則是基于解釋學基礎,對資料進行歸納和整合,在分析過程中逐級提取概念,整合編碼。質化研究是一種整體性的研究視野,得到的研究結果是全面化的意義架構。
扎根理論是使用系統化程序,對某一現象歸納式地引導出扎根于實際材料的理論結果[15]的研究方法。扎根理論不是對假設或已有理論的驗證,在研究開始前不會提前先假設理論,而是直接分析原始資料,通過對原始資料的收集和分析,逐級提煉反映資料內容的核心概念,建立概念之間的聯系,對原始資料進行開放性編碼、主軸性編碼、選擇性編碼三步編碼[16],從下往上地構建理論。
扎根理論是一種基于質性研究的理論構建方法,主要應用于缺少理論支撐、新理論的體系架構不完善、既有理論缺乏合理性、原來理論在新環境下發生新變化等情境。
2.3.1 開放性編碼。筆者將25位訪談對象進行訪談的原始記錄轉化成相應文字,通過初步整理并剔除一些與本文研究主題不相關的內容,最終得到2萬余字的文本資料。從中選取20位的被訪者文本資料,對這些語句進行編碼分析和提煉,并進行歸類和貼標簽,以實現概念化、范疇化處理。剩余5位訪談者的文字資料用于檢驗理論飽和度檢驗。
扎根理論分析過程的第一步是對收集的資料進行開放性編碼分析,首先從資料中找出與相關性判據有關的詞語,將含義相同或相似的詞語進行合并,整理出現頻次在2次及以上的詞語作為初始概念以界定范疇,然后對各個概念進行對比分析和歸類,將各個概念歸類為多個范疇。筆者用A1…An對初始概念進行標注,再根據初始概念之間的聯系,進行提煉、歸類、合并,從相近的概念中提取出范疇,用B1…Bn進行標注。開放性編碼范疇化的結果如表3所示,共得到80個概念,合并為12個范疇。

表3 開放性編碼結果
根據開放性編碼結果顯示,影響用戶判斷淘寶商品檢索結果的相關性判據有店鋪描述、店鋪評價、商品描述、商品評價、商品熱度、用戶習慣、偏好預期、價格預期、主題預期、檢索方式、結果排序、系統評價這12個范疇。由訪談整體內容可得知,這些因素在淘寶用戶判斷相關性時起到重要作用,對用戶在淘寶進行商品搜索時的用戶體驗有著重要的影響。
2.3.2 主軸性編碼。在開放性編碼形成的基礎上,通過進一步分析、挖掘上述12個范疇之間的邏輯關系,以及綜合考慮其對行為動機的影響,利用主軸性編碼重新對其歸類,更注重因素的實質類別而非格式和形式。將B1店鋪描述、B2店鋪評價作為子范疇納入C1店鋪詳情主范疇,將B3商品描述、B4商品評價、B5商品數據歸于主范疇C2商品詳情,將B6用戶習慣、B7 偏好預期、B8價格預期、B9主題預期歸入主范疇C3用戶預期,將B10檢索方式、B11結果排序、B12系統評價總結為主范疇C4檢索系統。最終得到C1 店鋪詳情、C2 商品詳情、C3 用戶預期、C4 檢索系統4個主范疇,編碼結果如表4所示。

表4 主軸性編碼結果
2.3.3 選擇性編碼。扎根理論三步編碼中的最后一步是選擇性編碼,這個階段關鍵在于從所有范疇中歸納出一個核心范疇,利用整合圖式或者故事線將所有范疇串聯起來,構建新的理論[17]。通過對之前已確定的范疇進行深入分析,得到淘寶商品搜索的相關性判據的核心范疇,并形成故事線,可將其概括為:當用戶進行淘寶商品搜索時,根據店鋪詳情、商品詳情判斷相關性,并受到用戶預期和檢索系統的影響。選擇性編碼的典型關系架構如表5所示。店鋪詳情是指商品所屬的淘寶店鋪的情況,是淘寶商品搜索的相關性判據之一,包括店鋪描述、店鋪評價;商品詳情是指商品的基本情況,也是淘寶商品搜索的相關性判據之一,包括商品描述、商品評價、商品熱度;用戶預期有兩部分組成,是影響用戶判斷淘寶搜索結果的相關性的重要因素,①系統對用戶行為的預期,體現為系統收集的用戶習慣。②用戶的主觀預期,包括偏好預期、價格預期、主題預期;檢索系統是指用戶對檢索平臺的描述和評價,也是影響用戶判斷淘寶搜索結果的相關性的重要因素,包括檢索方式、結果排序、系統評價。

表5 選擇性編碼的典型關系架構
2.3.4 理論飽和度檢驗。在編碼完成后,需要對預留的文字資料以同樣的方式再次進行編碼分析,以驗證理論是否達到飽和。筆者對剩余的5份訪談記錄資料進行編碼分析,依次進行開放性編碼、主軸性編碼和選擇性編碼,對比有沒有新概念產生來進行飽和度檢驗,分析得到的結果中沒有出現新的概念和范疇,即文中所構建的淘寶商品搜索的相關性判據理論框架通過理論飽和度檢驗。
上文利用扎根理論進行淘寶商品搜索的相關性判據的研究,結果顯示,用戶在淘寶檢索商品時,判斷商品的相關性與店鋪詳情、商品詳情、用戶預期、檢索系統這4大因素有關。其中,店鋪詳情、商品詳情屬于用戶判斷相關性的依據,用戶預期、檢索系統屬于影響用戶相關性判斷的因素。店鋪詳情包括店鋪描述、店鋪評價;商品詳情包括商品描述、商品評價、商品熱度;用戶預期包括用戶習慣、偏好預期、價格預期、主題預期;檢索系統包括檢索方式、結果排序、檢索系統?;诖藰嫿ㄌ詫毶唐窓z索相關性判據理論框架,如圖1所示。

圖1 淘寶商品檢索相關性判據理論框架
3.2.1 店鋪詳情。在淘寶檢索平臺中,如果將商品看作信息檢索的結果,那店鋪就是結果的來源,檢索結果的來源直接影響結果的權威性和有效性。在淘寶購物的過程中,用戶和店鋪是交易的雙方,店鋪的質量和信譽直接影響到商品質量和用戶的購物體驗。在評價檢索結果的相關性時,用戶會考慮店鋪是否為旗艦店、店鋪粉絲數量、詳情展示頁等要素,也會考慮店鋪是否熟悉和店鋪評分等因素。關于店鋪詳情的相關性判據主要用于判斷店鋪的信譽,確認檢索結果中的商品的來源可信度。
3.2.2 商品詳情。商品詳情幫助用戶從檢索結果本身特征的角度判斷相關性。商品詳情范疇下的相關性判據主要是對商品本身的反映,包括商家對商品的描述,如品牌、款式、質量、尺碼、顏色、材質、品類、規格、產品參數、使用效果等以文字、圖片、視頻、直播等多種形式的商品描述,這是用戶了解商品信息最直觀便捷的途徑;也包括其他消費者對商品的評價,包括曬圖、追評、問答等形式,能更客觀真實地從消費者的角度獲悉商品的真實質量和使用效果;還包括以銷量為主要指標的商品熱度,銷量能夠幫助消費者進行商品挑選,因為一般情況下,暢銷商品在質量和價格上可以達到較好的平衡。商品詳情中的相關性判據直接從檢索結果特征的角度,影響用戶的相關性判斷。
3.2.3 用戶預期。用戶預期從用戶期望的商品和檢索結果之間的關聯程度中判斷相關性。用戶預期可以分為主觀預期和客觀預期兩類。主觀預期是從用戶的心里預期出發,包括個人偏好,例如商品檢索結果是否符合用戶的審美和喜好;包括價格預期,即商品的價格是否在用戶可接受的價格范圍內;也包括主體預期,即檢索結果是否符合用戶的需求。而客觀預期則是指系統提供用戶的瀏覽、購買、收藏等行為數據,通過算法研究用戶的習慣、愛好和需求,從而判斷用戶的預期,進行商品推薦,個性化推薦會對用戶選擇商品和判斷相關性產生影響。用戶預期從用戶的審美、價格預期等主觀偏好的角度,判斷檢索結果的相關性。
3.2.4 檢索系統。檢索系統從系統、算法和技術等角度輔助用戶進行相關性判斷。一方面,從檢索方式角度,淘寶平臺的檢索方式較為豐富,有主題關鍵詞檢索、商鋪檢索、圖片搜索、低價同款,也可以通過猜你喜歡等個性化推薦途徑獲取商品,用戶可以對結果進行篩選,但缺少模糊匹配、類目檢索、高級檢索等檢索方式。另一方面,對檢索結果的排序受主題相關度、商品熱門度影響,同時也會有廣告因素介入,冷門商品或復雜商品的檢索不方便。此外,對淘寶檢索系統,用戶認為其響應迅速、實時性高,個性化推薦做得很好,但又有用戶認為內容過多、信息量過大,對高級檢索和冷門商品檢索支持度低,也有用戶擔心網購平臺會存在個人隱私泄露問題。這些檢索系統相關因素都會影響用戶在檢索過程中的相關性判斷。
筆者基于淘寶研究電商平臺商品檢索的相關性判據,采用訪談法獲取研究對象對淘寶商品檢索的行為和對電商檢索相關性判據的觀點,使用扎根理論方法分析獲取的訪談資料,進行開放性編碼、主軸性編碼、選擇性編碼,構建淘寶商品檢索相關性判據理論框架模型,為電商檢索過程進行系統性梳理,幫助消費者系統性地了解自己選擇商品時的判斷標準,同時為電商平臺的優化改進提供參考借鑒,推動電商平臺改進檢索系統,優化檢索結果展示,更好地服務于用戶。
筆者研究利用扎根理論挖掘用戶在以淘寶為例的電商平臺上檢索商品時的相關性判據,創新性地構建淘寶商品檢索相關性判據理論框架模型,但本文研究也存在一定的局限性:①樣本數量不足。本次訪談有效研究對象為25位,數量偏少,可能導致收集的資料存在一定的誤差,影響結論的全面性和準確性。②樣本對象隨機性不足。受限于接觸人群范圍,被訪者主要集中于南京大學信息管理學院的學生,年齡段集中在20多歲,普遍學歷較高,個人特質和生活環境會對商品檢索行為、相關性的判斷產生影響,從而影響分析結果的客觀準確。③編碼過程主觀性。由于相關性判據的編碼過程中,使用軟件工具抽取概念詞的匹配度不高,因此,選擇人工處理分類,難以避免存在一定的主觀性,導致編碼過程中的誤差。
為使研究結果更為客觀可信,在后續的研究中應增加訪談樣本數量,豐富樣本范圍,采取更客觀的方式進行編碼,開展對電商平臺商品信息檢索相關性判據更深入的研究。除了淘寶之外,拼多多、京東、唯品會等大量電商平臺的興起,為用戶提供豐富多彩的差異化服務,不同電商平臺的定位和主打特點是否會對用戶的相關性判據產生不同的影響有待進一步研究和探索。