袁紅



摘 要:[目的/意義]搜索策略是搜索行為的規劃,是搜索過程的核心,一直是搜索行為研究的重要課題。探索用戶搜索策略的運用及其轉換的規律,對于IR系統的功能優化及提升用戶信息搜索效率具有重要意義。[方法/過程]研究確定了來自4個搜索主題的8個搜索任務,招募了30名參與者,開展了搜索實驗,并對搜索行為視頻加以編碼,在統計不同搜索策略使用頻次的基礎上,構建了常見的用戶搜索策略轉換模式。[結果/結論]訪問和評估策略是信息搜索的常見策略,而修改查詢語句、學習等搜索策略運用較少。向前訪問→評估單個項目、評估搜索結果→向前訪問為用戶信息搜索最常見的策略轉換模式,而向前訪問→探索等策略轉換發生概率極低。此外,用戶在搜索的不同階段的策略運用及策略轉換呈現較大差異,這為IR系統設計提供了詳盡有用的指導。
關鍵詞:信息搜索;搜索策略;策略轉換
DOI:10.3969/j.issn.1008-0821.2020.02.006
〔中圖分類號〕G254.9;G252.0 〔文獻標識碼〕A 〔文章編號〕1008-0821(2020)02-0044-08
On the Transformation model of Users Information Search Strategies
Yuan Hong
(School of Economics and Management,Nantong University,Nantong 226019,China)
Abstract:[Purpose/Significance]Search strategy is the planning of search behavior,the core of search process,and it has always been an important topic in search behavior research.Exploring the application of user search strategy and its transformation rules has important guiding significance for the function optimization of IR system and the improvement of user information search efficiency.[Method/Process]8 search tasks from 4 search topics were identified,30 participants were enrolled,and search experiments were carried out to encode users search behavior videos.Common transformation models of search strategies were constructed on basis of the statistics of the frequency of different search strategies.[Result/Conclusion]Access and Evaluation are the common search strategies,while Modify Query,Learning are seldom used.Access Forward→Evaluation Individual Project,Evaluation Results→Access Forward are the most common strategy transformation models,while the probability of strategy transformation models such as Access Forward→Exploration are very low.In addition,the users strategy application and strategy transformation in different design search stages would also show great differences,which provided detailed and useful guidance for the IR system.
Key words:information search;search strategies;strategy transformation
由于網絡信息動態高速發展,網絡環境的日益復雜,用戶通過信息搜索獲取所需信息難度也在日益加大[5]。對此,學者正努力探索用戶網絡信息搜索行為的特征和規律,希望設計出更好的搜索工具和更有效的信息組織方式,以應對信息爆炸以及隨之而來的用戶日益復雜的信息需求。搜索策略是搜索行為的規劃,是搜索過程的核心,一直是信息搜索行為研究的重要課題。要深入了解信息搜索的動態過程,僅僅是識別搜索策略是不夠的。搜索策略的運用及轉換揭示了用戶為實現其信息需求的連續的決策過程,是用戶行為畫像的核心要素。
在信息搜索過程中,用戶選擇多種搜索策略,如創建查詢,點擊超鏈接,并評估具體信息內容的相關性等,多重策略的轉換鏈條構成了信息搜索過程的本質。在搜索策略分析中,策略之間的過渡可以作為一個分析單元或是策略本身[1]。目前國內學者只對搜索策略進行了概念性的描述,并以查全和查準為目標探討了如何制定科學的信息搜索策略,且大多聚焦于單一搜索策略,較少研究關注了不同搜索策略間的轉換[2-3]。因此,搜索策略及其轉換模式研究具有重要的理論意義,同時,它還對信息檢索系統的功能優化和用戶信息搜索效率的提高也具有重要的指導意義。
2.4 實驗流程
實驗分為準備、實施、數據提交3個階段。
實驗準備階段:通過QQ、人人網等平臺發布實驗者招募信息,實際招募30名,分別編號為1到30。在開始搜索任務之前,30位實驗者需要填寫背景資料的問卷,實驗者閱讀和明確搜索任務,實驗人員介紹實驗注意事項。
實驗實施階段:參與者根據自身情況完成兩項搜索任務,自由選擇網絡查詢系統和搜索策略來尋找相關資料,然后比較查詢到的相關資料,選擇實驗參與者認為與搜索任務最相關的資料并保存下來,創建一個名為Morae的文件夾保存在指定文件夾。
實驗數據提交階段:收集并保存30位實驗參與者的問卷及視頻。
3 數據采集與數據編碼
3.1 實驗樣本統計
搜索實驗共回收有效視頻30份。實驗參與者的人口統計學特征見表2。實驗參與者男女性別比例1∶2,大多為21~40歲之間的年輕人群,學歷分布均衡,能較為熟練地操作計算機。
此外,30位實驗參與者專業分布廣泛,來自通信工程、信息管理與信息系統、電氣工程、英語、紡織服裝等6個專業。
3.2 數據編碼
為了識別實驗者使用的搜索策略,本研究在Xie I等[6]提出的基于互動意圖的搜索策略的研究成果的基礎上,確定了如表3所示的10種搜索策略,并進行了編碼。
3.3 實驗數據
通過視頻數據分析,共識別出30位參與者執行60項搜索任務時的1 310項搜索策略。以實驗者13的實驗數據為例,該實驗者選擇的搜索任務為“最低工資標準”和“倫敦奧運會獎牌”,創建查詢語句為“最低工資標準”、“里約奧運會中國獎牌數”。該實驗者在搜索過程中搜索策略使用情況見表4,搜索策略轉換頻次見表5,不同階段的搜索策略轉換模式見表6。
統計匯總30位實驗參與者搜索策略數據,展開以下的數據分析。
4 數據分析
4.1 不同搜索策略應用
4.1.1 基于整個搜索過程的用戶搜索策略應用
整個搜索過程10種搜索策略的使用頻次和比例如表7所示。
最常用的策略是向前訪問(AF)。用戶鍵入URL訪問特定項目是網絡信息搜索的主要策略,通過該策略不斷接近搜索目標。第二個最常用的策略是評估單個項目(EI),用戶信息搜索是理性決策行為,需要通過不斷評估調整搜索策略,改變搜索路徑。搜索過程中超過一半的策略應用都是向前訪問或評估單個項目。評價搜索結果(ER)排第三,對搜索引擎返回結果相關性的判斷是搜索的必經之點,發生的頻次雖不及向前訪問和評價單個項目,但也顯示出搜索引擎返回結果的質量對于用戶信息搜索的重要作用。
使用最少的是學習策略(LR),使用頻次幾乎可以忽略,這表明,用戶的搜索努力是通過向前訪問、評價單個項目、評價搜索結果、向后訪問等諸多策略的頻繁使用體現出來,而學習策略極少使用,這似乎與搜索過程也是一個學習過程的普遍認識相違背,從認知角度來說,搜索也是不斷改變認知的學習,但本文界定的學習策略比較狹義,是獲取特定系統特征、結構、數據內容,有學習如何使用之意,如谷歌地圖的學習,相較于廣義的學習,發生的幾率要小得多,再加之實驗任務的設定,也導致了該策略的極少應用。此外,在搜索過程中,保存記錄(R)和修改查詢語句(M)策略分別占比1%和3%,因為查詢語句只是信息需求的表達,當用戶需求逐漸明確后,更多的搜索行為是圍繞著信息的評價和選擇,查詢語句不會頻繁更改;保存記錄策略使用少的原因在于從海量網絡信息中獲取有價值信息的難度越來越大,使得保存記錄策略失去發生的前提。
4.1.2 不同階段搜索策略的應用
表8顯示,在搜索前期排名前5的搜索策略依次為向前訪問(AF)、創建查詢語句(C)、評價搜索結果(ER)、識別搜索線索(L)、評價單個項目(EI);搜索中期排名前5的搜索策略依次為向前訪問(AF)、評價單個項目(EI)、向后訪問(AB)、探索(XPL)、評價搜索結果(ER);搜索后期排名前5的搜索策略依次為向前訪問(AF)、評價單個項目(EI)、向后訪問(AB)、評價搜索結果(ER)、探索(XPL)。可以認為,搜索前期的策略運用與后續階段差異較大,搜索中后期的策略運用較為相似。在各個階段排名前5的策略中,向前訪問(AF)、評價搜索結果(ER)、評價單個項目(EI)均在列,說明評價和選擇一直伴隨著用戶的整個搜索進程。另一方面,除了各階段排名前5的搜索策略外,其余策略的使用頻次普遍偏低,均在5%以下,說明用戶的實際搜索策略呈現部分策略主導的特點。
在搜索前期,識別搜索線索(L)、創建查詢語句(C)和評價搜索結果(ER)的比例比后續階段的都要高,用戶處于需求表達、努力尋求信息線索并不斷試探的狀態。在搜索中期觀察到的811次搜索策略中,向前訪問(AF)和評價單個項目(EI)占比超過一半,且探索(XPL)策略的比例高于其它階段。可以認為,向前訪問和評價單個項目是用戶在搜索中期的主要策略,且搜索中期的行為具有明顯的探索性,通過搜索和學習,用戶對搜索路徑和搜索目標逐漸明晰。在搜索后期,評價單個項目(EI)比前兩階段的使用比例都高,且隨著搜索的進行越來越多地評估具體的信息內容,相應地,評價搜索結果(ER)隨著搜索的進行使用比例逐漸下降,意味著越接近搜索目標,用戶的評估行為越聚焦于具體的信息內容,而非廣泛地瀏覽判別搜索引擎的搜索結果。
4.2 常見的搜索策略轉換模式
4.2.1 基于整個搜索過程的搜索策略轉換
對30位參與者執行60個搜索任務的1 310個搜索策略編碼統計,形成搜索策略轉換矩陣(略),該矩陣每個單元格的值表示從行策略到列策略的轉換頻次。在10*10轉換矩陣所表示的100對策略轉換中,75對之間存在轉換。最頻繁的轉換是AF→EI,共有142次。從AF到EI的切換表明,用戶訪問了某個項目,然后評估了它的相關性,該搜索策略組合不斷推動著搜索向前發展。排在第二的轉換模式是ER→AF,共發生122次,用戶迅速評估搜索結果,繼而訪問有價值的信息項目。接下來的常見策略轉換模式依次是“XPL→AF”(114次),“EI→AB”(96次)和“AB→ER”(91次),這幾組轉換模式充分體現了搜索過程的探索性和循環反復性。
另一方面,用戶搜索過程中存在大量的零轉換和低頻轉換,如創建查詢語句→向后訪問的搜索行為沒有觀察到;不常發生策略轉換也有很多,頻次也都只有1~2次,如創建查詢語句→識別搜索線索,向前訪問→探索等,表明在用戶的信息搜索行為的不確定性表面下仍然隱藏著確定的規律性。
4.2.2 基于不同階段的搜索策略轉換
選擇表7中最常使用的7種策略(向前訪問AF、評價單個項目EI、評價搜索結果ER、向后訪問AB、探索XPL、創建查詢語句C、識別搜索線索L)分階段統計使用順序和頻次,結果見表9。
從表9可知,在搜索的3個不同階段分別形成了如圖1所示常見策略轉換模式。
5 結論及啟示
研究結論從3個方面為IR系統設計提供了指導:1)如何有效地支持不同類型的應用策略;2)如何有效地支持最頻繁的策略轉換;3)如何有效地支持信息搜索不同階段的策略轉換。
5.1 用戶搜索策略使用偏好
為了有效地支持不同類型搜索策略的運用,研究人員需要了解用戶的搜索策略使用偏好。向前訪問(AF)和評價單個項目(EI)的應用超過50%。通過幾次點擊或輸入URL可以向前訪問,評估單個項目需要用戶較多的認知消耗以判斷項目的相關性、實用性和可信度。系統設計必須強調有助于用戶判斷項目質量的信息,此外,呈現和突出顯示文檔的原信息、提示最佳段落或生成摘要、直接提供具體信息相關的答案而不僅僅是在全文中高亮查詢關鍵詞都是行之有效的設計思路。
評估搜索結果(ER)是排名第三的使用策略。系統可以通過為Web文檔提供簡明扼要的摘要和信息替代,為用戶評估搜索結果提供更好的支持。可以對搜索結果列表進行有更多的信息組織,如分類和概述。Kules B等[17]通過實驗研究了用戶對Web搜索結果分類概述的使用,結果表明,分類概述不僅有助于用戶對結果的有效評估,而且能促使用戶能夠改變和采用新的搜索策略。
學習和探索是最少應用的搜索策略。用戶在搜索信息時通常不愿付出更多的努力重新組織信息或重新構建查詢,學習和探索難以展開。這與缺乏系統功能支持或幫助功能設計不佳有關。搜索歷史記錄和搜索路徑可以是用戶快速到達目標的有用工具[14]。因此,幫助頁面應該被集成到實際的瀏覽和搜索頁面中,應創建搜索歷史和搜索路徑選項,以輔助用戶的學習與探索。
5.2 用戶搜索策略轉換模式
如何促進基本轉換和如何減少不必要的轉換是明確了用戶常見搜索策略轉換模式后需要思考的問題。基本轉換是指搜索過程中關鍵的轉換,不能被忽略,而不必要的轉換是指可跳過或合并的轉換。每種類型的搜索策略都有自己最常見的策略轉換。對于IR系統來說,重要的是要幫助用戶更有效和便捷地實現轉換。而這些最常發生的轉換模式有助于幫助IR系統預測接下來用戶最可能使用的搜索策略,并提供支持該策略的功能選項。例如,向前訪問(AF)→評估單個項目(EI)是最常見的轉換模式之一。當用戶單擊鏈接或鍵入URL時,IR系統檢測到向前訪問策略,這時,系統就可以提供前面討論過的評估單個項目的支持功能,以幫助用戶快速準確地使用資源。
在搜索過程中搜索策略的應用并不總是“越多越好”。通過改進IR系統的設計,使用戶實際操作時實現某些合并策略的功能,減少不必要的搜索策略的使用。例如,在評估單個項目(EI)后,如用戶對此項目不滿意,往往會向后訪問(AB)搜索結果并識別下一個將要訪問的項目。IR系統可以設計為將搜索結果保留在與所選項目相同的頁面上進行評估,大大減少不必要的搜索步驟。此外,用戶在搜索時如遇到一些訪問問題,如死鏈接,系統錯誤等也會采用向后訪問(AB),此時IR系統如果能指導用戶進入更新的站點或相關站點將有助于搜索進程的推進。
5.3 不同任務階段的用戶搜索策略模式
由于不同階段應用了不同的搜索策略,所以IR系統能夠根據排名靠前的策略轉換模式預測后續策略。因此,IR系統可以設計有不同的模板,對處于不同搜索階段的用戶提供支持,以引導用戶搜索行為。在搜索前期,IR系統可以為用戶提供兩種類型的選項:便于用戶通過檢索詞來搜索,或幫助用戶根據最初識別的信息來探索。在搜索中期,對于喜歡通過輸入查詢進行搜索的用戶,系統設計應該通過減少不必要的過渡來整合評估過程;對于喜歡探索的用戶,IR系統的設計需要創建一個并行頁面,可以探索更高或更低級別的頁面。在搜索后期,IR系統可以整合用戶的個人空間,以便用戶可以多途徑的利用信息,如將搜索結果引用到論文中或者通過電子郵件發送給同事等。
6 結 語
本研究不僅確定了最頻繁和最不常用的搜索策略,而且分析了這些策略在不同階段的應用。頻繁策略的識別確立了用戶網絡搜索的關鍵行為,IR系統的優化必須促進這些必要的轉換,同時也要化繁為簡,減少不必要的轉換,以減少用戶的搜索成本。本研究最重要的貢獻是通過分析搜索策略的順序轉換,總結了用戶在網絡搜索過程中最常見的行為模式,為建立真正以用戶為中心的IR系統提供了切實的設計原則,以提升用戶搜索體驗。后續研究將結合用戶個體特征研究其搜索策略轉換模式,以期為基于用戶分群的IR系統的個性化功能設計提供深入的指導。
參考文獻
[1]Xie H I.Shifts of Interactive Intentions and Information-seeking Strategies in Interactive Information Retrieval[J].Journal of the Association for Information Science and Technology,2000,51(9):841-857.
[2]馬海群,楊志和.身心語言程式視閾下的信息檢索用戶認知模型研究[J].中國圖書館學報,2011,37(3):38-47.
[3]代君,郭世新.協同信息搜索行為的觸發情景因素探析——基于高校學生個人信息搜索失敗情景[J].圖書情報知識,2016,(5):62-72.
[4]Bates M J.Where Should the Person Stop and the Information Search Interface Start?[J].Information Processing & Management,1990,26(5):575-591.
[5]Marchionini G.Information Seeking in Electronic Environments[M].Information Seeking in Electronic Environments,1995.
[6]Xie I,Joo S.Transitions in Search Tactics During the Web-based Search Process[J].Journal of the Association for Information Science and Technology,2010,61(11):2188-2205.
[7]Bates M J.Information Search Tactics[J].Journal of the Association for Information Science and Technology,1979,30(4):205-214.
[8]Bates M J.Toward an Integrated Model of Information Seeking and Searching[J].The New Review of Information Behaviour Research,2002,(3):1-15.
[9]王慶穩.基于尋路理論的網絡用戶信息瀏覽行為研究[D].重慶:西南大學,2009.
[10]俞碧飏.信息偶遇概念與特點的實證辨析:以科研人員為例[J].情報學報,2012,31(7):759-769.
[11]Nachmias R,Gilad A.Needle in a Hyper Stack:Searching for Information on the World Wide Web[J].Journal of Research Technology in Education,2002,34(4):475-486.
[12]Croft W B,Lafferty J.Language Modeling for Information Retrieval[M].Springer Publishing Company,Incorporated,2010.
[13]Kim H N,Rawashdeh M,Saddik A E.Leveraging Collaborative Filtering to Tag-Based Personalized Search[C]//International Conference on User Modeling,Adaption,and Personalization.Springer-Verlag,2011:195-206.
[14]Zhang M,Jansen B J,Spink A.Information Searching Tactics of Web Searchers[J].Proceedings of the American Society for Information Science & Technology,2006,43(1):1-14.
[15]Wilson T D.Human Information Behavior[J].In-forming Science,2000,3(2):49-56
[16]Morae官網[EB/OL].http://www.techsmith.com/morae.html,2017-08-30.
[17]Kules B,Shneiderman B.Users Can Change Their Web Search Tactics:Design Guidelines for Categorized Overviews[J].Information Processing and Management,2008,44(2):463-484.
(責任編輯:郭沫含)