〔摘要〕本文主要介紹了目前我國網絡信息檢索用戶研究的3個方面,即用戶的網絡信息檢索行為研究現狀、用戶因素對于網絡信息檢索過程以及效率的影響以及用戶模型構建方面的研究。然后介紹了現有的網絡信息檢索用戶主要的調查方法,最后提出了對于網絡信息檢索用戶研究的展望。
收稿日期:2011-05-19
〔關鍵詞〕網絡用戶;網絡信息檢索;信息檢索行為;用戶研究
DOI:10.3969/j.issn.1008-0821.2011.08.044
〔中圖分類號〕G252.8 〔文獻標識碼〕A 〔文章編號〕1008-0821(2011)08-0174-04
Review for Users of China Network Information Retrieval
Guo Guimei
(School of Computer and Information Science,Southwest University,Chongqing 400715,China)
〔Abstract〕This paper firstly described users of network information retrieval research in three areas:the research status of users network information retrieval behavior;the influence for network information retrieval process and efficiency which user factors bring;user model construction effort.Then introduced the main existing methods of survey for network information retrieval users,and finally put forward the expectation for future research of network information retrieval users.
〔Key words〕network users;network information retrieval;information retrieval behaviors;users studies
隨著因特網在我國的蓬勃發展與應用,網絡上的信息資源也以幾何級數的速度迅速膨脹。網絡成為信息發布、存儲和傳播的重要集散地,為人們獲取信息提供了豐富的信息源。網絡信息檢索成為人們獲取信息和知識的重要手段。近些年來,引起了眾多學者的研究。
廣義的網絡信息檢索是指將網絡信息按一定的方式組織與存儲起來,并根據信息用戶的需要找出有關信息的過程與技術;狹義上的網絡信息檢索僅指該過程的后半部分,即從組織好的網絡信息集合中找出需要信息的過程。而狹義的網絡信息檢索是指利用相應的網絡信息檢索工具從網絡空間中查找出用戶所需信息的過程[1]。本文中的網絡信息檢索主要是指狹義的網絡信息檢索。
目前我國關于網絡信息檢索用戶研究主要集中在3個方面,一是對網絡用戶的信息檢索行為進行分析研究,主要是對互聯網用戶的信息行為進行研究,同時也對特定群體用戶的檢索行為進行了分析,總結了不同群體網絡信息檢索行為的特點。二是用戶因素對于網絡信息檢索的影響分析,即主要影響網絡信息檢索過程和效率的年齡、知識以及經驗等用戶因素。三是用戶模型的構建,即根據影響網絡檢索因素分析的結果,構建用戶模型,以提高用戶檢索的相關性。
1 網絡用戶信息檢索行為研究
1.1 網絡信息檢索行為的定義
21世紀以來,國內關于信息檢索行為的研究迅速發展起來。而隨著網絡的普及,網絡信息檢索行為也作為一個學術名詞提了出來。巢乃鵬(2002)把信息檢索行為定義為信息用戶因為感知到需求(或解決問題)而采取的相關信息查尋策略,并通過一系列的外在的信息活動表現最終獲得所需信息的整個過程。即信息檢索行為是用戶為了滿足其意識到的信息需求而采取的一系列外在的獲取信息的活動。網絡信息檢索行為則是指用戶在網絡環境下信息檢索行為[2]。李法運(2003)認為網絡用戶檢索行為指用戶為獲取所需信息,在與網絡互動過程中所采取的一系列身體活動和心理活動[3]。沙忠勇(2006)則認為信息檢索行為是指用戶在微觀層面上與各種信息系統進行信息交互的行為[4]。筆者認為,網絡信息檢索行為是指用戶在網絡環境下,運用一系列網絡檢索工具查詢用戶所需信息的過程。
1.2 我國網絡用戶的信息檢索行為研究
早前國內對于網絡用戶的檢索行為一直主要集中在特定群體用戶的研究中,近幾年來一些學者開始把研究對象運用到了整個因特網用戶范圍之中。
1.2.1 特定群體用戶檢索行為的研究現狀
楊曉雯(1998)對科學家的網絡信息檢索行為進行了研究[5]。廖以民(1998)對農業科學教師網絡信息檢索行為的研究[6]。羅思嘉(2000)通過臺灣成功大學學生在使用電子信息資源與傳統信息資源的比較分析探討了網絡信息環境對學生信息檢索行為的影響,并試圖揭示數字化環境下用戶檢索的行為機制[7]。葉慶玲對護理人員的網絡信息檢索行為進行了探討[8]。胡岷(2002)應用個人訪談與問卷調查研究了高校(中山大學)學生的網絡信息檢索行為,分析了個人特征對檢索行為的影響和引起這些行為的原因,并指出了相關行為規律對網絡檢索工具檢索效果改進的意義[9]。高依(2004)介紹了目前國內網絡數據庫使用現狀,研究了科技用戶的特點以及科技用戶搜索行為模式,并闡述了研究搜索行為對于提高網絡數據庫使用效率的意義。以南京理工大學的部分學生為對象,進行了網絡信息搜索行為的測試和探索性研究[10]。沙忠勇使用網絡計量工具WebTrends對特定科研機構網站的Web日志文件進行處理,通過提取有關科研人員信息行為的量化指標并進行實證分析,揭示了網絡環境下科研人員一些具有重要意義的信息行為特征,指出科研人員在網上檢索信息主要是為了定制等功能相對于其他用戶需求更為強烈。
在檢索結果的獲取上,科研用戶對pdf文件偏好,以便用于保留或打印。為優化科研機構的網絡信息服務提供定量依據和幫助[4]。蔣佳文(2006)通過訪問和問卷調查醫學用戶利用網絡信息資源若干方面的行為,并在此基礎上分析醫學用戶的信息檢索行為差異的特點及規律[11]。
1.2.2 對于網絡用戶的信息檢索行為的研究現狀
卜小蝶(1999)通過分析網絡搜索引擎的檢索日志記錄來分析網絡用戶的檢索行為特性,包括檢索用詞特性、用戶需求及動機,并根據這些研究結果探討了網絡信息資源的體系分類問題[12]。楊文峰和李星(2001)通過分析網絡搜索引擎“指南針”的檢索日志記錄發現了網絡信息用戶在信息檢索方面的某些規律性,主要包括:用戶的查詢次數,翻看結果頁面的情況,查詢詞的個數分布,查詢邏輯的使用,中文查詢詞的長度及詞性[13]。鄧小昭(2002)基于問卷調查詳細并分析了因特網用戶的信息需求規律并詳細探討了對這些信息需求的滿足措施,部分涉及網絡用戶的信息檢索行為研究[14]。鄧小昭(2003)還比較詳細梳理了因特網用戶的信息檢索行為的主要特點:用戶多傾向于采用單一的檢索詞匯,用戶使用的檢索詞匯基本遵循二八律,用戶一般只使用簡單的檢索策略較少使用高級檢索,用戶對結果的查看趨于粗糙,定勢心理在用戶選擇搜索引擎時起主要作用[15]。馬寒等(2005)基于百度、一搜、中搜與搜狗4個搜索引擎的少數檢索式分別從詞匯出現頻次、詞匯量、類別等方面分析了中文搜索引擎用戶的檢索行為特征[16]。王繼民等(2006)利用北大“天網”的用戶點擊記錄,分析后得到如下結論:用戶點擊不同URL的數量遵從Heaps定律,點擊URL的頻度服從類Zipf分布,點擊URL與頁面大小相關,點擊URL具有時間局部性,并提出了利用點擊日志確定相近查尋詞的新算法[17]。
2 網絡信息檢索的用戶因素
網絡信息檢索是一個復雜的現象,用戶因素更是一個難于定量的復雜因素。用戶的信息獲取與檢索能力、思維情感、個性特征等主體因素對信息檢索有著直接的影響。用戶作用于整個檢索過程,對檢索效率起著關鍵作用,國外早有研究者把用戶作為信息檢索研究的重要因素。“Moderm lnformation Retrieval”一書指出,用戶才是信息檢索的最終目的。而國內對于這方面的研究也越來越多,從2004年開始,關于網絡信息檢索用戶因素的論文逐漸增加。
嚴慧英(2004)通過對網絡信息檢索心理結構的分析,結合國內外信息檢索行為影響因素實驗結果,指出檢索行為主要隨著主體和環境兩個因素的變化而變化,不同用戶對同一環境可產生不同影響。主體因素主要為:需求(動機)、個性特征(性別;性格)、知識和經驗、年齡。
并指出這些因素對于用戶認知能力,檢索策略,檢索次數以及檢索速度的具體影響[18]。
黃麗紅(2005)從3個層面探討影響網絡信息檢索的用戶因素,即影響信息檢索過程的用戶因素層面分別是信息需求和需求表達、形成提問式、相關判斷等過程;用戶的思維、習慣、情感狀態因素層面,具體為用戶的思維定勢、惰性思維和情感狀態;用戶的個體差異性層面,包括年齡、性別、經驗、知識等[19]。王煉(2005)認識到用戶對于搜索引擎的巨大作用,指出從網絡用戶的角度介紹、分析和討論互聯網搜索引擎以及相關問題,從選擇搜索引擎、使用搜索引擎、認識搜索結果和用戶負擔幾個方面探討搜索引擎的評價問題[20]。
Kyung-Sun Kim認為用戶的情感控制因素對于用戶的檢索行為影響巨大[21]。并和楊玉芹(2005)調查了作為熟練Web用戶的67位本科生的認知特征與情感特征對其Web導航及搜索行為的影響。指出情感控制因素不僅影響包括關鍵詞搜索等搜索行為,還影響以查準率和查全率等為指標的檢索績效。這個研究結果表明,在諸如網絡之類的系統使用過程中,隨著用戶獲得經驗的增加,他們的信息搜索行為會發生變化。用戶的認知和情感特征似乎與他們的搜索經驗進行了交互,并且這種動態交互及其對用戶行為的影響是非常值得研究的。同時,這個研究結果也表明,學習者的不同特征影響用戶行為的不同方面。一些特征和執行水平有密切的關系,而另一些特征與信息搜索的計劃水平有密切的關系[22]。
王穎春(2007)指出網絡信息檢索要求信息用戶必須具備一定的計算機知識和網絡信息檢索知識。然而,當前的信息用戶的網絡化素質還遠遠未能達到所需的要求,他們使用網絡信息資源所必備的計算機知識和網絡知識跟不上技術發展的步伐。同時,由于用戶的網絡化信息意識較差,信息檢索能力不強、專業知識不深、理解水平不高等原因,使他們在進行網絡信息檢索的過程,對自身的信息需求的表達及選擇合適的檢索工具上出現隨意性、不完整和盲目性。這些都會影響到網絡信息檢索的效果[23]。
賴茂生(2007)以用戶的自然、社會屬性對用戶在搜索中使用檢索語言的影響為研究對象,綜合調查問卷的分析結果和用戶參與對比試驗法,分析性別、年齡、學歷和專業教育對用戶檢索語言的使用的影響。他指出性別因素基本沒有影響,年齡因素對通用組配詞、分類語言使用影響大,而學歷因素則影響復雜,專業教育則主要影響用戶對系統提示的相關詞的鑒別能力[24]。
鄒永利(2008)從3個層面探討影響網絡信息檢索的用戶因素,分別是用戶的信息意識與信息能力層面,具體為信息需求和檢索策略、計算機網絡知識、對檢索工具的熟悉程度、語言水平;用戶的思維、情感狀態因素層面,具體為思維定勢、惰性思維和情感狀態;用戶的個體差異性層面,具體為性別、年齡、知識、經驗[25]。
3 用戶信息檢索模型的研究
早從20世紀80年代,國外就已經開始了關于信息檢索模型的研究。從1981年英國著名情報學家Wilson提出信息行為模式開始,對信息查詢行為概念模型的研究開始發展起來,包括1981年和1996的Wilson模型等。繼信息查詢行為模型的研究后,1995年開始出現了幾個具有代表性的信息檢索模型,包括1996年的Ingwersen模型,1995年的Belkin模型和1997年的Spink模型。這些模型有的注重概括,有的側重分析,各個模型是互相補充的。隨著國外關于信息檢索模型研究成果的引入,我國對于信息檢索模型的研究也逐步展開,21世紀以來,關于用戶信息檢索模型的研究成熟。
李廣建(2002)認為用戶模型的應用領域是廣泛的,在信息檢索過程中引入用戶模型,有利于實現自適應的檢索,即提供一種個性化、智能化的檢索服務。通過對用戶檢索行為歷史的記錄和學習,可對用戶的檢索提問分析得更為準確,這實質上就是提高檢出結果與用戶需求之間的相關性,通過提高用戶相關度來提高用戶的滿意度。同時,用戶模型也有助于預期定位用戶的需求,進行主動服務[26]。
巢乃鵬(2002)從認知心理學與社會心理學的角度對有關用戶信息行為理論進行了詳細的探討,在對網絡用戶大量的問卷調查基礎上,構建了用戶信息查尋的行為模型并討論和驗證了網絡用戶信息查尋行為與信息環境和個體特征間的關系[2]。
萬琳(2007)總結了Wilson模型、Ellis模型、Kuhlthau模型各自的特點,并且研究了影響網絡信息檢索行為的主要因素,提出了一個用戶模型。在這個用戶模型中,用戶的個人背景對用戶的認知水平產生影響,而在檢索過程中,用戶如果對自己的檢索結果不滿意,則可以修正自己的檢索策略,回到檢索初始階段[27]。
4 用戶行為研究調查方法研究
由于近年來對于信息檢索行為的關注,目前信息檢索行為研究領域對于用戶研究的需求日益增多,從而形成了許多用于用戶信息檢索行為調查方法,包括問卷調查法、訪談法、小組討論法、實驗法、觀察法、出聲思維法和視線跟蹤法[28]。主要有:①調查法,即通過采集具有一定合理性和代表性的大量數據來研究用戶行為,并推廣到整個用戶群,數據量大、時間跨度長,如Jansen在考察Excite用戶檢索行為特征時就使用了這種方法[29]。盡管這種方法的精確性高,分析結果準確可靠,但人財物的耗費需求很大,一般的研究者難以承擔;②實驗法,通常采用測試表和采訪來采集用戶相關材料,并根據這些材料來分析用戶的行為特征。這種方法相對而言簡單易用,但是要設計出效度、信度良好的測試表并非一件易事,而且對被試的采訪也不一定能獲取完全真實的信息;③日志分析法,即通過采集計算機的日志文件記錄來分析用戶的行為特征及規律,如通過網絡日志、錄像日志或網絡日記來捕獲用戶的在線行為。日志文件的產生不受人為因素的影響,沒有被試接受調查時的刻意行為,而且樣本量大、分布廣,因而結論較為客觀準確,但日志文件一般較難區分用戶個體特征,難以反映用戶特性與檢索行為的相互關系,而且具有推測性,不能完全準確地反映用戶的真實意圖;④觀察法,即在有特定研究對象的過程中,研究人員在現場直接或利用特定的輔助工具對用戶的查尋過程進行觀察的方法,比如用錄像機、終端監視軟件來完成對用戶的觀察。這種方法沒有與被試進行交互,一般與其他方法結合使用。⑤出聲思維法,即被研究對象在信息檢索過程中,將其行動和思維過程用語言表達出來,這些獨白被研究人員錄下來以備研究之用。這種方法可以幫助研究者精確地了解用戶伴隨行為進行的思維活動,有利于分析用戶動機,但分析表明有時用戶的出聲與行為并不能完全一致,也必須與其它方法結合使用,⑥視線跟蹤法,通過記錄用戶的注視點序列,就可以分析出他們在進行信息檢索時的視覺盲區、視覺第一落點和視覺中心的分布,從而得出用戶在信息檢索時的視覺軌跡及其規律,以及其訪問、查詢和瀏覽的路徑[30]。⑦綜合法,即綜合運用多種方法對用戶進行調查研究。
5 結 語
綜上所述,我國網絡信息檢索研究想對于國外來說起步晚,但是發展迅速。目前對于網絡信息檢索用戶研究內容豐富,也形成了系統的研究方法體系,并有一些學者提出了用戶模型的構建,但是總體上對其研究相對較少,并且都只是集中在理論階段,很少有實際可用的用戶模型研究出來。未來,網絡信息檢索作為一個新興領域,要充分發揮其后發優勢。由于網絡環境的復雜性以及用戶的多樣性,應注重從網絡用戶的視角研究網絡信息檢索,同時對于用戶模型構建的研究雖然基礎較為薄弱,但是近幾年來發展速度不錯,未來必將引起研究者的重視。
參考文獻
[1]韓毅.用戶網絡信息檢索的實證研究[D].重慶:西南大學,2007:15-16.
[2]巢乃鵬.用戶信息查尋行為的理論與實踐[D].南京:南京大學,2002.
[3]李法運.網絡用戶信息檢索行為研究[J].中國圖書館學報,2003,(2):64.
[4]沙忠勇.網絡環境下科研人員的信息行為分析[J].情報科學,2006,24:486-490.
[5]楊曉雯.科學家資訊搜索行為的探討[J].圖書與資訊學刊, 1998,(5):24-43.
[6]廖以民.農業科學教師資訊行為之研究(上)[J].教育資料與圖書館學,1998,(1):105-125.
[7]羅思嘉.資訊行為探索——以國立成功大學學生為例:從資訊搜索行為看資訊環境對讀者咨詢行為的影響[J].中國圖書館學會會報,2000,64(2):147-160.
[8]葉慶玲.護理人員資訊尋求行為研究[J].大學圖書館,2000,4(2):93-114.
[9]胡眠.高校學生萬維網信息檢索行為研究[D].廣州:中山大學,2002.
[10]高依.網絡科技用戶的信息搜索行為研究[D].南京:南京理工大學,2004:3-30.
[11]蔣佳文.醫學用戶網絡信息檢索行為的調查研究[J].醫學信息學雜志,2006,(3):178~180.
[12]卜小蝶.臺灣網絡使用者檢索行為探析[J].大學圖書館(臺灣),1999,4(2):23-27.
[13]楊文峰,李星.網絡搜索引擎的用戶查尋分析[J].計算機工程,2001,27(6):20-27.
[14]鄧小昭.因特網用戶信息需求與滿足研究[D].武漢:武漢大學,2002.
[15]鄧小昭.因特網用戶信息檢索與瀏覽行為研究[J].情報學報,2003,22(6):653-658.
[16]馬寒,馮錦玲.中文搜索引擎用戶檢索式特征與探析[J].情報學報,2005,24(6):718-722.
[17]王繼民,彭波.搜索引擎用戶點擊行為分析[J].情報學報,2006,25(2):154-157.
[18]嚴慧英.影響網絡信息檢索行為的主體因素[J].情報檢索,2004,(4):94-95.
[19]黃麗紅.影響網絡信息檢索的用戶因素[J].情報理論與實踐,2005,28(2):145-147.
[20]王煉.從用戶角度評價網絡搜索引擎[J].情報科學,2005,23(3):459-462.
[21]Kyung-Sun Kim.Information seeking on the Web:Effects of user and task variables[J].Library Information Science Research,2001,23:233-255.
[22]Kyung-Sun Kim,楊玉芹.熟練WEB用戶的搜索行為:關注控制與情感控制的影響[J].DISTANCE EDUCATION JOURNAL,2007,(2):31-33.
[23]王穎春.影響網絡信息檢索效率的因素與對策[J].現代情報,2007,(9):5-7.
[24]賴茂生,屈鵬.用戶自然和社會屬性對網絡搜索中語言使用行為的影響[J].現代圖書情報與技術,2008,(7):56-59.
[25]鄒永利,王春強.影響網絡信息檢索效率的用戶因素[J].情報理論與實踐,2008,(3):374-375.
[26]李廣建.用戶模型及其學習方法[J].現代圖書情報技術,2002,(6):24-27.
[27]萬琳.網絡用戶信息查詢行為模型的建立[J].科技情報開發與經濟,2007,17(34):83-85.
[28]胡岷.用戶行為研究常用調查方法述略[J].成都理工大學學報:社會科學版,2005,13(3):54~57.
[29]Jensan B J,Spink A,Sarecevic T.Real lift,real user,real need:a study and analysis of user queries on the Web[J].Inforamtion Processiong and Management,2000,36(2):207-227.
[30]李曉麗,黃敏,莫冰.視線跟蹤法——網絡用戶信息行為研究的新方法[J].圖書館理論與實踐,2009,(8):25-29.