[ 摘 要] 對以人為本的多語言信息搜索行為相關(guān)文獻(xiàn)的搜集和分析,旨在探索信息行為研究中用戶視角下的多語言信息搜索行為研究進(jìn)展和發(fā)展趨勢,解析和揭示全球化視角下的多樣化行為規(guī)律。采用文獻(xiàn)分析法和綜合歸納法,對國內(nèi)外用戶視角下的多語言信息搜索行為研究展開熱點(diǎn)主題內(nèi)容追蹤和研究方法分析發(fā)現(xiàn):以人為本的多語言信息搜索行為研究主要聚焦4 個(gè)核心視角,即多語言信息搜索需求研究、多語言信息搜索行為影響因素研究、多語言信息搜索策略研究和多語言信息搜索系統(tǒng)設(shè)計(jì),并綜合應(yīng)用定性、定量和混合研究方法加以驗(yàn)證。通過對比國內(nèi)外研究異同發(fā)現(xiàn),未來研究將圍繞不同研究情境、不同影響因素、不同語言維度及不同應(yīng)用場景進(jìn)一步拓展和豐富現(xiàn)有信息行為研究內(nèi)容。
[ 關(guān)鍵詞] 以人為本 多語言用戶 信息搜索 信息行為
[ 中圖分類號] G252 [ 文獻(xiàn)標(biāo)志碼] A [ DOI ] 10.19764 / j.cnki.tsgjs.20231718
[ 本文引用格式] 樊舒, 吳丹. 以人為本的多語言信息搜索行為研究: 視角、方法與展望[J]. 圖書館建設(shè),2024(5):74-86.
1 研究背景
信息和通信技術(shù)的發(fā)展使來自不同文化和語言背景的人能夠不受地域和時(shí)空限制實(shí)現(xiàn)自由搜索。全球化和互聯(lián)網(wǎng)的快速發(fā)展推動(dòng)了多語言信息的交流和獲取, 跨語言信息檢索(crosslanguageinformation retrieval)、多語言信息檢索(multilingual information retrieval)以及多語言信息獲取(multilingual information access)已成為信息檢索研究的熱點(diǎn)之一。多語言信息獲取作為一個(gè)總括性術(shù)語,考慮了信息系統(tǒng)中使用多種語言的所有方面[1]。多語言信息檢索描述了提供多語言查詢功能或提供更精確內(nèi)容的系統(tǒng),而跨語言信息檢索作為信息檢索研究的一部分更側(cè)重用不同于查詢語言的其他語言檢索相關(guān)文檔信息[2]。其尤其關(guān)注如何提升多語種翻譯準(zhǔn)確性和檢索有效性,更多涉及跨語言信息檢索系統(tǒng)的精確率、準(zhǔn)確率和召回率測量的研究[3-4]。因此,目前大部分研究聚焦多語言和跨語言信息技術(shù)的提升和創(chuàng)新,而針對多語言信息搜索行為研究較少。事實(shí)上,受文化背景、語言能力、個(gè)體認(rèn)知等多種因素的影響,多語言信息搜索行為具有更豐富的行為特征,有助于解析和揭示全球化視角下的多樣化行為規(guī)律,進(jìn)一步豐富現(xiàn)有信息行為研究內(nèi)容。
全球在線搜索用戶的多樣性為搜索引擎的發(fā)展帶來了新的挑戰(zhàn)。鑒于網(wǎng)絡(luò)內(nèi)容的多樣性和多語言用戶群體的增加,支持個(gè)性化搜索的需求更加迫切。調(diào)查顯示,網(wǎng)絡(luò)用戶使用率排行前10 的語言分別是英語、漢語、西班牙語、阿拉伯語、葡萄牙語、印度尼西亞/馬來西亞語、法語、日語、俄語和德語[5],在線信息搜索的主要內(nèi)容仍以英語為主。此外,已有研究表明,多語言用戶在搜索時(shí)會大量使用他們的母語,并且在查詢和結(jié)果選擇行為上存在顯著差異[6]。對用戶偏好、結(jié)果頁面選擇和點(diǎn)擊行為的分析表明,不同的多語言搜索界面設(shè)計(jì)之間也存在顯著差異,不同界面會觸發(fā)不同的用戶行為[7]。
雖然在多語言信息獲取、跨語言信息檢索等領(lǐng)域中多語言信息的處理、檢索和自動(dòng)翻譯等方面取得了重大進(jìn)展,但相對缺乏以人為本的研究來實(shí)現(xiàn)并滿足單個(gè)用戶的多語言能力和搜索偏好[8]。以人為本的信息搜索研究關(guān)注用戶的行為和認(rèn)知方面,在這種視角下,人類的信息搜索被定義為一種涵蓋問題、對話、社會和認(rèn)知情況,并與用戶和信息搜索系統(tǒng)的交互相關(guān)聯(lián)的行為[9]。尤其是在生成式人工智能發(fā)展背景下,需要著重關(guān)注人工智能的解釋方法、用戶研究和可解釋評估[10]。因此,對于用戶個(gè)體的關(guān)注也是面向以人為本的多語言信息搜索研究的必然選擇。本文重點(diǎn)關(guān)注以人為本的多語言信息搜索行為的主要研究視角、研究方法、國內(nèi)外研究異同對比和未來展望等。
2 數(shù)據(jù)與方法
2.1 篩選標(biāo)準(zhǔn)
以人為本的核心即以用戶為中心,重點(diǎn)關(guān)注用戶的需求和系統(tǒng)交互之間的關(guān)系。以人為本的信息搜索的關(guān)鍵在于凸顯用戶需求的重要性,最終目的是借助精準(zhǔn)化、個(gè)性化和多樣化的方式提升用戶體驗(yàn),即“以用戶需求和交互為中心”[11],也有學(xué)者將其視為“人本范式研究”[12] 和“人智交互體驗(yàn)研究”[13]。具體而言,針對以人為本的多語言信息搜索行為研究,圍繞多語言用戶這一特殊用戶群體展開,側(cè)重于多語言信息需求、多語言信息獲取和多語言信息檢索相關(guān)研究。
2.2 樣本獲取
通過對國內(nèi)外相關(guān)文獻(xiàn)的調(diào)研與分析,對用戶視角下的多語言信息搜索研究成果進(jìn)行歸納、梳理和總結(jié)。針對國外相關(guān)研究內(nèi)容,以“multilingualinformation access”“multilingual informationretrieval”“multilingual information search”“multilingual information seeking”“crossla n g u a g e i n f o r m a t i o n r e t r i e v al”等作為關(guān)鍵詞在 Web of Science、Emerald、Springer、ProQuest 等數(shù)據(jù)庫及 Google Scholar 學(xué)術(shù)搜索引擎中進(jìn)行主題檢索。針對國內(nèi)相關(guān)研究內(nèi)容,以“多語言信息獲取”“多語言信息檢索”“多語言信息需求”等作為關(guān)鍵詞在中國知網(wǎng)、維普、萬方等數(shù)據(jù)庫中進(jìn)行主題檢索,并分別對檢索結(jié)果中的參考文獻(xiàn)進(jìn)行回溯檢索和擴(kuò)展檢索。最終,利用文獻(xiàn)分析法和綜合歸納法厘清用戶視域下多語言信息搜索行為研究脈絡(luò),即從研究視角、研究方法、研究異同和研究展望四個(gè)方面展開分析。
3 研究視角分析
3.1 多語言信息搜索需求研究
用戶進(jìn)行多語言信息搜索的需求主要以學(xué)習(xí)、工作、娛樂和購物目的為主。針對英國謝菲爾德大學(xué)中國留學(xué)生的多語言信息獲取需求調(diào)研發(fā)現(xiàn),用戶以學(xué)習(xí)和購物為目的獲取信息時(shí)傾向于使用英文搜索,但較多用戶對翻譯工具的依賴性較強(qiáng),對于跨語言信息檢索的自動(dòng)翻譯功能需求較大[14]。對用戶使用多語言數(shù)字圖書館的期望和需求調(diào)查顯示,用戶對多語言信息的獲取充滿期待,主要驅(qū)動(dòng)力是基于工作和學(xué)習(xí)需要,但受限于語言熟練度、翻譯工具質(zhì)量和數(shù)字圖書館界面交互效果等因素影響[15]。面向用戶的學(xué)術(shù)信息搜索需求調(diào)查發(fā)現(xiàn),撰寫研究論文是驅(qū)動(dòng)用戶獲取學(xué)術(shù)信息的首要因素,主要信息源來自數(shù)據(jù)庫和在線網(wǎng)絡(luò),但在線翻譯的質(zhì)量直接影響其對多語言資源獲取的滿意程度,用戶需要更多輔助功能支持其與多語言搜索界面的交互[16]。針對公共數(shù)字文化服務(wù)需求,以少數(shù)民族為代表的多語言用戶對功能、資源和服務(wù)等不同維度表現(xiàn)出不同類型的需求,形成了積極需求型、潛在需求型和偏好需求型3 種用戶畫像類型[17]。基于來自Flickr 平臺的照片,要求參與者進(jìn)行已知項(xiàng)目的圖像檢索,該任務(wù)優(yōu)勢在于為用戶設(shè)定了明確的目標(biāo),有明確定義的成功標(biāo)準(zhǔn)(圖像是否被找到),并挖掘用戶不同的檢索模式[18]。研究發(fā)現(xiàn),娛樂和學(xué)術(shù)是多語言圖像檢索的主要目的,且檢索圖像的頻率較低[19]。
3.2 多語言信息搜索行為影響因素研究
3.2.1 語言能力(language ability)
在設(shè)計(jì)有效的跨語言檢索工具時(shí),語言能力是一個(gè)需要考慮的重要變量,與用戶的搜索體驗(yàn)密切相關(guān)。對于多語言用戶而言,信息系統(tǒng)交互過程中對語言能力的需求遠(yuǎn)高于單語用戶。基于Facebook 的參與式觀察發(fā)現(xiàn),英語水平影響用戶的語言選擇,熟練掌握英語和母語的用戶經(jīng)常在他們的帖子和評論中使用從母語到英語的語碼轉(zhuǎn)換[20]。一般而言,用戶可以快速適應(yīng)系統(tǒng)的特征,但不能適應(yīng)未知的目標(biāo)語言[21]。用戶的語言能力也會影響自身的情緒反應(yīng),語言能力越差的人在搜索過程中經(jīng)歷的負(fù)面情緒越多[22]。通常情況下用戶更傾向于選擇自身最熟悉的語言進(jìn)行搜索[23],且用戶的平均注視持續(xù)時(shí)間、重新注視數(shù)據(jù)和瞳孔擴(kuò)張等眼球運(yùn)動(dòng)能夠有效預(yù)測其語言熟練程度[24]。此外,隨著語言不熟悉程度的增加,用戶對于任務(wù)感知難度和實(shí)際任務(wù)體驗(yàn)難度也會增加,對于翻譯工具的使用次數(shù)也逐漸遞增,尤其是傾向使用內(nèi)置于搜索引擎的翻譯工具(如谷歌翻譯)[4]。調(diào)查表明,機(jī)器翻譯是使用最多的語言工具,也是國際學(xué)生在網(wǎng)上搜索信息時(shí)面對語言相關(guān)挑戰(zhàn)的應(yīng)對機(jī)制之一[25]。尤其是對于多語言圖像檢索而言,受圖像的基本屬性特征影響,用戶一般使用大多數(shù)詞語來描述圖像中存在的物體,其后是顏色、形狀、紋理。而圖像標(biāo)注最大的困難是檢索者和內(nèi)容創(chuàng)建者之間標(biāo)注詞匯的不匹配,用戶自我報(bào)告存在的困難包括圖片很難描述、需要求助系統(tǒng)翻譯和拼寫檢查功能等[26]。
當(dāng)翻譯結(jié)果不能滿足需求時(shí),用戶傾向于使用創(chuàng)造性策略來尋找信息,如維基百科的多語言功能,其目的是減少翻譯工具所帶來的語義不準(zhǔn)確性問題[4]。所以,跨語言工具也是影響多語言用戶信息搜索行為的重要方面。共享和標(biāo)注圖像是一項(xiàng)非常受網(wǎng)絡(luò)用戶歡迎的活動(dòng),而Flickr 提供的服務(wù)允許用戶張貼自己的照片并對其進(jìn)行標(biāo)注,以便在公共平臺進(jìn)行共享和展示。一項(xiàng)基于Flickr 的研究表明,語言能力較弱的用戶傾向于系統(tǒng)為其提供更多關(guān)于圖像的標(biāo)注語言,且在完成任務(wù)時(shí)需要付出更多的認(rèn)知努力和更頻繁地使用跨語言功能[27]。而結(jié)合受控和非受控詞匯的索引方法在圖像檢索的有效性和用戶滿意度方面可能是最佳解決方案[28]。在圖像檢索中使用語義資源可以提高結(jié)果準(zhǔn)確度,并且使用多語言本體來組織圖像數(shù)據(jù)庫提供了一種經(jīng)濟(jì)有效的方式去呈現(xiàn)大量的結(jié)果以響應(yīng)用戶的查詢[29]。
3.2.2 領(lǐng)域知識(domain knowledge)
與語言能力類似,領(lǐng)域知識也是影響多語言信息搜索行為的關(guān)鍵因素。研究表明,網(wǎng)站自身提供的語言對網(wǎng)站用戶群體的語言構(gòu)成具有重要影響,尤其是針對少數(shù)民族語言環(huán)境下,缺乏先驗(yàn)知識和教育是信息獲取的障礙,由此可能會導(dǎo)致少數(shù)民族語言群體內(nèi)部知識水平的差距會更大[30]。對用戶的訪談?wù){(diào)查發(fā)現(xiàn),不熟悉的領(lǐng)域知識、信息來源、特定領(lǐng)域的網(wǎng)站類型、頁面設(shè)計(jì)等都會成為多語言用戶搜索過程的障礙和阻力。在對雙語用戶的信息搜索行為研究過程中也發(fā)現(xiàn)專家和新手在處理復(fù)雜任務(wù)時(shí)表現(xiàn)不同。具有多年網(wǎng)絡(luò)搜索經(jīng)驗(yàn)和使用高級搜索策略的用戶被歸類為專家,其他人則為新手。專家具有的先驗(yàn)知識和搜索經(jīng)驗(yàn)可以幫助其較快地查找鏈接,轉(zhuǎn)換搜索策略和完成復(fù)雜任務(wù)[22]。
3.2.3 認(rèn)知負(fù)擔(dān)(cognitive burden/effort)
對于多語言用戶而言,處理不同語言的信息內(nèi)容需要付出額外的認(rèn)知努力和時(shí)間成本。Kroll 等[31] 研究了雙語者語言機(jī)制中對第一語言和第二語言加工的認(rèn)知成本。個(gè)體在處理第一語言和第二語言時(shí)所付出的認(rèn)知努力存在較大差異,即使個(gè)人已精通兩種語言,認(rèn)知成本仍然較高。此外,研究表明,用戶滿意度既受到搜索的認(rèn)知努力的影響,也受到該語言中替代信息可用性(the availability of alternativeinformation)的影響[32]。在對非英語母語者的訪談中發(fā)現(xiàn),用英語作為本地語言進(jìn)行搜索不如用母語搜索方便,因?yàn)樽陨淼淖⒁饬o張會增加認(rèn)知負(fù)擔(dān)。不確定感和壓力感會影響用戶的搜索過程[33]。同時(shí),在語碼轉(zhuǎn)換過程中的語言選擇壓力和中斷也會影響用戶的語碼轉(zhuǎn)換行為[34]。
3.2.4 個(gè)性風(fēng)格(personality styles)
采用母語和外語執(zhí)行信息搜索任務(wù)時(shí),用戶的搜索策略和個(gè)性類型對搜索結(jié)果質(zhì)量的影響已得到證實(shí)。其中,人格特征的測量參考邁爾斯—布里格斯類型指標(biāo)(Myers-Briggs Type Indicator personality,簡稱MBTI),將用戶的個(gè)性特征劃分為4 個(gè)維度,即外向— 內(nèi)向(Extraversion-Introversion),感覺— 直覺(Sensing-Intuition), 思考— 感受(Thinking-Feeling), 判斷— 感知(Judging-Perceiving)。研究表明,具有情感主導(dǎo)特質(zhì)的用戶花費(fèi)更長的時(shí)間來完成任務(wù),并在非母語任務(wù)中完成的搜索任務(wù)質(zhì)量更好[35]。對雙語用戶信息搜索行為的研究發(fā)現(xiàn),用戶的挫敗感(user frustration)會導(dǎo)致其無法完成任務(wù),不同階段的用戶會經(jīng)歷不同的情緒反應(yīng),而不確定感也會隨著任務(wù)難度(搜索過程的不同階段)而變化[22]。
3.2.5 文化背景(cultural background)
文化是用戶環(huán)境的一部分,可以影響信息搜索行為的各個(gè)方面[36]。用戶的文化背景也可能影響其如何查找、定位信息以及他們對搜索結(jié)果的滿意度。不同文化背景的用戶可能會期望從搜索引擎中獲得不同的搜索結(jié)果[21]。文化也可能影響用戶對目標(biāo)語言的感知和選擇,Rieh 等[37] 發(fā)現(xiàn),韓國學(xué)生通常選擇英語材料,因?yàn)樗麄冋J(rèn)為只有英語版本才是高質(zhì)量的內(nèi)容。來自中國的用戶在訪談中提到,當(dāng)他們想要在所屬群體中尋求情感支持時(shí),更傾向于用中文檢索,其中文化親和力(cultural affinity)發(fā)揮了重要作用。同樣,在政治新聞的獲取過程中,用戶為了獲得不同觀點(diǎn)會選擇用不同語言進(jìn)行檢索,這一現(xiàn)象也與文化背景密切相關(guān)[33]。研究表明,用戶在社交媒體環(huán)境中的語言選擇不僅受到語言語境的影響,還受到文化語境的影響[20]。
3.3 多語言信息搜索策略研究
不同語言用戶在進(jìn)行搜索任務(wù)時(shí)采用的搜索策略也存在較大差異。對于母語任務(wù)而言,粗略的搜索策略(打開更多的網(wǎng)站并在打開的網(wǎng)站上點(diǎn)擊更少鼠標(biāo)的策略)或深入的搜索策略對于最終結(jié)果的質(zhì)量沒有影響。而在外語任務(wù)中,粗略的搜索策略則導(dǎo)致較低質(zhì)量的搜索結(jié)果。可能的原因在于用戶在處理外語任務(wù)時(shí)需要付出更多的努力去探索[35]。用戶會根據(jù)任務(wù)特征自由選擇搜索方式,如自由檢索或高級檢索。大多數(shù)參與者直接從任務(wù)中選擇關(guān)鍵詞作為檢索詞,其他輔助檢索方式包括邏輯符號、翻譯工具和重復(fù)檢索[38]。
此外,關(guān)于不同語言的搜索體驗(yàn)和策略,研究發(fā)現(xiàn)還具有以下特征:一是在利用外語進(jìn)行搜索時(shí),語言障礙主要表現(xiàn)在術(shù)語選擇和對返回內(nèi)容的理解上;二是當(dāng)用母語搜索時(shí),用戶一般會迅速選擇通用術(shù)語開始搜索和瀏覽,當(dāng)用外語搜索時(shí)傾向于仔細(xì)思考以提出更為具體的問題,進(jìn)而完善查詢式;三是由于對所使用術(shù)語的不自信,用戶會更為頻繁地嘗試新的關(guān)鍵詞進(jìn)行表述,而實(shí)際上在搜索引擎結(jié)果頁面的鏈接上點(diǎn)擊的更少;四是當(dāng)用外語搜索時(shí),用戶會更頻繁地使用搜索引擎的推薦功能,且需要提供更多的額外信息來提升用戶體驗(yàn)[39]。
混合語言查詢(mixed language query)是一種包含來自兩種或多種語言的混合查詢方式,這種現(xiàn)象在語言學(xué)中被稱為語碼轉(zhuǎn)換(code-switching)[40],語碼轉(zhuǎn)換即雙語者或多語者在語言交流時(shí)交替運(yùn)用兩種或者兩種以上語言的現(xiàn)象[41]。只有當(dāng)無法使用原始搜索語言找到信息時(shí),用戶才會在搜索中進(jìn)行語言切換[42]。混合語言查詢的重構(gòu)策略展示了一個(gè)迭代學(xué)習(xí)過程,用戶從搜索過程中學(xué)習(xí)他們所搜索領(lǐng)域的語言,并擴(kuò)展和優(yōu)化其查詢式。而中英混合語言查詢在實(shí)際搜索環(huán)境中較為常見,常發(fā)生于娛樂、學(xué)術(shù)和工作相關(guān)搜索活動(dòng)中,主要目的在于獲得高質(zhì)量的搜索結(jié)果、節(jié)省閱讀時(shí)間和精力、獲得某些社群提供的特定網(wǎng)頁等[43-44]。對于中英混合語言查詢而言,與單語搜索過程相比,用戶不僅學(xué)習(xí)特定查詢的主題,還會學(xué)習(xí)英語在該主題領(lǐng)域的表達(dá)方式[44]。后續(xù)研究報(bào)告了用戶的中英文混合語言查詢重構(gòu)策略,共有9 種查詢重構(gòu)模式,即添加單詞、刪除單詞、單詞重新排序、單詞拆分/ 連接、單詞替換、詞干重構(gòu)、構(gòu)建/ 擴(kuò)展首字母縮略詞、拼寫糾正、修改URL[45]。
除上述提到的影響因素之外,特定主題也會引發(fā)多語言用戶的興趣,如科學(xué)和技術(shù)、娛樂、商業(yè)和金融[46]。利用人工編碼的方式從漢英混合查詢式中識別出21 類主題,發(fā)現(xiàn)最受歡迎的主題為計(jì)算、娛樂和游戲[47]。針對多語言新聞獲取的研究發(fā)現(xiàn),搜索引擎和社交媒體是最受歡迎的新聞媒體平臺,且多語言用戶在這些數(shù)字化平臺上更喜歡使用一種及以上語言搜索,其中,最受歡迎的新聞主題包括政府、科學(xué)、運(yùn)動(dòng)、娛樂、商業(yè)和健康[48]。
3.4 多語言信息搜索系統(tǒng)設(shè)計(jì)
國外研究中的多語言用戶信息搜索系統(tǒng)研究較多聚焦多語言數(shù)字圖書館和數(shù)字文化遺產(chǎn)研究。其中,多語言數(shù)字圖書館支持多語言信息訪問和跨語言信息檢索,為用戶提供數(shù)字資源的直接獲取,較多研究集中在提供多語言信息訪問的技術(shù)問題上。提供多語言信息訪問將不僅僅涉及如何實(shí)施跨語言信息檢索,還要求對現(xiàn)有材料進(jìn)行本地化,并支持多語言瀏覽和多語言信息搜索。
對于多語言數(shù)字圖書館的系統(tǒng)性綜述調(diào)查發(fā)現(xiàn),目前以系統(tǒng)為中心的研究主要聚焦于調(diào)查不同技術(shù)在實(shí)現(xiàn)數(shù)字圖書館多語種信息檢索方面所帶來的挑戰(zhàn)[49]。使用跨語言信息檢索將有助于在數(shù)字圖書館中獲取多語種信息,但在設(shè)計(jì)這種功能之前,有必要研究圖書館用戶的語言特征[50]。除語言障礙之外,其他挑戰(zhàn)還包括數(shù)據(jù)管理、表示(處理不同的字體和字符代表)、開發(fā)(創(chuàng)建國際軟件、跨文化協(xié)作)和互操作性(系統(tǒng)架構(gòu)和數(shù)據(jù)共享)以及版權(quán)問題等[51]。相關(guān)研究內(nèi)容圍繞3 個(gè)方面展開:①新的方法、關(guān)鍵特征、模型、存儲庫建設(shè)等;②多語言數(shù)字圖書館的設(shè)計(jì)和實(shí)施,以及創(chuàng)建支持多語言信息檢索的基礎(chǔ)設(shè)施、工具、技術(shù)、方法和界面;③數(shù)字圖書館多語言信息檢索平臺及功能的評估和測試,典型的多語言數(shù)字圖書館項(xiàng)目有國際兒童數(shù)字圖書館(The InternationalChildren's Digital Library, 簡稱ICDL)、世界數(shù)字圖書館(The World Digital Library, 簡稱WDL)、歐洲數(shù)字圖書館(Europeana)等[52]。
文化遺產(chǎn)也是文化服務(wù)中另一個(gè)不容忽視的重要主題。Marsh 等[53] 認(rèn)為文化遺產(chǎn)機(jī)構(gòu)可以利用數(shù)字化履行其使命,從而保護(hù)并提供用戶所關(guān)注的館藏資源,并從故事敘述的視角闡述了文化遺產(chǎn)機(jī)構(gòu)中數(shù)字化民族志收藏的價(jià)值和影響方面的重要性。Zeng[54]則從數(shù)字人文的角度,指出歷史和文化遺產(chǎn)數(shù)據(jù)在圖博檔館藏中引起的高度興趣,提出了一種語義豐富的方法,以增強(qiáng)對文化遺產(chǎn)數(shù)據(jù)的利用。對于數(shù)字文化遺產(chǎn)情境下的多語言信息搜索研究也一直秉持著以人為本的原則展開,以MultiMatch 項(xiàng)目為例,其開發(fā)目的是使用戶能夠跨越媒體類型和語言界限的障礙,設(shè)計(jì)一個(gè)旨在獲取、組織和個(gè)性化展示文化遺產(chǎn)信息的搜索引擎。存儲在該原型系統(tǒng)中的主要信息來自文化遺產(chǎn)網(wǎng)站(如博物館)、網(wǎng)絡(luò)百科全書(如維基百科)、特定文化遺產(chǎn)組織的數(shù)字圖書館、符合開放共享標(biāo)準(zhǔn)的數(shù)字資源以及對相關(guān)文化網(wǎng)站資源的爬取和索引。采用以人為本的設(shè)計(jì)方法,該項(xiàng)目經(jīng)歷了需求評估和任務(wù)分析、系統(tǒng)原型的初步設(shè)計(jì)、交互式原型的設(shè)計(jì)和開發(fā)、評估和改進(jìn)等研究周期[55]。此外,歐洲視覺系統(tǒng)(The Eurovision System)結(jié)合了現(xiàn)有的翻譯資源提供對圣安德魯斯大學(xué)圖書館圖像檔案的網(wǎng)絡(luò)訪問,并擁有多種語言版本的顯示界面。用戶不必查看圖像標(biāo)題來判斷相關(guān)性,該系統(tǒng)提供的分類瀏覽能有效輔助用戶查詢,減少查詢失敗情況[56]。
多語言信息搜索最大的挑戰(zhàn)之一在于如何從界面和交互角度更好地支持多語言用戶。盡管目前大多數(shù)信息系統(tǒng)在技術(shù)上實(shí)現(xiàn)了對多語種的支持,但它們通常傾向于強(qiáng)調(diào)語言之間的區(qū)別,要求用戶在不同語言版本的系統(tǒng)之間切換或者利用單獨(dú)的檢索功能從多種語言的信息源獲得結(jié)果。這種方式并沒有跨越多語言信息搜索的實(shí)際障礙,且額外的努力也降低了用戶執(zhí)行涉及多種語言搜索的可能性[57]。Petrelli 等[58] 參考以人為本的研究方法,邀請多語言用戶參與整個(gè)設(shè)計(jì)周期,引導(dǎo)跨語言信息檢索系統(tǒng)的設(shè)計(jì)和開發(fā)。Chu等[59] 設(shè)計(jì)了一個(gè)支持多語言信息檢索界面交互的系統(tǒng)“TranSearch”并利用定量研究方法對其進(jìn)行評估,該研究發(fā)現(xiàn)簡單性(simplicity)、可見性(visibility)和可定制性(customizability)被認(rèn)為是最有價(jià)值的系統(tǒng)特征。用戶與系統(tǒng)的交互一直依靠于用戶界面進(jìn)行,旨在幫助用戶制定查詢、優(yōu)化檢索以及理解和檢查查詢結(jié)果。
針對用戶界面而言,用戶的語言熟練程度和搜索內(nèi)容類型在用戶偏好中起著重要作用,不同的界面會觸發(fā)不同的用戶行為。Steichen 和Freund 聚焦多語言信息搜索的結(jié)果展示頁面,目前對多語言結(jié)果展示界面方面的研究相對較少,一些已開發(fā)的原型系統(tǒng)則為每種語言在單獨(dú)的“面板式(panels)”界面中顯示結(jié)果。大部分研究聚焦在單語聚合搜索領(lǐng)域方面,將來自多個(gè)信息源的內(nèi)容集合在一起,即“混合式(blended)”界面。聚合搜索界面(aggregatedsearch interfaces)通常側(cè)重于圖像、新聞和視頻等內(nèi)容,它們在視覺上更為突出,且更容易與網(wǎng)絡(luò)搜索結(jié)果區(qū)分開來。基于調(diào)查選擇了5 種常見界面展示方式,即選項(xiàng)卡式(tabbed)、交錯(cuò)式(interleaved)、面板式(panels)、側(cè)欄式(side-bar)和通用搜索式(universal search),研究發(fā)現(xiàn)面板式界面最受歡迎,用戶更喜歡為每種語言提供獨(dú)立顯示界面,而最常用的交錯(cuò)式界面則最不受歡迎[7-8]。
文化差異也會影響用戶界面的設(shè)計(jì),尤其是在信息產(chǎn)品和服務(wù)的本地化過程中經(jīng)常會考慮這一點(diǎn),并相應(yīng)地調(diào)整網(wǎng)站設(shè)計(jì)以滿足其目標(biāo)社區(qū)的語言和文化需求[21]。例如,區(qū)域搜索引擎致力于為用戶提供更為本土化和便捷化的信息服務(wù),Chung 等[9] 設(shè)計(jì)了一個(gè)提供商業(yè)智能信息的門戶網(wǎng)站CBizPort,并設(shè)置簡體中文和繁體中文兩個(gè)版本的用戶界面以提高其完成搜索和瀏覽任務(wù)的效率。為多語言用戶提供不同版本的本地化網(wǎng)站或服務(wù),通常需考慮網(wǎng)站翻譯語言的選擇、對文化問題的認(rèn)識、資源的可用性、技術(shù)和維護(hù)問題等[21]。因此,在多語言信息獲取中,設(shè)計(jì)有效的搜索界面和功能也是至關(guān)重要的。
4 研究方法分析
4.1 定性研究方法
訪談法、日記法、案例研究等在以人為本的多語言信息搜索研究中是較為常用的定性研究方法。其中,訪談法又占據(jù)了重要地位,能夠較為深入獲取用戶體驗(yàn)以及內(nèi)部感知、態(tài)度和感覺等,如面對面專家訪談法、半結(jié)構(gòu)化訪談、焦點(diǎn)小組訪談、情境訪談等。
具體而言,Petrelli 等[58] 以面對面專家訪談方法為主收集用戶對于文化遺產(chǎn)信息的多語言信息搜索需求,明確不同文化用戶群體的典型任務(wù)和場景。訪談主題包括對受訪者工作的總體概述、常用檢索工具、互聯(lián)網(wǎng)的使用情況、如何檢索多媒體內(nèi)容、過去檢索過程的具體實(shí)例、改進(jìn)當(dāng)前檢索過程的方法以及與信息獲取相關(guān)的語言問題。Fu 等[43] 以活動(dòng)理論為框架,對8 名頻繁使用中英混合語言查詢式的用戶進(jìn)行半結(jié)構(gòu)化訪談,并利用Nvivo 對訪談內(nèi)容進(jìn)行編碼分析。Wang 等[20] 利用參與式觀察和半結(jié)構(gòu)化訪談方法收集定性數(shù)據(jù),通過參與式觀察分析Facebook 用戶的更新狀態(tài),并對78 名擁有多語言背景的用戶進(jìn)行了半結(jié)構(gòu)化的開放式問題訪談。Wang 等[60] 在實(shí)驗(yàn)第一階段利用情境訪談(in-context interview)的方法揭示用戶尋找信息的自然過程,并結(jié)合扎根理論對訪談數(shù)據(jù)進(jìn)行選擇性編碼。后續(xù)研究利用訪談法和日記法兩種定性研究方法相結(jié)合的方式展開,首先參與者被要求記錄三周其語碼轉(zhuǎn)換行為發(fā)生的情況,并每周對用戶日記進(jìn)行審查以確保獲得詳細(xì)的記錄,日記記錄結(jié)束之后在盡可能自然的環(huán)境中對參與者進(jìn)行訪談,編碼結(jié)果顯示用戶發(fā)生語碼轉(zhuǎn)換行為的常見情境涵蓋語言使用、新聞和娛樂、旅游、領(lǐng)域知識、學(xué)術(shù)資源和日常生活信息獲取6 大類別[61]。Chu 等[33] 利用焦點(diǎn)小組訪談?wù){(diào)查了非英語母語者在多語言信息搜索中所使用的主題、查詢策略、查詢式、查詢工具和面臨的挑戰(zhàn)等問題,并對訪談錄音轉(zhuǎn)錄后的文本進(jìn)行編碼分析。
其他定性研究方法如Alsalmi 等[62-63] 利用個(gè)案研究法和視頻刺激回憶(video-stimulated recall)方法調(diào)查了沙特用戶在使用多語言數(shù)字圖書館中的信息搜索行為,其中視頻刺激回憶這種定性方法是“一種內(nèi)省方法,可以用來引出人們在執(zhí)行任務(wù)或活動(dòng)時(shí)的思維過程和策略”。
4.2 定量研究方法
定量研究方法采用更為客觀的方式分析數(shù)據(jù)。用戶視角下多語言信息搜索研究中定量研究方法使用的頻率更高,如問卷調(diào)查法、實(shí)驗(yàn)法、網(wǎng)絡(luò)日志分析等。
(1)問卷調(diào)查法
對于多語言用戶而言,問卷調(diào)查法的方式比較靈活,可以有效獲取大規(guī)模用戶數(shù)據(jù),采集方式較為便利。Clough 等[50] 利用調(diào)查問卷收集用戶的搜索習(xí)慣、偏好和語言選擇等,問卷結(jié)構(gòu)包含6 個(gè)部分,即用戶簡介、語言技能、語言選擇、數(shù)字圖書館使用現(xiàn)狀、偏好特征和所需要跨越的語言障礙。研究表明,受語言能力的影響,人文、藝術(shù)和社會科學(xué)領(lǐng)域下,隨著用戶語言技能熟練程度的提升,用戶更有可能使用更多的語言進(jìn)行搜索。Steichen 等[2] 為了探索多語言用戶的在線行為,了解用戶多語言瀏覽和搜索過程的語言選擇和使用頻率問題,通過國際郵件列表和多個(gè)社交媒體渠道大規(guī)模分發(fā)調(diào)查問卷并收集有效用戶反饋。Vassilakaki 等[64] 借助開源調(diào)查軟件Lime Survey了解圖書情報(bào)專業(yè)的本科生對多語言信息的需求,問卷由用戶的個(gè)人信息,對特定數(shù)據(jù)庫、數(shù)字圖書館、搜索引擎和在線目錄的使用頻率,跨語言檢索的信息類型和方法3 部分組成。Nzomo 等[65] 利用網(wǎng)絡(luò)匿名調(diào)查問卷的方法了解多語言用戶的學(xué)術(shù)信息搜索行為,關(guān)注數(shù)據(jù)庫中多語言信息訪問工具的使用。Safdar等[66] 為了調(diào)查烏爾都語(Urdu)在互聯(lián)網(wǎng)搜索中的使用情況進(jìn)行了一項(xiàng)區(qū)域性調(diào)查,采用問卷調(diào)查的方式更直接地獲取信息。
眾包調(diào)查法也已成為用戶視角下多語言信息搜索研究的新興研究方法之一,該方法使得調(diào)查內(nèi)容的豐富性不斷提升,能夠獲得更為全面的用戶數(shù)據(jù)。2015年,Steichen 等[7] 利用眾包平臺Crowdflower 展開調(diào)查,將內(nèi)容布局方式作為唯一變量以衡量用戶界面偏好,并利用Bradley-Terry 模型進(jìn)行偏好統(tǒng)計(jì)分析。此后,2017 年,Lowe 等[6] 繼續(xù)利用該平臺開展了關(guān)于用戶查詢式和搜索結(jié)果選擇行為的3 個(gè)獨(dú)立實(shí)驗(yàn),分別針對用戶的查詢式構(gòu)造行為(queryconstruction behavior)、查詢式引導(dǎo)行為(queryelicitation behavior) 和結(jié)果列表偏好(result listpreferences)展開調(diào)查。2020 年,Steichen 等[8]的研究繼續(xù)擴(kuò)展了眾包調(diào)查的內(nèi)容,研究用戶搜索結(jié)果列表語言偏好可以在多大程度上根據(jù)用戶特征和主題特征進(jìn)行預(yù)測,Steichen 等[46] 的另一項(xiàng)延續(xù)性研究則側(cè)重用戶查詢式的構(gòu)造和結(jié)果列表的選擇。
(2)實(shí)驗(yàn)法
利用實(shí)驗(yàn)法能夠從直接、客觀的數(shù)據(jù)中分析用戶的行為規(guī)律。Chung 等[9] 招募了來自不同地區(qū)的30名用戶,要求參與者按照隨機(jī)分配順序各自執(zhí)行5 項(xiàng)搜索任務(wù)和5 項(xiàng)瀏覽任務(wù),比較CBizPort 與其他搜索引擎的區(qū)別,實(shí)驗(yàn)結(jié)束后邀請用戶對系統(tǒng)進(jìn)行3 方面評價(jià),即信息質(zhì)量、跨區(qū)域信息搜索能力和系統(tǒng)總體滿意度。Marlow 等[4] 利用實(shí)驗(yàn)法向用戶呈現(xiàn)了包含4 種語言的12 個(gè)主題供其檢索,該研究主題圍繞一個(gè)文化遺產(chǎn)項(xiàng)目展開,搜索主題從提交給文化網(wǎng)站的熱門查詢列表中選擇。此外,眼動(dòng)追蹤實(shí)驗(yàn)(eyetracking experiment)成為多語言用戶信息搜索研究的重要輔助手段。Ling 等[57] 為了比較用戶對多語言搜索界面的偏好,在用戶實(shí)驗(yàn)中測量了3 個(gè)眼動(dòng)變量,即注視次數(shù)、注視時(shí)間和掃視長度。Wang 等[60]在研究第二階段利用實(shí)驗(yàn)室受控眼動(dòng)實(shí)驗(yàn)分析用戶眼球運(yùn)動(dòng)的具體特征,包括任務(wù)執(zhí)行時(shí)間、執(zhí)行錯(cuò)誤、閱讀順序、感興趣的區(qū)域和注視長度等。其他研究也提到了利用眼動(dòng)追蹤技術(shù)來比較和驗(yàn)證基于查詢?nèi)罩痉治龊桶虢Y(jié)構(gòu)化訪談的發(fā)現(xiàn)[44]。
(3)網(wǎng)絡(luò)日志分析
網(wǎng)絡(luò)日志數(shù)據(jù)可以記錄用戶與搜索引擎或應(yīng)用程序的交互過程,能夠以一種不引人注目的方式減少對用戶的干擾。與其他研究方法相比,盡管用戶的需求和行為可以利用像訪談這樣的定性方法獲取大量解釋性信息,但受限于用戶體量的大小,且可能會根據(jù)被詢問用戶的主觀想法產(chǎn)生誤導(dǎo),因此,日志文件這樣的定量數(shù)據(jù)能夠呈現(xiàn)出信息檢索系統(tǒng)中所有活躍用戶的概況,有助于深入了解信息系統(tǒng)中的常見活動(dòng)、問題和趨勢[67]。利用已有數(shù)據(jù)集中獲取的用戶網(wǎng)絡(luò)日志記錄,Kralisch 等[30] 采集了多語言用戶的IP 地址、訪問頁面、訪問時(shí)間、使用語言以及相關(guān)頁面等數(shù)據(jù),用以分析多語言用戶的搜索偏好。G?de 等[67]通過收集訪問歐洲數(shù)字圖書館的點(diǎn)擊流數(shù)據(jù),記錄了6 種不同的活動(dòng)類型和狀態(tài),即界面特定語言操作(interface language-specific actions)、搜索相關(guān)操作(search-related actions)、瀏覽相關(guān)操作(browse-related actions)、客戶端活動(dòng)(ajaxrelatedactions)、與導(dǎo)航相關(guān)操作(navigationrelatedactions)、用戶管理相關(guān)操作(usermanagement-related actions)。通過日志分析發(fā)現(xiàn),不同語言或文化背景的用戶在搜索中表現(xiàn)不同,可以利用該方法識別不同類型用戶的行為模式[68]。
4.3 混合研究方法
混合研究方法能夠從多個(gè)角度探究多語言用戶信息搜索的全部過程。為了探究多語言用戶的信息搜索行為及其影響因素,在分析人格特征與多語言任務(wù)搜索質(zhì)量之間的關(guān)系時(shí),Józsa 等[35] 采用問卷調(diào)查方法獲取用戶的性格特征,即來自MBTI 的描述性測量。接著,限定參與實(shí)驗(yàn)用戶自我報(bào)告的英語水平是中級及以上,且對于一般的搜索任務(wù)較為熟悉。在進(jìn)行預(yù)實(shí)驗(yàn)之后,參與者被要求執(zhí)行兩個(gè)主題與旅行計(jì)劃相關(guān)的中等復(fù)雜度的搜索任務(wù),兩個(gè)任務(wù)分別使用匈牙利語和英語隨機(jī)呈現(xiàn)給用戶。除音頻、視頻類實(shí)驗(yàn)數(shù)據(jù)之外,還利用手機(jī)和平板電腦等設(shè)備收集用戶的心理和生理數(shù)據(jù),如眼動(dòng)注視、瞳孔大小、心率變化以及用戶所有的搜索日志活動(dòng)記錄。Si 等[38] 利用屏幕捕捉和記錄工具Camtasia Studio 分析了被試者利用WorldWideScience 平臺參與搜索任務(wù)的全過程,并利用出聲思維法、問卷調(diào)查和訪談法分別考察了用戶的背景信息、對實(shí)驗(yàn)的感受以及對實(shí)驗(yàn)平臺的看法,對32 條完整記錄進(jìn)行轉(zhuǎn)錄和編碼。Luo 等[22] 通過應(yīng)用Kuhlthau 的信息搜索過程模型來理解雙語用戶的互聯(lián)網(wǎng)搜索體驗(yàn),邀請用戶參與準(zhǔn)實(shí)驗(yàn)研究(quasifiledexperiment)。參與者利用谷歌搜索引擎完成兩項(xiàng)搜索任務(wù),結(jié)合出聲思維法自我報(bào)告其情緒反應(yīng)、言語對話和行動(dòng)記錄等定性數(shù)據(jù),并利用量表來獲取用戶的情緒反應(yīng)和對搜索任務(wù)表現(xiàn)的看法。為了考察大學(xué)生在使用母語和外語搜索時(shí)的行為差異,Chu等[39] 通過實(shí)驗(yàn)法收集了用戶網(wǎng)絡(luò)日志數(shù)據(jù),包括68個(gè)查詢、311 個(gè)查詢重構(gòu)和508 個(gè)訪問網(wǎng)站數(shù)據(jù),然后結(jié)合半結(jié)構(gòu)化訪談對31 個(gè)用戶基于不同語言的搜索體驗(yàn)進(jìn)行了深入分析。
為了研究混合語言查詢重構(gòu)策略,利用搜狗網(wǎng)絡(luò)搜索引擎提交的查詢?nèi)罩緮?shù)據(jù),收集用戶點(diǎn)擊事件的時(shí)間、用戶ID、用戶查詢、被點(diǎn)擊的網(wǎng)址排名、用戶點(diǎn)擊順序和被點(diǎn)擊的網(wǎng)址URL 等字段,抽取其中包含中英混合語言查詢式的記錄,利用人工編碼的方式從中英混合查詢式中識別出21 類主題[47],后續(xù)研究基于用戶訪談和查詢?nèi)罩痉治觯瑘?bào)告了用戶的中英文混合語言查詢重構(gòu)策略[45]。同樣,F(xiàn)u[44] 利用查詢?nèi)罩痉治龀醪搅私庵杏⒒旌险Z言查詢的主題、用戶意圖以及用戶的查詢重構(gòu)模式,之后利用半結(jié)構(gòu)化訪談對研究結(jié)果進(jìn)一步驗(yàn)證。為了分析多語言用戶的界面設(shè)計(jì)問題,以英國廣播公司網(wǎng)站的英語版本和非英語版本為例,利用定性和定量相結(jié)合的方法為網(wǎng)站互動(dòng)的設(shè)計(jì)問題和可用性提供反饋。研究包括對焦點(diǎn)小組的直接觀察、一對一訪談和問卷調(diào)查,并在此基礎(chǔ)上利用SPSS 進(jìn)行主成分分析[69]。混合研究方法的使用能夠從全方位、多角度地呈現(xiàn)多語言用戶的行為特征,有助于從定量和定性不同的角度對研究結(jié)果進(jìn)行深入分析。
5 國內(nèi)外研究異同分析
針對研究視角異同而言,國內(nèi)外研究均關(guān)注多語言用戶個(gè)性化信息需求、多語言信息搜尋行為、多語言信息搜索系統(tǒng)設(shè)計(jì)等。同時(shí),通過對比分析發(fā)現(xiàn),國內(nèi)研究主要針對留學(xué)生、外籍用戶群體需求分析展開,并與圖書館多元文化服務(wù)密切相關(guān),但針對少數(shù)民族用戶的多語言信息需求較為欠缺,而國外研究針對少數(shù)族裔和移民群體等為代表的多語言用戶需求研究較為豐富[70]。針對多語言信息搜索行為研究發(fā)現(xiàn),國內(nèi)外研究均關(guān)注多語言信息搜索行為的影響因素、搜索策略、行為模式等,但國內(nèi)研究的深度仍需進(jìn)一步擴(kuò)展,包括圍繞不同少數(shù)民族用戶和不同搜索情境下的針對性研究。此外,圍繞多語言信息搜索系統(tǒng)設(shè)計(jì)研究,國內(nèi)研究更為關(guān)注多語言信息檢索系統(tǒng)可視化和跨語言信息檢索系統(tǒng)功能等研究[71-72],而國外研究主要圍繞如何從界面和交互角度更好地支持多語言用戶[7-8]。針對研究方法異同而言,定性、定量和混合研究方法都得到了充分的應(yīng)用,但國外研究采用了更具特色化的研究方法(如情境訪談[60]、視頻刺激回憶[62-63] 等),更具有研究代表性和參考價(jià)值。
6 研究總結(jié)與展望
隨著多語言用戶群體的日益擴(kuò)大,其對于獲取全球資源的迫切需要越來越引起學(xué)者的重視。對多語言用戶自身需求的關(guān)注以及如何通過分析用戶的認(rèn)知和行為,挖掘用戶深層次的偏好,提供更為個(gè)性化和智能化的服務(wù)成為亟待解決的問題,尤其是針對多語言用戶的精神文化需求而言[17,73]。與此同時(shí),多語言信息檢索技術(shù)的發(fā)展也為加快實(shí)現(xiàn)數(shù)字資源的自由獲取,幫助用戶利用更為多元的手段鏈接世界,實(shí)現(xiàn)便捷化的搜索和服務(wù)成為可能。然而,目前從用戶視角出發(fā),聚焦以人為本的多語言信息搜索行為的相關(guān)研究仍然較少,大部分研究針對信息檢索技術(shù)的優(yōu)化或者翻譯性能的提升,對于用戶本身的認(rèn)知和行為特征分析尚不全面,相關(guān)研究所涉及的情境類型和任務(wù)內(nèi)容等需要進(jìn)一步擴(kuò)充。已有研究中定性和定量方法的使用各有側(cè)重,而混合研究方法的使用則從更客觀、全面的角度來加以驗(yàn)證,但實(shí)驗(yàn)法(如眼動(dòng)實(shí)驗(yàn)等)研究方法使用頻率尚未得到大規(guī)模應(yīng)用。
未來研究可關(guān)注的內(nèi)容還包括①探究不同情境下多語言用戶的信息需求和偏好,除一般的網(wǎng)絡(luò)搜索環(huán)境之外,公共數(shù)字文化情境、健康信息獲取情境、知識共享情境等研究都亟待進(jìn)一步深入挖掘和擴(kuò)展;②挖掘不同層面的多語言用戶信息搜索行為影響因素,在繼續(xù)擴(kuò)展已有影響因素,如語言能力、領(lǐng)域知識、認(rèn)知負(fù)擔(dān)等相關(guān)因素的基礎(chǔ)上,進(jìn)一步分析任務(wù)類型、研究主題、個(gè)性特征等維度下多語言用戶的行為特征和差異,比較不同任務(wù)類型和難度對多語言用戶信息搜索行為的影響;③聚焦特殊語言使用維度的用戶群體,關(guān)注少數(shù)族裔的多語言信息搜索行為,了解其對于多語言信息搜索的實(shí)際需要,針對性分析其搜索策略和行為模式等,為其提供更為智能化、個(gè)性化、人性化的服務(wù);④關(guān)注多語言信息搜索系統(tǒng)和搜索界面的設(shè)計(jì)和優(yōu)化,并在具體應(yīng)用層面實(shí)現(xiàn)真正意義上的多語言內(nèi)容聚合和語義檢索。
參考文獻(xiàn):
[1] 吳丹, 何大慶. 多語言信息獲取中用戶相關(guān)反饋實(shí)驗(yàn)與評價(jià)[J]. 圖書情報(bào)工作,2011,55(2):21-24,116.
[2] STEICHEN B,GHORAB M R,O'CONNOR A,et al.Towards personalized multilingual information access-exploring the browsing and search behavior of multilingual users[C]//International Conference on User Modeling,Adaptation,and Personalization.Aalborg:Springer,Cham,2014:435-446.
[3] LEE J H,DOWNIE J S,CUNNINGHAM S J.Challenges in cross-cultural/multilingual music information seeking[C]//In Proceedings: Sixth International Conference on Music Information Retrieval.London:ISMIR,2005:11-15.
[4] MARLOW J,CLOUGH P,RECUERO J C,et al.Exploring the effects of language skills on multilingual web search[C]//European Conference on Information Retrieval.Heidelberg:Springer,2008:126-137.
[5] Internet world users by language(top 10 languages)[EB/OL].[2023-08-31].https://www.internetworldstats.com/stats7.htm.
[6] LOWE R,STEICHEN B.Multilingual search user behaviors--exploring multilingual querying and result selection through crowdsourcing[C]//Proceedings of the 25th Conference on User Modeling, Adaptation and Personalization. Bratislava:ACM,2017: 303-307.
[7] STEICHEN B,F(xiàn)REUND L.Supporting the modern p o l y g l o t : a c o m p a r i s o n o f m u l t i l i n g u a l s e a r c h interfaces[C]//Proceedings of the 33rd Annual ACM Conference on Human Factors in Computing Systems.Seoal:ACM,2015: 3483-3492.
[8] STEICHEN B,CASTILLO C,SCROGGINS K. Personalized multilingual search-predicting search result list language preferences[C]//Proceedings of the 28th ACM Conference on User Modeling,Adaptation and Personalization.Genoa:ACM,2020:343-347.
[9] CHUNG W,ZHANG Y,HUANG Z,et al. Internet searching and browsing in a multilingual world: an experiment on the Chinese Business Intelligence Portal(CBizPort)[J].Journal of the American society for information science and technology,2004,55(9):818-831.
[10] 梁少博. 面向\" 以人為本\" 的生成式人工智能: 挑戰(zhàn)與路徑[J]. 圖書館建設(shè),2023(4):19-21.
[11] 壽建琪. 走向\" 已知之未知\":GPT 大語言模型助力實(shí)現(xiàn)以人為本的信息檢索[J]. 農(nóng)業(yè)圖書情報(bào)學(xué)報(bào),2023,35(5):16-26.
[12] 潘正源, 李樵, 李月琳, 等. 智能信息檢索研究范式的演進(jìn)、反思與前瞻[J]. 圖書館論壇,2024,44(1):137-150.
[13] 姜婷婷, 許艷閏, 傅詩婷, 等. 人智交互體驗(yàn)研究: 為人本人工智能發(fā)展注入新動(dòng)力[J]. 圖書情報(bào)知識,2022,39(4):43-55.
[14] 杜慧平, 李旭光. 多語言信息存取的潛在用戶調(diào)研: 以英國謝菲爾德大學(xué)留學(xué)生為例[J]. 知識管理論壇,2013(6):15-20.
[15] 吳丹, 古南輝, 何大慶. 數(shù)字圖書館用戶的多語言信息需求調(diào)研[J]. 圖書情報(bào)工作,2011,54(2):6-10.
[16] WU D,HE D,LUO B.Multilingual needs and expectations in digital libraries:a survey of academic users with different languages[J].The electronic library,2012,30(2):182-197.
[17] 姚勝譯, 徐爽, 樊舒, 等. 公共數(shù)字文化服務(wù)需求視角下的蒙藏維多語言用戶畫像研究[J]. 圖書館建設(shè),2022(1):46-55,95.
[18] VUNDAVALLI S.Mining the behaviour of users in a multilingual information access task[C]//CLEF 2008 Workshop Notes.Aarhus:In Cross Language Evaluation Forum,2008:15.
[19] RUIZ M E, CHIN P.Users' image seeking behavior in a multilingual tag environment[C]//Workshop of the Cross-Language Evaluation Forum for European Languages.Heidelberg:Springer,2009:37-44.
[20] WANG J,JOARDAR S.Cultural capital at work in Facebook users' selection of different languages[C]//International Conference on Cross-Cultural Design.Los Angeles:Springer,Cham,2015:101-109.
[21] PETERS C,BRASCHLER M,CLOUGH P.Multilingual information retrieval:from research to practice[M].Heidelberg:Springer,2012:93.
[22] LUO M M, NAHL D.Let's Google:uncertainty and bilingual search[J].Journal of the association for information science and technology,2019,70(9):1014-1025.
[23] 司莉, 潘秋玉, 莊曉喆. 基于實(shí)證的多語言信息檢索用戶行為分析[J]. 國家圖書館學(xué)刊,2015,24(5):81-90.
[24] STEICHEN B,KOSASIH W,BECERRA C.Inferring search user language proficiency from eye gaze d a t a [ C ] / / P r o c e e d i n g s o f t h e 2 0 2 2 C o n f e r e n c e on Human Information Interaction and Retrieval.Regensburg:cACM,2022:211-220.
[25] NZOMO P,RUBIN V L,AJIFERUKE I.Multilingual information access tools:user survey[C]// Proceedings of the 2012 iConference.Toronto:ACM,2012:530-532.
[26] RUIZ M E,CHIN P.Users'seeking behavior and multilingual image tags[J].Proceedings of the American society for information science and technology,2010,47(1):1-2.
[27] PEINADO V,LóPEZ-OSTENERO F,GONZALO J.Analysis of multilingual image search logs:users'behavior and search strategies[C]//Workshop of the Cross-Language Evaluation Forum for European Languages. Heidelberg:Springer,Berlin,2009:21-28.
[28] MéNARD E.Ordinary image retrieval in a multilingual context: a comparison of two indexing vocabularies[C]//Aslib Proceedings:New Information Perspectives.London:Emerald Group Publishing Limited,2010:428-437.
[29] POPESCU A,GREFENSTETTE G,MOELLIC P A.Image retrieval using a multilingual ontology[C]//Proceedling RIAO'07 Large Scale Semantic Access to Content(Text,Image,Video,and Sound).Pittsburgh:ACM,2007:461-474.
[30] KRALISCH A,BERENDT B.Language-sensitive search behaviour and the role of domain knowledge[J].New review of hypermedia and multimedia,2005,11(2):221-246.
[31] KROLL J F,VAN HELL J G,TOKOWICZ N,et al.The revised hierarchical model:a critical review and assessment[J].Bilingualism(Cambridge,England),2010,13(3):373.
[32] BERENDT B,KRALISCH A.A user-centric approach to identifying best deployment strategies for languagetools: the impact of content and access language on web user behaviour and attitudes[J].Information retrieval,2009,12(3):380.
[33] CHU P,KOMLODI A,RóZSA G.Online search in English as a non-native language[J].Proceedings of the association for information science and technology,2015,52(1):1-9.
[34] CHOI Y J,LEE M,LEE S.Toward a multilingual conversational agent:challenges and expectations of code-mixing multilingual users[C]//Proceedings of the 2023 CHI Conference on Human Factors in Computing Systems.Hamburg:ACM,2023:1-17.
[35] JóZSA E,K?LES M,KOMLóDI A,et al.Evaluation of search quality differences and the impact of personality styles in native and foreign language searching tasks[C]//Proceedings of the 4th Information Interaction in Context Symposium.Nijmegen:ACM,2012:310-313.
[36] ZOE L R,DIMARTINO D.Cultural diversity and enduser searching:an analysis by gender and language background[J].Research strategies,2000,17(4):291-305.
[37] RIEH H Y,RIEH S Y.Web searching across languages:preference and behavior of bilingual academic users in Korea[J].Library amp; information science research,2005,27(2):249-263.
[38] SI L,PAN Q, ZHUANG X.An empirical analysis of user behaviour on multilingual information retrieval[J].The electronic library,2017,35(3):410-426.
[39] CHU P,JOZSA E,KOMLODI A,et al.An exploratory study on search behavior in different languages[C]//Proceedings of the 4th Information Interaction in Context Symposium.Nijmegen:ACM,2012: 318-321.
[40] FU H,WU S.Analyzing Chinese-English mixed language queries in a web search engine[C]//Proceedings of the American Society for Information Science and Technology.Seattle:Wiley,2014,51(1):1-5.
[41] GROSJEAN F.Life with two languages: an introduction to bilingualism[M].Cambridge:Harvard University Press,1982:152.
[42] AULA A,KELLAR M.Multilingual search strategies[M]// CHI' 09 extended abstracts on human factors in computing systems.Boston: ACM,2009:3865-3870.
[43] FU H,WU S.Studying Chinese-English mixed language queries from the user perspectives[C]//Proceedings of the 15th ACM/IEEE-CS Joint Conference on Digital Libraries.Knoxville: ACM,2015:247-248.
[44] FU H.Mixed language queries in online searches[J].Aslib journal of information management,2019,71(1):72-89.
[45] FU H.Analysis of Chinese-English mixed language query reformulation strategies and patterns during web searching[J].Proceedings of the association for information science and technology,2016,53(1):1-5.
[46] STEICHEN B,LOWE R.How do multilingual users search? An investigation of query and result list language choices[J].Journal of the association for information science and technology,2021,72(6):759-776.
[47] JANSEN B J,BOOTH D L,SPINK A.Determining the informational,navigational,and transactional intent of web queries[J].Information processing amp; management,2008,44(3):1251-1266.
[48] LING C,STEICHEN B,F(xiàn)IGUEIRA S.Multilingual news–an investigation of consumption,querying, and search result selection behaviors[J].International journal of human-computer interaction,2020,36(6):516-535.
[49] VASSILAKAKI E,GAROUFALLOU E.Multilingual digital libraries:a review of issues in system-centered and user-centered studies,information retrieval and user behavior[J].The international information amp; library review,2013,45(1-2):3-19.
[50] CLOUGH P,ELETA I.Investigating language skills and field of knowledge on multilingual information access in digital libraries[J].International journal of digital library systems (IJDLS),2010,1(1): 89-103.
[51] DIEKEMA A R.Multilinguality in the digital library:a review[J].The electronic library,2012,30(2):165-181.
[52] 杜慧平. 數(shù)字圖書館的多語言信息存取:Europeana 項(xiàng)目進(jìn)展與啟示[J]. 圖書館雜志,2012,31(4):20-23.
[53] MARSH D E,PUNZALAN R L,LEOPOLD R,et al.Stories of impact:the role of narrative in understanding the value and impact of digital collections[J].Archival science,2016,16(4):327-372.
[54] ZENG M L.Semantic enrichment for enhancing LAM data and supporting digital humanities.review article[J].El profesional de la información,2019,28(1):e280103.
[55] MA R L O W J , C L O U G H P , I R E S O N N , e t a l . T h e MultiMatch project:multilingual/multimedia access to cultural heritage on the web[C]//Museums on the Web Conference(MW2008):Proceedings.Toronto:Archives amp;Museum Informatics,2008:1-13.
[56] CLOUGH P,SANDERSON M.User experiments with the Eurovision cross-language image retrieval system[J].Journal of the American society for information science and technology,2006,57(5):697-708.
[57] LING C,STEICHEN B,CHOULOS A G.A comparative u s e r s t u d y o f i n t e r a c t i v e m u l t i l i n g u a l s e a r c h interfaces[C]//Proceedings of the 2018 Conference on Human Information Interaction amp; Retrieval.New Brunswick:ACM,2018:211-220.
[58] PETRELLI D,BEAULIEU M,SANDERSON M,et al.Observing users,designing clarity:a case study on the usercentered design of a cross-language information retrieval system[J].Journal of the American society for information science and technology,2004,55(10):923-934.
[59] CHU P,KOMLODI A.Transearch:a multilingual search user interface accommodating user interaction and preference[C]//Proceedings of the 2017 CHI Conference Extended Abstracts on Human Factors in Computing Systems.Denver:ACM,2017:2466-2472.
[60] WANG J,KOMLODI A.Understanding users'language selection:code-switching in online searches[C]// Proceedings of the 2016 ACM on Conference on Human Information Interaction and Retrieval.Carrboro: ACM,2016:377-379.
[61] WANG J,KOMLODI A.Switching languages in online searching:a qualitative study of web users'codeswitching search behaviors[C]//Proceedings of the 2018 Conference on Human Information Interaction amp;Retrieval.New Brunswick:ACM,2018:201-210.
[62] HENDERSON L D,TALLMAN J.Stimulated recall and mental models:tools for teaching and learning computer information literacy[M].Maryland:Scarecrow Press,2006:55.
[63] ALSALMI H M.Information-seeking in multilingual digital libraries:comparative case studies of five university students[J].Library hi tech,2019,39(1):80-100.
[64] VASSILAKAKI E,GAROUFALLOU E,JOHNSON F,et al.An exploration of users'needs for multilingual i n f o r m a t i o n r e t r i e v a l a n d a c c e s s [ C ] / / R e s e a r c h Conference on Metadata and Semantics Research.Manchester: Springer,2015:249-258.
[65] NZOMO P,AJIFERUKE I,VAUGHAN L,et al.Multilingual information retrieval amp; use:perceptions and practices amongst bi/multilingual academic users[J].The Journal of academic librarianship,2016, 42(5):495-502.
[66] SAFDAR Z,BAJWA R S,HUSSAIN S,et al.The role of Roman Urdu in multilingual information retrieval:a regional study[J].The journal of academic librarianship,2020,46(6):102258.
[67] G?DE M,PETRAS V,STILLER J.Which log for which information?Gathering multilingual data from different log file types[C]//International Conference of the Cross-Language Evaluation Forum for European Languages.Heidelberg:Springer,Berlin,2010:70-81.
[68] GHORAB M R,LEVELING J,ZHOU D,et al.Identifying common user behaviour in multilingual search logs[C]//Workshop of the Cross-Language Evaluation Forum for European Languages.Heidelberg:Springer,2009:518-525.
[69] MIRAZ M H,EXCELL P S,ALI M.User interface (UI)design issues for multilingual users: a case study[J].Universal access in the information society,2016,15(3):431-444.
[70] 舒寶淇,龔穩(wěn)穩(wěn),王晉.國外少數(shù)族裔信息行為研究進(jìn)展[J].圖書館論壇,2020,40(11):105-114.
[71] 洪菀吟. 多語言信息檢索系統(tǒng)可視化初探 [J]. 圖書情報(bào)工作,2011,55(2):25-28.
[72] 司莉, 周璟.\" 一帶一路\" 多語種共享型數(shù)據(jù)庫的跨語言檢索功能分析與開發(fā)策略[J]. 圖書情報(bào)工作,2021,65(3):20-27.
[73] 吳丹, 樊舒. 面向多源異構(gòu)資源融合的公共文化數(shù)字化建設(shè)路徑[J]. 西安交通大學(xué)學(xué)報(bào)( 社會科學(xué)版),2021,41(5):136-143.
[ 作者簡介]
樊 舒 四川大學(xué)公共管理學(xué)院助理研究員、博士后,研究方向?yàn)橛脩粜畔⑿袨椤⒐参幕?wù)等。E-mail:fanshu_shu@126.com。
吳 丹 武漢大學(xué)信息管理學(xué)院教授、博士生導(dǎo)師,研究方向?yàn)樾畔⒔M織與檢索、用戶信息行為、人機(jī)交互等,
本文通訊作者。E-mail:woodan@whu.edu.cn。
[ 收稿日期:2023-11-09 修回日期:2023-12-12]