倪華 王秀紅


摘要:隨著信息社會的發(fā)展,信息檢索面臨著冗余的問題,大量無序的檢索結(jié)果加大了用戶獲得有效信息的難度,降低了效率。文章通過將基于眼動技術(shù)的閱讀實(shí)驗(yàn)指標(biāo)加入到研究信息檢索的優(yōu)化過程,構(gòu)建了基于眼動指標(biāo)的檢索結(jié)果排序賦分方法,增加了現(xiàn)有信息檢索的用戶數(shù)據(jù)來源維度,優(yōu)化了檢索結(jié)果排序的算法體系,能夠更好的促進(jìn)信息檢索系統(tǒng)的發(fā)展。
關(guān)鍵詞:眼動;信息檢索;優(yōu)化;應(yīng)用
一、引言
隨著現(xiàn)代信息網(wǎng)絡(luò)的迅猛發(fā)展,信息的檢索在人們獲取信息的途徑中占到了主要的地位。同時,隨著信息的日益增多,用戶在進(jìn)行檢索時往往遇到檢索結(jié)果內(nèi)存在大量沒有用或者不關(guān)聯(lián)的信息。例如實(shí)用百度搜索引擎搜索關(guān)鍵詞“蘋果”,其相關(guān)結(jié)果約100,000,000個,在首界面中包含蘋果公司的股票信息,計(jì)算機(jī)公司蘋果的官方網(wǎng)站,蘋果的制作方法,蘋果的營養(yǎng)成分以及電影等許多雜亂信息,影響了用戶體驗(yàn)和信息獲取的效率。為了改善用戶對搜索的體驗(yàn),提高用戶獲得所需要檢索結(jié)果的效率,并設(shè)計(jì)出具有更好交互性能的檢索系統(tǒng)是目前十分重要的研究方向。
國內(nèi)外目前研究用戶信息搜尋行為最常用的方法是基于點(diǎn)擊日志分析法,通過分析大量的歷史點(diǎn)擊數(shù)據(jù)記錄或查詢?nèi)罩荆瑥亩l(fā)現(xiàn)用戶在搜索過程中的一般行為特征及其規(guī)律特性。但是,雖然能有助于了解用戶的某些行為習(xí)慣,但是很難進(jìn)行用戶的特征識別,同時日志文件的更新頻率不是即時的,不能準(zhǔn)確的反映用戶的真實(shí)意圖以及內(nèi)在的心理特征和行為特征。眼動技術(shù)的出現(xiàn),為信息檢索研究提供了新的途徑,它提供了實(shí)施更新的數(shù)據(jù)集以及直觀的可視化工具,使研究方法得到有效的補(bǔ)充。
二、眼動數(shù)據(jù)的產(chǎn)生與記錄
眼動記錄的實(shí)現(xiàn)主要借助于實(shí)驗(yàn)的方法,原理上,通過眼動設(shè)備加工來自紅外線眼球攝像機(jī)所記錄的視頻信息,從而識別和確定瞳孔中心和眼角膜反射點(diǎn)之間的距離變化。通過測量這些點(diǎn)的x軸和y軸方向的向量距離,得到各個注視點(diǎn)的坐標(biāo),從而獲得眼動的精確值,從而得到實(shí)現(xiàn)追蹤的完整過程。目前的實(shí)驗(yàn)設(shè)備主要是非侵入式眼動儀,采用外部顯示的模式,不干擾讀者的閱讀,從而數(shù)據(jù)的獲取更加易用和準(zhǔn)確。由于是非侵入式的眼動設(shè)備進(jìn)行實(shí)驗(yàn),受測者無需佩戴頭盔,配戴眼鏡,這樣可以允許較大的頭動范圍。
同時,基于瞳孔漂移補(bǔ)償算法能保證容許較大的光線差別,同時適合明亮?xí)r瞳空和黑暗時瞳孔追蹤。設(shè)備高效的雙眼追蹤可研究受測者的單只眼動情況,在不同的環(huán)境光條件和較大的頭部運(yùn)動條件下仍然可保證穩(wěn)定追蹤性能。
實(shí)驗(yàn)的一般步驟如下:
1. 實(shí)驗(yàn)前,完成實(shí)驗(yàn)設(shè)備的架設(shè)工作,邀請受測者填寫測前問卷,用來了解受測者的閱讀和檢索習(xí)慣等,為后期實(shí)驗(yàn)結(jié)果的處理做準(zhǔn)備。
2. 實(shí)驗(yàn)為受測者逐一進(jìn)行實(shí)驗(yàn),每一位受測者單個進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)時的坐姿注意保持,適當(dāng)注意身體與屏幕的距離。妥善安放受測者的手機(jī)等個人物品,既不打擾試驗(yàn)運(yùn)行也保障受測者的個人物品不會丟失。
3. 調(diào)整受測者的坐姿使受測者達(dá)到舒適的程度,調(diào)整椅子距離屏幕的距離,使得受測者與屏幕的距離為一個設(shè)備可以接納的固定值,采用九點(diǎn)定標(biāo)法,對受測者的視線進(jìn)行校準(zhǔn),保證定標(biāo)結(jié)果顯示良好。
4. 在實(shí)驗(yàn)準(zhǔn)備工作進(jìn)行結(jié)束后,在經(jīng)過受試者同意并確認(rèn)實(shí)驗(yàn)的有關(guān)要求了解的情況下正式開展實(shí)驗(yàn)。實(shí)驗(yàn)中,被測者逐一閱覽實(shí)驗(yàn)材料,實(shí)驗(yàn)將持續(xù)進(jìn)行,直到試驗(yàn)結(jié)束后,測試界面跳回到初始界面。
5. 試驗(yàn)完成后,進(jìn)行數(shù)據(jù)保存,被試者的身份信息將會被匿去,發(fā)放實(shí)驗(yàn)津貼給參與實(shí)驗(yàn)的被測人員,后期開展實(shí)驗(yàn)數(shù)據(jù)的分析。
三、通過分析眼動數(shù)據(jù)得到檢索優(yōu)化指標(biāo)
興趣區(qū)(Area of Interest,AOI)是對實(shí)驗(yàn)材料畫出的特定區(qū)域,用來表達(dá)被測者在某一區(qū)域內(nèi)的眼動表現(xiàn)。
眼動實(shí)驗(yàn)記錄的主要指標(biāo)主要由關(guān)注度指標(biāo)和操作性指標(biāo)兩種指標(biāo)構(gòu)成。
關(guān)注度是指界面上興趣區(qū)(AOI)對于用戶的吸引力的大小。
操作性是指界面上的興趣區(qū)對用戶使用績效的影響。
通過將閱讀領(lǐng)域中眼動研究指標(biāo)選擇的相關(guān)文獻(xiàn),結(jié)合實(shí)驗(yàn)的實(shí)際數(shù)據(jù)表現(xiàn),信息檢索分析過程中采用的基于眼動的行為數(shù)據(jù)有平均訪問時間、平均注視次數(shù)和瞳孔直徑比作為衡量某條檢索結(jié)果的用戶興趣度值是十分合理的。
(一)用戶訪問時間(T)
人類視覺的主要信息都是從注視的場景中獲得的,訪問是指一段從首個注視點(diǎn)出現(xiàn)在興趣區(qū)到下一個注視點(diǎn)移出興趣區(qū)的這段總時間。
(二)用戶注視次數(shù)(C)
注視是指眼睛相對同步在相對穩(wěn)定的狀態(tài)下一段時間內(nèi)(通常是80~200毫秒),個體眼球停留在某一個點(diǎn)。當(dāng)眼球?qū)ψ⒁暤膬?nèi)容加工結(jié)束時,則出現(xiàn)眼跳,開始下一次注視。注視的次數(shù)反映了被測試者的信息加工熟練程度、加工策略以及閱讀材料對受測者的難易程度,該參數(shù)是估計(jì)用戶興趣度的最好的行為指標(biāo)之一。
(三)瞳孔直徑比(E)
有研究表明,瞳孔直徑與情緒、動機(jī)和態(tài)度有關(guān)。瞳孔大小變化在一定程度上反映了人的心理活動情況,如心負(fù)荷、語言加工。瞳孔擴(kuò)大是心理努力的敏感指標(biāo)。讀書入迷的人和對某些事物感到濃厚興趣的人,他們的瞳孔都會不同程度地放大。將用戶在某一檢索結(jié)果內(nèi)所有注視的瞳孔直徑的平均值作為平均瞳孔直徑。
四、眼動研究數(shù)據(jù)在檢索結(jié)果優(yōu)化中的應(yīng)用
眼動數(shù)據(jù)是用戶在實(shí)驗(yàn)的過程中記錄的大量信息,為了便于宏觀計(jì)量,一般眼動儀提供了兩種數(shù)據(jù)的表現(xiàn)形式:直觀的數(shù)據(jù)熱點(diǎn)圖和實(shí)時記錄的數(shù)值記錄。
數(shù)據(jù)熱點(diǎn)圖是系統(tǒng)經(jīng)過計(jì)算的本次實(shí)驗(yàn)所記錄的信息的直觀表達(dá),如圖1和圖2所示。該圖可以直觀反映被測者凝視時間最長的部分,深顏色的紅色則表示被測者在閱讀過程中關(guān)注的部分,淺色的綠色代表注視時間較短的部分,兩種顏色之間過渡的顏色表示被測者關(guān)注點(diǎn)以外的其他視覺停留點(diǎn)。
實(shí)時記錄的數(shù)據(jù)在實(shí)驗(yàn)結(jié)束后,由研究者從系統(tǒng)后臺進(jìn)行數(shù)據(jù)導(dǎo)出,經(jīng)過數(shù)據(jù)的整理和計(jì)算,最后得出的數(shù)據(jù),通過預(yù)先設(shè)定程序,系統(tǒng)也可以通過自身進(jìn)行實(shí)時運(yùn)算。
五、結(jié)論與啟示
根據(jù)數(shù)據(jù)集,可以得出眼動在信息檢索排序過程中的排序得分算法:
Rankscore(eye)=T×WeightT+C×WeightC+E×WeightE(公式1)
其中weight為相關(guān)指標(biāo)的權(quán)重值。
從科研角度分析,瞳孔直徑比(E)是無量綱數(shù),而平均訪問時間(T)、平均注視次數(shù)(C)是有量綱量,在進(jìn)行統(tǒng)一的權(quán)重計(jì)算時,不能直接進(jìn)入公式1的計(jì)算。進(jìn)而,要對平均訪問時間(T)、平均注視次數(shù)(C)進(jìn)行歸一化處理,將其統(tǒng)一轉(zhuǎn)化為無量綱量。將平均訪問時間(T)轉(zhuǎn)化為該檢索結(jié)果中用戶平均訪問時間與該用戶被記錄的所有檢索結(jié)果平均訪問時間之比T;將平均注視次數(shù)(C)轉(zhuǎn)化為該檢索結(jié)果中用戶平均注視次數(shù)與該用戶被記錄的所有檢索結(jié)果平均注視次數(shù)之比C。
Rankscore′×WeightT+C′×WeightC+E×WeightE(公式2)
總體而言,在創(chuàng)新性方面,本指標(biāo)體系的構(gòu)建是基于實(shí)驗(yàn)得出的量化的,實(shí)時的反饋數(shù)據(jù),相較于傳統(tǒng)的基于對用戶的半結(jié)構(gòu)化訪談,觀察記錄或問卷等形式得出的檢索排序指標(biāo),基于實(shí)驗(yàn)的檢索結(jié)果興趣度表征指標(biāo)體系能夠有效的補(bǔ)充其存在的不足,在如今信息日益膨脹的整體信息環(huán)境下,基于用戶的個性化檢索定制有著重要的意義。
可行性方面,隨著科技的不斷進(jìn)步,用戶生理信息的采集愈發(fā)方便和高效,尤其是對眼球的識別以及虹膜識別技術(shù)已經(jīng)十分成熟。針對移動設(shè)備的眼動實(shí)驗(yàn)設(shè)備也愈發(fā)小型化和輕型化。用戶在非實(shí)驗(yàn)條件下信息檢索過程中的信息也能被捕捉和采集從而進(jìn)行匯總分析并加以優(yōu)化和完善,信息技術(shù)的進(jìn)步為信息獲得者帶來的效率改善將得到極大的提升,故而本研究有著一定的前瞻性。
參考文獻(xiàn):
[1]許鑫,曹陽.基于眼動追蹤實(shí)驗(yàn)的高校圖書館門戶網(wǎng)站網(wǎng)頁設(shè)計(jì)研究[J].大學(xué)圖書館學(xué)報,2017(03).
[2]王婷婷.大學(xué)生對招聘網(wǎng)頁注意偏好的眼動研究[D].魯東大學(xué),2017.
[3]王秀紅,袁銀池.閱讀行為眼動研究知識圖譜分析[J].圖書情報研究,2016(02).
[4]周健.信息界面視覺刺激的用戶行為模式研究[D].東南大學(xué),2016.
[5]袁銀池.用戶專利文獻(xiàn)閱讀興趣拓?fù)溲芯考霸谥鲃油扑臀⒎?wù)中的應(yīng)用[D].江蘇大學(xué),2016.
[6]張文雅.基于可讀性的信息檢索模型研究[D].天津大學(xué),2016.
[7]陳永強(qiáng).基于眼動和主題模型的個性化實(shí)時查詢擴(kuò)展模型的研究[D].天津大學(xué),2016.
[8]盧萬譞.基于眼動跟蹤的網(wǎng)絡(luò)搜索行為分析與預(yù)測[D].北京理工大學(xué),2015.
[9]花妍.具有語義一致性的跨模態(tài)關(guān)聯(lián)學(xué)習(xí)與信息檢索[D].北京郵電大學(xué),2015.
[10]李娜.中學(xué)生多媒體瀏覽行為的眼動實(shí)驗(yàn)研究[D].寧波大學(xué),2015.
[11]胡偉.大學(xué)生多媒體閱讀中檢索行為的眼動實(shí)驗(yàn)研究[D].寧波大學(xué),2015.
[12]王宇,張?jiān)魄?探索式搜索行為的眼動研究[J].圖書情報工作,2014(11).
[13]郭一超.基于眼動追蹤技術(shù)的區(qū)域顯著性評估方法研究[D].北京交通大學(xué),2014.
[14]徐賁.CNKI文獻(xiàn)關(guān)聯(lián)推薦用戶選擇行為的實(shí)驗(yàn)研究[D].浙江師范大學(xué),2011.
[15]蔣波,章菁華.1980~2009年國內(nèi)眼動研究的文獻(xiàn)計(jì)量分析[J].心理科學(xué),2011(01).
[16]李曉麗,黃敏,莫冰.視線跟蹤法——網(wǎng)絡(luò)用戶信息行為研究的新方法[J].圖書館理論與實(shí)踐,2009(08).
(作者單位:江蘇大學(xué)科技信息研究所)