在電影《復仇者聯(lián)盟2:奧創(chuàng)紀元》中,有一個精彩的情節(jié)是當綠巨人浩克被緋紅女巫迷惑心智后在城市中大肆破壞時,鋼鐵俠與他的專屬智能大腦賈維斯對話,通過“浩克”這個關鍵詞快速搜索實時新聞報道和視頻中的相關信息,得出綠巨人的位置;鋼鐵俠及時趕到并啟動了反浩克戰(zhàn)甲,阻止了綠巨人的破壞行為。在這個情節(jié)中,智能大腦賈維斯依據(jù)鋼鐵俠給出的“浩克”這一關鍵詞,從海量的新聞報道、網(wǎng)絡視頻數(shù)據(jù)中檢索出相匹配的信息,并返回給鋼鐵俠,這里應用的就是信息檢索技術,如圖1所示。

圖1 《復仇者聯(lián)盟2》電影中的片段
信息檢索技術這一名詞在人們的生活中無處不在。可以說,只要是應用了搜索引擎的應用,都會有信息檢索的影子。大家一定都用過百度、搜狗、谷歌、必應這些搜索引擎吧?在搜索引擎中搜索“浩克”,可以從海量數(shù)據(jù)中檢索出浩克的基本信息、最新電影狀況、相關演員動態(tài)等;在電商平臺中搜索“浩克”,可以檢索出與浩克相關的書籍、玩具、游戲等;在社交平臺中搜索“浩克”,可以檢索出與“浩克”一詞相關的用戶昵稱、網(wǎng)友互動信息、短視頻;等等。
信息檢索技術極大地方便了人們的生活,能讓人們快速定位感興趣的信息,大大節(jié)省了人們的時間與精力。信息檢索的基本原理是什么呢?首先,用戶需要明確自己需要檢索的信息是什么,并將檢索信息輸入搜索引擎。例如,剛才提到《復仇者聯(lián)盟2:奧創(chuàng)紀元》中的情節(jié),鋼鐵俠需要檢索的信息是“浩克在哪里”,這條信息中對應的知識可能就是“綠色”+“大塊頭”。……