李玲
【摘 要】人工智能是對人的意識、思維的信息過程的模擬。本文介紹了當前信息檢索面臨的問題和現有人工智能方法,并闡述了現階段人工智能在信息檢索方面的應用。
【關鍵詞】人工智能;信息檢索;檢索技術
【Abstract】Artificial intelligence is the simulation of the information process of human consciousness and thinking. This paper introduces the current problems of information retrieval and the existing artificial intelligence methods, and expounds the application of artificial intelligence in information retrieval.
【Keywords】Artificial intelligence; Information retrieval; Retrieval technologies
一、引言
人工智能(Artificial Intelligence)是當前科學技術發展中的一門前沿學科,是在計算機科學、控制論、信息論、神經心理學、語言學等多種學科基礎上發展起來的一門綜合性很強的邊緣學科。它是研究機器模擬人的大腦所從事的感覺、認知、記憶、學習、聯想等思維活動,解決人類才能處理的復雜問題,實質上是模仿人的大腦而展開思考。目前,人工智能技術已經應用在許多方面,而信息檢索(Information Retrieval)就是其中的一個重要應用。
二、信息檢索存在的問題
信息檢索將分散的信息以某種方法提煉、整合成數據資源,然后從數據資源中正確找出用戶指定的信息。信息檢索存在很難成立信息檢索的專家庫、計算機識別自然語言能力差等問題。
(1)獲取知識,關鍵是很難成立信息檢索的專家庫。用戶因為年齡、受教育程度、愛好、職業等方面的原因,對獲取信息的需求不同。專家能滿足人們知識領域的專業需求。對計算機來說,合理定位用戶是一件困難的事情。術業有專攻,各種領域的知識專業性,嚴重阻礙了計算機對系統化知識的整理。每一位專家在信息檢索知識方面具有獨特的見解,而計算機對專家經驗認知的偏差,導致難以成立信息檢索的專家庫。例如,計算機工程師和商店服務員分別查詢“無人商店”的信息,計算機工程師檢索需求側重于技術,商店服務員檢索需求側重于應用。
(2)知識的表示,關鍵是計算機理解自然語言的能力。人們重要的溝通交流工具是語言,它會根據人們生活的發展而不斷改進。人們擁有豐富的語言能力,能輕松地表達各種情感,描述各類詞語。用戶可以通過一句話的語調,表達自己的兩種態度。例如“你真討厭”,這句話對于情侶來說,有可能是厭煩,也可能是撒嬌。計算機面對詞語,沒有情感,不能準確描述信息的內容。因此,計算機對語言環境缺乏精確判斷,阻礙了信息檢索技術的發展。
要想提高計算機的數據信息處理能力和自然語言的理解能力,要將人工智能技術與信息檢索技術有效地結合起來。
三、人工智能方法
人工智能就是為了幫助人們更快的解決問題,它包括兩方面:對于確定性事物的判斷和對于不確定性事物的判斷,它的主要方法包括以下幾種。
(一)啟發式搜索
不斷地嘗試各種方案的準確性,對各種可能性進行反復測試,直到找到合適的解決方案,是人們常用的方法。常用的搜索策略有盲目搜索和啟發式搜索。盲目搜索是按順序測試各種方案的可行性;而啟發式搜索則可以根據經驗和啟發式信息進行搜索,對希望不大的搜索方向就直接摒棄掉。
啟發式搜索可以利用問題本身的定義,還可以利用與問題有關的一些特定的知識進行搜索,因而可以找到更有效的解決方案,大大縮短了搜索過程。
(二)智能規劃
智能規劃主要是面向實際問題,基本思想是:對周圍環境進行認識與分析,根據要實現的目標,對若干可供選擇的動作及所提供的資源限制施行推理,綜合制定出實現目標的規劃。規劃要依靠啟發式信息,成功與否,很大程度上決定于啟發信息的可靠程度。而智能規劃問題的操作的前提之間也存在著很強的依賴與沖突關系,即一個操作的使用常常使另一個操作無法執行,甚至導致最終目標無法實現。因此,在智能規劃中也要考慮如何避免操作間的沖突。
智能規劃目的是建立起高效實用的智能規劃系統。該系統的主要功能可以描述為:給定問題的狀態描述、對狀態描述進行變換的一組操作、初始狀態和目標狀態。智能規劃系統能夠給出從初始狀態變到目標狀態的一個操作序列,其復雜性和所處的環境以及Agent的功能有關。
(三)知識的表達技術
知識及其表達是計算機科學中智能程序設計研究的主要領域,也是人工智能領域關心的基礎性問題。知識表達(Knowledge Representation),即知識表示或知識描述,也就是知識的形式化或模型化,是研究在機器中表示知識的方法、可行性、有效性及一些通用的原則。而智能程序,就是把現實世界的知識有機地結合到計算機程序中,使程序具有識別、學習、推理和適應環境等能力。主要技術包括:如何把各類知識進行編碼、存儲;如何快速尋找需要的知識;如何對知識進行運算、推理;如何對知識進行更新、修改等。
四、人工智能在信息檢索中的應用
人工智能是對人的意識、思維的信息過程的模擬,已被應用于電商零售、教育等各個領域。智能信息檢索系統是模擬人類關于數據處理的思維過程和智能活動,實現知識的檢索、表示和推理,還為用戶提供智能輔助。從技術方面,將智能信息檢索技術分為三類:基于垂直搜索的信息檢索技術、基于語料庫的信息檢索技術和基于語義網的信息檢索技術。
第一種垂直搜索的信息檢索技術,是基于研究各種信息的專業性,采用結構化信息加工、全文深度搜索、分組和捕獲等核心技術,檢索信息。垂直搜索的信息檢索技術具有查詢時間短、搜索效率高的優點,其缺點是應用范圍有限、查全率低、需要人工建模分類。例如,大學生畢業找工作,可以去求職網頁上,按照工作崗位、工資薪酬、工作地點等檢索條件查找自己需要的崗位。
第二種語料庫的信息檢索技術,是基于多種多樣的自然語言,采用解析目標信息的語義,在語料庫中搜索到與內容相匹配的信息。語料庫的信息檢索技術具有查詢信息范圍大、正確率高、查全率高的優點,其缺點是檢索時間長、需要人工構建語料庫。
第三種語義網的信息檢索技術,是基于研究數據之間的關系,使用語義網技術,完成信息查找。語義網的信息檢索技術提高了數據檢索層面、增強了自然語言的理解力、提升了查全率,其缺點是檢索速度慢、查詢復雜、耗費大量人工。
五、結語
隨著各個領域信息量的不斷增加,人們對信息檢索的需求也日益增加,傳統的信息檢索方法逐漸被智能信息檢索系統取代。智能信息檢索滿足人們對信息多樣化的需要,有利于提高信息檢索的效率。
【參考文獻】
[1]呂進來.人工智能技術在信息檢索中的應用[J].山西電子技術,2016(5):34-35.
[2]宋文賓,錢興華,劉鵬.智能信息檢索應用技術研究[J].船舶電子工程,2015(7):136-140.
[3]付存君.智能信息檢索發展現狀的研究[J]. 信息與電腦,2015(12):23-24.