裘進 李秋霞
摘 要 農業信息的獲取對用戶農業生產來說至關重要,其直接影響了農民的收入。由于農業具有地域性、季節性等情境特點,再加上用戶具有個人偏好上的動態變化,使農業信息推薦的時效性尤為重要。基于此,將農業情境特點、用戶搜索瀏覽行為、用戶特征、信息偏好、時間變化等綜合考慮,構建面向涉農用戶的農業信息個性化推薦服務框架和算法模型。
關鍵詞 農業信息資源;用戶興趣偏好;個性化推薦
中圖分類號:TP391.3 文獻標志碼:B DOI:10.19415/j.cnki.1673-890x.2018.15.109
在信息技術不斷發展的今天,農業領域對信息資源的需求也隨之增強,掌握農業信息對涉農用戶的生產、市場活動有著密切的關系,如何在農業領域相關活動中推進信息化技術的應用,如何利用信息化技術使農業信息需求用戶及時獲知農業方面的政策法規、前沿技術、市場信息,并提供具有針對性的個性化咨詢服務成為了農業信息化推進過程中的一大難題。一方面,農業信息涉及因素較多,結構關系復雜;另一方面,用戶快速獲取信息的時效性和針對性不強。
目前,信息推薦系統大多是根據用戶網絡瀏覽行為進行相關推薦,對用戶具體特征、用戶偏好及情境因素等考慮較少[1]。事實上,用戶對信息的需求是不斷變化的,但已有的推薦算法大多停留在靜態層面,并未考慮到時間差異對用戶偏好的動態改變,用戶對信息偏好的興趣會隨著時間推移出現動態漂移,從而在一定程度上引起最終推薦效果的偏差[2]。因此,為解決涉農用戶農業信息過載、信息不對稱、信息獲取效率低等問題,應結合用戶情境特點和信息興趣的偏好變化,建立農業信息個性化推薦的基本流程和算法。
1 農業信息服務的關聯因素
1.1 農業信息情境
農業信息推薦服務是以用戶為服務對象,信息資源為基礎數據,為用戶提供個性化信息推薦服務為目標。由于農業信息服務會受到農業領域中相關情境因素的影響,如地域、季節、溫度、土壤、光照、市場、種植技術水平等因素,所以農業信息推薦服務具有情境因素的特點。
情境因素的獲取是指根據用戶所處的具體農業環境和農業生產因素,一方面需獲取用戶農業信息資源的地理特性、周期性的特點,另一方面通過物聯網傳感器技術對所處農業領域溫度、濕度、土壤等農業生產信息資源進行獲取。以上兩方面情境因素的獲取是對用戶不斷變化的周圍環境信息進行獲取處理的過程。
1.2 用戶興趣偏好信息的獲取
在農業信息資源推薦中,即使用戶在相同的地域、時節、氣候、土壤等情景條件下,其信息需求也會有一定差異。因此,如何構建用戶對信息需求偏好與已有信息資源之間的關系,是農業信息個性化推薦服務中的重要環節。
本研究主要從用戶顯式行為信息和隱式信息兩方面構建用戶對農業信息的興趣偏好計算模型。顯式信息的獲取是通過用戶主動提供的一些個人基本情況、信息內容偏好、獲取信息的方式等多方面來構建用戶的興趣偏好模型。隱式信息的獲取是在用戶沒有主動參與的情況下,通網頁信息瀏覽、網頁點擊、網頁保存、網頁打印、服務器端日志數據等操作提取用戶興趣偏好。
1.3 信息個性化推薦技術
在生產應用的各領域中,信息資源數量呈指數式增長,這使得用戶無法在最短的時間內快速獲取高需求信息,從而導致信息過載、使用效率低下、信息獲取成本高等多種問題。本研究采用個性化信息推薦技術以提高農業信息領域信息資源利用率,針對用戶個性化的特點和需求,構建以用戶為中心的信息推薦服務,從而解決信息過載、搜尋信息針對性較差的問題。基于此,構建的個性化農業信息推薦服務模型主要包含三大模塊:農業信息資源數據庫、用戶興趣偏好計算、農業信息個性化推薦三個模塊,如圖1所示。
2 個性化推薦平臺總體架構
基于數據獲取渠道、數據信息、信息偏好匹配構建了農業信息個性化推薦的服務框架,以為農業信息用戶提供信息資源服務,如圖2所示。
3 農業信息個性化推薦模型
3.1 用戶偏好模型的構建
用戶對農業信息的偏好程度可從用戶在網頁搜索瀏覽行為上體現,主要包括農業信息網頁的點擊瀏覽、訪問時長、頁面保存、頁面打印等行為,農業信息推薦服務模塊如圖3所示。通過以上行為,可構建用戶偏好行為的靜態度量模型,故用戶對網頁信息瀏覽偏好函數可表示為:
I(m)=φ(f(m),t(m),s(m),p)
f(m)為用戶對網頁m點擊情況函數,t(m)是在網頁m上的訪問時長,s(m)是對網頁保存情況的函數,p(m)是對網頁打印情況的函數。上述用戶偏好函數模型并未將用戶訪問農業信息網的時間信息變化考慮在內,基于此,根據實際應用中用戶對農業信息的需求與時間推移變化的關系,構建農業信息個性化推薦來契合用戶的真實需求。研究發現,用戶的興趣偏好會隨著時間而減弱,一般來說,用戶對最近的網頁瀏覽興趣度較高,而對先前的搜索瀏覽行為興趣偏好弱化,因此,農戶信息偏好的網頁信息應該與最近時間搜索瀏覽的網頁相似,于是將用戶網頁搜索瀏覽的時間信息融入到偏好度模型中,修正的用戶偏好度模型可表示為:
w(u,m)表示基于時間的權重因子,已訪問農業信息網頁m對用戶u的權重。
進一步利用顯式獲取和隱式獲取的方法,將用戶主動提供的興趣偏好、跟蹤用戶搜索瀏覽網頁的行為推理出用戶偏好,從而獲取用戶信息需求。此外,將用戶情境因素融入模型構建中,得到用戶綜合興趣偏好模型:
3.2 推薦算法的實現
通過獲取用戶相關的情境因素,以及用戶在搜索瀏覽信息過程中顯式、隱式信息,利用網頁信息偏好度計算得到用戶對網頁信息的偏好程度,并結合用戶偏好推薦公式計算得到的前N篇農業信息網頁,并返回給農戶,為涉農用戶提供農業信息方面的相關推薦。具體算法描述如下。
輸入:目標用戶u的情境數據,用戶u訪問過的農業信息資源數據、訪問時間。
輸出:向目標用戶u推薦的N篇興趣偏好度最高的網頁信息。
過程:1)通過傳感器、GPRS等互聯網終端設備采集用戶相關情境信息,形成向量U;2)利用相似度公式計算用戶情境因素與待推薦網頁信息的相似值,從而獲得所需推薦的農業信息,轉入f;3)對Web用戶日志信息進行挖掘,獲取用戶大量的網頁搜索、瀏覽行為數據,并對數據進行清洗、去噪、提取等相關處理,再通過熵權計算法,得到目標用戶u的行為權重;4)讀取目標用戶u訪問的每個信息資源i的行為數據和訪問時間數據,得到基于最近信息瀏覽的集合C;5)對集合C中用戶偏好度值進行標準化處理,計算得出待推薦農業信息與用戶情境、瀏覽行為相匹配的相似度I(A);6)將排序最前、最相關的N篇網頁信息推薦給用戶。
4 結語
農業信息的個性化推薦系統對于用戶和農業信息服務網站來說至關重要,它不僅能夠提升用戶信息搜索瀏覽的時間效率,也可幫助農業信息服務網站根據用戶群里的需求充分挖掘用戶的消費潛力。為了滿足用戶對農業信息個性化、準確性、高效性的需求,將涉農用戶情境因素、網頁搜索瀏覽行為、訪問時間、興趣偏好綜合考慮,構建了一個多信息構成的綜合推薦模型,并設計個性化農業信息推薦算法,使推薦結果更加符合用戶的真實需求。
參考文獻:
[1] 王國霞,劉賀平.個性化推薦系統綜述[J].計算機工程與應用,2012,48(7):66-76.
[2] 邢春曉,高鳳榮,戰思南,等.適應用戶興趣變化的協同過濾推薦算法[J].計算機研究與發展,2007,44(2):296-300.
(責任編輯:趙中正)