張小波 付達杰



摘要:為了更好的幫助用戶在網絡獲得個人所需的信息資源,搜索引擎、推薦系統需要搜集和使用大量用戶的個人信息,而這些個人信息中大都包含了一些隱私數據,因此用戶隱私安全的問題就隨之而出。首先就網絡信息資源個性化推薦中隱私保護進行了綜述,然后分析比較了目前使用的相關保護措施,最后提出隱私保護措施的幾點改進。
關鍵詞:個性化搜索;個性化推薦系統;隱私保護;信息安全;網絡安全
中圖分類號:TP315 文獻標識碼:A DOI:10.3969/j.issn.1003-6970.2015.04.014
0.引言
隨著互聯網的飛速發展,大數據時代也接踵而至,大幅增長的數據使得以此為基礎使用搜索引擎進行搜索的結果也相應增加,從而用戶需找其所需的網絡信息資源也變得越來越困難。早先當用戶分別在Google、Yahoo或者百度上使用同一關鍵字進行搜索的時候,雖然有幾十頁甚至上百頁的結果,但是大部分是重復的或者不相關的,很明顯,這并不是用戶所需要的理想的結果。在此需求之下,個性化推薦系統相應而生。個性化推薦系統是根據用戶的個性化信息,例如興趣、愛好、搜索習慣等進行統計建模,然后將相關聯的網絡信息資源(網頁、產品等)在用戶進行搜索的時候推薦給用戶,以滿足用戶多元化個性化的需求。
1995年3月斯坦福大學的Mark Balabanovic等人在美國人工智能協會上率先推出了個性化推薦系統LIRA。從此之后,個性化推薦技術開始迅猛地發展,2004年3月Google第一個beta版Personalized Search從Google Labs Proiect誕生,得到了用戶的好評。緊隨其后,國內外大量的研究院和公司開始投入巨資進行個性化推薦系統與個性化搜索技術的研發。在個性化推薦系統與個性化搜索技術當中核心就是獲取用戶個人信息數據,這些數據包含了大量用戶的隱私,隱私安全這一敏感問題漸漸浮現出來。雖然一些國家擬定了相關的法律法規來保護隱私數據,但是在隱私保護技術上仍然處于起步階段,以致正當個性化推薦系統發展的如火如荼之時,AOL、Yahoo、Apple、Faeebook等知名大型企業曝出用戶搜索數據、注冊信息泄露問題。其中國內所熟知的中國開發者技術在線社區CSDN更是有600萬注冊用戶數據被泄露。這些數據包含了用戶的興趣、愛好、聯系方式等,使得用戶對于網絡信息安全信任度降低和對個性化推薦的反感。從而導致需要大量用戶信息的個性化推薦系統與個人隱私保護之間產生了一定的矛盾。本文對現有隱私保護的措施進行了相關的研究,并指出其中的不足,提出相關改進建議,使之能在一定程度上平衡矛盾。