劉燦 任劍宇 李偉 張強強
摘 要:為了滿足人們能快速、準確地獲取個人最關心的教育類新聞的實際需求,本文提出了一種面向個性化推薦的教育新聞爬取及展示系統。本系統采用主題爬蟲技術,在對爬取策略及爬取內容進行文本解析的基礎上,獲取教育新聞數據。結合用戶需求特征,利用協同過濾的推薦策略,生成滿足不同用戶需求的個性化頁面,并以詞云和列表的形式展示給用戶。該系統為人們獲取最具時效性的教育新聞信息提供了一種可行的途徑。
關鍵詞:個性化推薦;教育新聞;主題爬蟲;詞云
中圖分類號:TP319 文獻標識碼:A
Abstract:In order to meet the actual needs of people who can quickly and accurately obtain the education news that individuals are most concerned about,we propose a customized crawling and displaying system for education news.Based on the text analysis mechanism of crawling strategy and crawling content,this system obtains the educational news data,combines the characteristics of user needs,and uses the recommendation strategy of collaborative filtering to generate a personalized page that meets the needs of different users,and presents the page to users in the form of word clouds and lists.The system provides a viable way for people to obtain the most up-to-date educational news information.
Keywords:personalized recommendation;education news;topical crawler;word cloud
1 引言(Introduction)
隨著國家及個人對各類教育重視程度的不斷提升,關注教育熱點信息的社會群體越來越多。然而,由于教育新聞種類繁多,既有中小學、大學等課堂教育相關的新聞,又有培訓、繼續教育等非學歷教育相關的信息,還有國家及地方政府出臺的各類教育制度等,人們很難快速、準確地獲取到最關心的教育新聞。如何從浩如煙海的互聯網大數據環境中快速、準確地獲取最權威的教育新聞熱點信息成為一個亟待解決的問題。此外,從個性化推薦的角度分析,多數新聞站點對所有用戶提供的都是同樣的資源,缺乏針對不同用戶的個性化推薦功能。因此,研發一種面向個性化推薦的教育新聞爬取及展示系統已成為一個重要研究課題,這對于更好地服務民眾具有重要的現實意義。
2 相關研究(Related research)
2.1 主題爬蟲技術……p>