楊曉娟 廖晨輝
【摘要】隨著開放教育資源運動開展與深入,在互聯網絡中形成開放的、超大規模的、世界范圍內最先進的多媒體教育資源網頁集群。然而使用搜索引擎檢索的結果中存在大量的重復網頁,導致資源獲取難、利用率低的問題。文章在總結現有網頁消重方法的基礎上提出一種可行的兩階段的多媒體教育資源網頁消重方法,實驗證明,通過對網頁文本信息及多媒體信息分開消重,能有效地提高消重的效果。
【關鍵詞】開放教育資源;基于簽名的消重方法;基于關鍵詞的消重方法;shingling算法
【中圖分類號】G40-057【文獻標識碼】A【論文編號】1009-8097(2012)09-0093-04