摘 要:由于文檔網絡的發展遇到了瓶頸,如機器不可理解,不夠智能化,失效鏈接,Tim Bernners提出了Data Web,失效鏈接在Data Web中也有出現,但是數據網絡中的數據源是機器可以理解的,所以解決文檔網絡中的問題變得更容易,不會再成為阻礙互聯網發展的瓶頸。本文就數據網絡中解決失效鏈接的方法進行了比較分析,并給出了對這一領域未來發展的思考與展望。
關鍵詞:數據網絡;失效鏈接;鏈接一致性;主動監測
中圖分類號:TP393 文獻標識碼:A 文章編號:1674-7712 (2015) 02-0000-01
目前Data Web所面臨的最大的問題是機器如何自動解決失效鏈接,LOD(Link Open Data)項目推動了許多機構將數據發布到Web上,并與其他數據源相互關聯[1]。不過一旦LOD數據源有所變動,數據源之間的關聯可能會產生斷鏈,會引起基于LOD的應用隨之也發生錯誤。在文檔網絡中,是通過終端用戶手動解決斷開的鏈接,終端用戶的典型做法是,使用瀏覽器上的撤退按鈕,或者使用web搜索引擎來手動找到鏈接目標,而這一做法對于數據網絡來說更是難上加難,因為數據網絡的主體是機器,信息內容和鏈接間的語義是機器可理解的。一旦某些數據發生變化,其他的數據集有必要及時增加、刪除或者修改與之的鏈接。針對于Data Web,具有代表性的研究成果有基于主動監測機制的DSNotify框架,基于SPARQL協議的Silk框架,基于WOD-LMP協議的動態鏈接維護以及基于元數據的鍵連數據鏈接一致性研究。
一、基于主動監測機制的DSNotify框架
DSNotify[2]能夠輔助用戶修補失效鏈接,在現存的應用程序中可以使用該框架作為附加策略,以便發現數據集的變化。DSNotify不僅是探測整個鍵連數據的服務,而且它還是一個輕量級組件,但是僅僅針對一部分類型的鍵連數據的數據源。DSNotify是基于索引結構來發現失效鏈接,探測機制通過咨詢索引來發現資源的變化類型,然后將發現的事件寫入到事件日志并將通知發送到注冊應用程序中。
DSNotify的主動監測過程:首先網絡門戶將鍵連數據鏈接到外部數據源,一旦鏈接遭到破壞,網絡門戶就會使用DSNotify機制來探測遠程數據源,并收到數據事件的通知。最后網絡門戶會更新數據,這樣就保持了鍵連數據的一致性。
DSNotify的不足:只能發現失效鏈接,不能在數據層修補失效鏈接,而是交由應用層處理。其次,DSNotify是分時探測數據源,對于數據資源更新比較快的網絡是不適合的;再者,DSNotify在對失效鏈接進行反饋時,所采用的字符串匹配算法并不能準確地找到匹配的目標源,從而造成事件類型判斷錯誤,大大影響鏈接的有效性。
二、基于SPARQL協議的Silk框架
Silk[3]包括三個組件:(1)鏈接發現機制,基于共享標識符和目標相似度計算數據源之間的鏈接;(2)規則工具,通過評估生成的RDF鏈接來調整鏈接規則;(3)維護協議:維護頻繁變化數據源之間的RDF鏈接。
使用Silk-鏈接規格說明語言,數據發布者可以明確數據源之間的RDF鏈接類型,以及為了能夠自動建立RDF鏈接,數據項所必需的條件。對于實體的多重屬性,鏈接條件應用到不同的相似度量,使用不同相似度聚集函數來衡量相似度大小。Silk通過SPARQL協議訪問數據源,并且可以發現本地和遠程數據源之間的鏈接。
Silk鏈接發現機制的主要特征:支持OWL各種RDF鏈接類型的產生,如same as鏈接;為建立鏈接條件提供靈活性的、說明性的語言;不需要本體數據庫副本,可以應用到分布式環境;通過實現不同緩存、索引和實體預選來提高性能,減輕網絡負載。
Silk鏈接發現機制的不足:支持的鏈接用例范圍不夠廣泛,僅僅能夠發現RDF數據源之間的鏈接,不能處理失效鏈接;還不能用到實際的網絡實體中。
三、基于WOD-LMP協議的動態鏈接維護
WOD-LMP協議(Web of Data Link Maintenance Protocol)是專用的鍵連數據鏈接維護協議[4],其消息傳遞機制允許用五種方法在源數據與目的數據之間傳遞五類消息,其中linkNotification()方法用來將源S生成的SD的鏈接信息傳遞給目的數據D;linkDeletionNotification()用來將S刪除的SD斷鏈信息傳遞給D;changeNotification()用于D將S所訂閱資源的變化情況通知S;getChanges()方法用于S從D中獲取所有更新數據。
基于WOD-LMP協議的動態鏈接維護方法是較為理想的方法,但需要鏈接的雙方都遵循相同的協議。此外,支持WOD-LMP協議的目標數據集需要保存、維護來自不同數據集的訂閱信息,并及時將訂閱資源的變化情況反饋給源數據集,在一定程度上增加了目標數據集的負擔。
四、結束語
本文全面地綜述了各類解決鍵連數據鏈接一致性的方案,并分析各個方案的不足。作為一個具有實用價值的研究領域,如何維持數據網絡中鍵連數據鏈接一致性具有光明的發展前景。未來的研究熱點包括:Document Web和Data Web的融合方面,對于網絡中存在的失效鏈接做更深一步的研究,為web發展中所面臨的這一問題提供更好的解決方案;提供開放的API,供更多的相關研究者研究,一起討論,共同提出高效、可靠的開源方法。
參考文獻:
[1]Van de Sompel,H.,Nelson..2010.An Http-based versioning mechanism for linked data,in:LDOW2010,Co-located with WWW’10,Raleith,North Carolina,USA.
[2]DSNotify[EB/OL][2013-04-10].http://www.cibiv.at/~niko/dsnotify/.
[3]Web of Data Link Maintenance Protocol—Maintaining Links Between Changing Linked Data Sources[EB/OL].[2013-03-13].http://www4.wiwiss.fu-berlin.de/bizer/silk/wodlmp/.