XML是Web中數(shù)據(jù)表達(dá)的事實(shí)上的標(biāo)準(zhǔn),每時(shí)每刻都有大量的XML數(shù)據(jù)被存儲(chǔ)、傳輸和查詢。然而,由于信息集成中模式匹配的不精確、信息提取中的不精確、信息錄入的錯(cuò)誤等原因,XML數(shù)據(jù)中可能存在不正確數(shù)據(jù)、不精確數(shù)據(jù)、不一致數(shù)據(jù)等劣質(zhì)數(shù)據(jù)。劣質(zhì)數(shù)據(jù)會(huì)導(dǎo)致劣質(zhì)的查詢結(jié)果,從而降低XML數(shù)據(jù)庫(kù)的可用性和可靠性。當(dāng)前劣質(zhì)數(shù)據(jù)的主要處理方法是數(shù)據(jù)清洗?眼1-2?演,然而數(shù)據(jù)清洗會(huì)導(dǎo)致數(shù)據(jù)損失,而且在一些情況下劣質(zhì)數(shù)據(jù)無法被完全清洗干凈。如何在包含劣質(zhì)數(shù)據(jù)的XML數(shù)據(jù)上直接