1 文檔對象模型
HTML文檔是由網頁內容和大量用于布局網頁內容顯示效果的標簽組成。處理網頁時,W3C的文檔對象模型應用編程接口將網頁解析成文檔對象模型樹。DOM是由W3C制定的一種獨立于平臺和具體編程語言的API接口標準。把HTML文檔組織成樹結構,通過對樹中各節點的操作來完成對HTML文檔的操作。DOM樹中基本構成單位為節點。節點對象通過逐層間的嵌套關系形成一棵DOM樹,節點內部包含了網頁的內容信息。在將網頁解析為抽象的節點樹后,就可以利用樹匹配算法計算網頁間的相似度。
智能計算機與應用2010年4期
1《師道·教研》2024年10期
2《思維與智慧·上半月》2024年11期
3《現代工業經濟和信息化》2024年2期
4《微型小說月報》2024年10期
5《工業微生物》2024年1期
6《雪蓮》2024年9期
7《世界博覽》2024年21期
8《中小企業管理與科技》2024年6期
9《現代食品》2024年4期
10《衛生職業教育》2024年10期
關于參考網