朱貴方
(沈陽市勘察測繪研究院,遼寧 沈陽 110000)
《物權法》中明確規定了“國家對不動產實行統一登記制度”。為此,沈陽市于2016年開始對沈陽市本級及市內九區的不動產登記數據進行整理,以確保最終建立沈陽市不動產統一登記成果數據庫。面對數據量龐大的房產存量數據,如何快速準確地完成整理工作是建立沈陽市不動產統一登記成果數據庫的關鍵環節。
沈陽房產存量數據根據測繪的加入分為兩個階段,前一階段沒有測繪信息,房產數據缺少相應的空間位置,房落地相對較難;后一階段,隨著測繪的加入和發展,房產測繪數據越來越準確,基本上做到了房落地,整理過程中只要進一步核實房屋位置和房形即可。針對兩個階段數據的不同情況,本文提出了利用“正”“反”兩個方向進行房產存量數據整理。根據整理出的部分成果可見,此整理方式在保證準確性的基礎上大大提高了效率。
沈陽市不動產登記房屋數據整理是以房產提供的房屋樓盤表數據和房產登記數據為基礎任務數據,房屋樓盤表分為測繪樓盤表和邏輯樓盤表,總數約26萬幢,對應房產登記數據(戶數)約574萬戶。其中測繪樓盤表是具有測繪資料的房屋數據,數據量約有4.4萬幢,對應300余萬戶,該部分數據存在形狀不準確、位置精度差、坐標系統不一致等問題,需要進行坐標轉換、空間位置調整、逐幢核實等整理工作;邏輯樓盤表是無測繪資料的房屋數據,房產部門日常業務中整理出空間位置房屋圖形約1萬幢,對應20余萬戶,剩余約20.6萬幢無空間位置數據,對應約254萬余戶。
通過對各相關數據收集、分析、整理、抽取、轉換等技術手段進行房產數據提取和空間化處理,將數據分為測繪數據和邏輯數據兩大類房產存量數據,利用內外業“正”“反”向調繪一體化技術,確定與房屋相對應的邏輯幢[2]、自然幢[2]的空間位置和房形[1],并對邏輯幢賦予相應的屬性信息[2],利用圖屬關聯進行質量檢查、拓撲檢查,無誤后提交成果數據并編碼入庫。其總體技術路線如圖1所示。

圖1 房屋數據整理技術路線圖
根據房屋數據整理技術路線,本文通過ETL數據提取、數據空間化處理[3]、內外業“正”“反”向調繪一體化、房地圖屬關聯等方法,將沈陽市房產存量數據準確無誤地整理到沈陽市不動產統一登記成果數據庫[4]。
(1)ETL數據提取
ETL(Extract-Transform-Load)是用來描述將數據從來源端經過抽取(extract)、轉換(transform)、加載(load)至目的端的過程[5]。本文采取了ETL的思想[6],通過制定提取規則從房產數據庫中(包括樓表、戶表、開發商表、小區表等)提取有效房屋數據,利用房產已有測繪數據、地名地址數據和地形圖數據等參考數據對所提取數據進行清洗、轉換,最后加載到過程數據庫(自然幢、邏輯幢數據庫)中,整個數據提取流程中除了清洗轉換過程需要一定的人工干預,其他均可制訂相應的規則實現全自動化處理。其數據處理流程如圖2所示。

圖2 ETL數據提取流程圖
(2)數據空間化處理
根據前期對房產數據狀況評估,房產存量數據邏輯數據較多。對于缺失房屋圖形的邏輯數據,利用地名地址數據和邏輯數據中的房屋地址對邏輯數據進行數據空間化處理[7]。將已有空間位置的地名地址數據與無空間位置的房屋地址進行地址匹配,匹配成功后得到房屋地址對應的空間位置,利用此位置地形圖房屋圖形加工制作房產房屋圖形。地址匹配分為精確匹配和模糊匹配兩個過程。
①精確匹配
精確匹配的算法是以邏輯數據的地址(FWDZ)與地名地址數據完全一致為判斷條件,形成具有準確空間位置信息的房產數據,即“房產地址點”圖層。
利用具有空間位置的“房產地址點”和地形圖房屋數據,自動提取包含“房產地址點”的房屋數據并賦予相應的地址屬性信息,獲得具有大致位置的空間化的房產數據,并將其歸入測繪數據,待內外業“正”向調繪時核實房屋準確地址和房形。通過精確匹配共整理出約5.4萬幢房屋數據。
②模糊匹配
模糊匹配是將邏輯數據的地址(FWDZ)與地名地址數據利用地址的語義相似度制定地址匹配算法[10],形成準確性較差的具有大致空間位置信息的“房產地名地址”圖層。由于相似度越大,匹配上的數量越少,但相似度過大又會影響匹配的有效性,所以需要根據地址的不同情況,設置適當相似度值,同時在空間化處理過程中需要加入一定的人工干預。利用模糊匹配算法得到的結果準確度會相應下降,在整理房屋數據時將此類數據作標識碼后歸入測繪數據,待內外業“正”向調繪時核實房屋準確地址和房形。通過模糊匹配共整理出約1.8萬幢房屋數據。
(3)內外業“正”“反”向調繪技術
根據對沈陽市房產數據的了解,其存量房屋數據分為有測繪資料的測繪數據和無測繪資料的邏輯數據,前者加入了房產測繪的測繪資料整理較為容易,而后者無測繪數據整理較為困難。針對這兩大類數據,本文提出了內外業“正”“反”向調繪一體化技術,其流程如圖3所示。此方法可以在保證整理質量的前提下,大幅度地縮短整理時間。

圖3 內外業“正”“反”向調繪流程圖
內外業“正”向調繪一體化主要用于調繪有測繪數據的存量房屋,內業利用已有的參考數據和房產測繪數據進行數據分析提取,將提取有效數據展繪至調繪底圖上,外業作業員實地核實調繪底圖上房屋的地址和房形,其外業調繪圖如圖4所示。利用內外業“正”向調繪便可方便快捷地整理出大量測繪樓盤表數據和資料相對較全的邏輯樓盤表數據,其整理結果如圖5所示紅色標注房屋。

圖4 外業調繪圖

圖5 整理成果細節圖
內外業“反”向調繪一體化用于調繪經過外業“正”向調繪未整理出的所有房產存量數據,通過對數據的分析可知,其主要包括兩大類:一是老舊地址房屋數據,二是資料不完整的房屋數據。此類數據只有邏輯屬性,無法定位到相應的房屋。內業利用房產檔案查找房屋權利人,外業通過相應房產權利人的配合,對房屋進行定位調繪,確定房屋地址位置和主體房形;對于查檔也無法確定位置的房屋,大部分位于實地存在而未整理的房屋上,將此類房屋整理到“備用圖層”方便外業調繪,如圖5中黑色字體標注房屋為外業調繪的非整理房屋地址。利用內外業“反”向調繪主要是彌補房產資料不足造成的整理困難,調繪過程中需相應的房屋權利人的配合,相比外業“正”向調繪較慢,但可保證整理房屋數據的準確性。為了避免重復調繪,此過程應與日常權籍調繪建立互通機制。
(4)房地圖屬關聯
關聯是指利用唯一標識的屬性或空間位置將兩個或多個數據連接到一起,得到更全面更準確的屬性和空間信息,如屬性關聯、空間關聯。房地圖屬關聯是利用邏輯幢、自然幢和宗地的相應屬性,將房屋數據、宗地數據進行圖形和屬性的關聯,既包括房屋數據的圖形與屬性關聯,又包括房屋數據與宗地數據的空間關聯和屬性關聯。使其既可以通過圖形查詢屬性,又可以通過屬性定位圖形。
此次屬性關聯是利用具有唯一標識的房屋ID對整理完的房屋數據與房產Oracle數據庫中的屬性數據進行關聯,統計和添加所整理房屋的權利人、戶數、層數、面積等必要屬性信息。
利用空間關聯,將房屋與宗地進行屬性對接,通過統計宗地內房屋數量、分析宗地權利人與房屋權利人是否一致、房屋與宗地空間位置關系是否正確等進一步確定房屋和宗地空間位置的準確性。
面對錯綜復雜、形態各異的房產存量數據,根據整理過程中遇到的難點制訂了相應的解決方法,但內外業“正”“反”向一體化技術仍有不足之處,主要難點及不足如下。
(1)測繪數據準確度較差
具有測繪數據的房屋,由于在不同時期所利用測繪手段、坐標系等不同,在進行整理過程中造成此類房屋在位置上的準確性相對較弱。
內業利用現勢性較好的地形圖和影像數據與其進行對比分析,大致確定房屋位置,加上外業“正”向調繪,最終整理出準確的房屋數據。如圖6所示紅色字體標注的為整理數據,藍色字體標注的為房產測繪數據。

圖6 測繪數據與整理數據對比圖
(2)房產檔案資料不完整
無測繪數據的房屋,由于存檔時間較長房產檔案資料相對不完整,單憑房產檔案和參考數據無法確認,此類房屋在外業進行調繪過程中加入房屋權利人的配合,在整理房屋數據的準確性上取得了較好效果,但由于是被動聯系房屋權利人,在調繪過程中碰到許多不配合情況,導致整理效率下降。此類房屋整理最好加入房產權籍調查,既可保證準確性又可保證日常登記業務。
檔案中的房屋資料不全主要包括無空間位置無房形、無空間位置有房形、有空間位置不能確定房形三種。無空間位置無房形的邏輯幢樓盤表狀態多樣,但大多為未取得預售許可、抵押和在建工程抵押狀態。無空間位置有房形分為兩種情況:一種為電子檔案中有分幅平面圖,但也只是單獨房屋;一種為電子檔案中無平面圖,但分層分戶可以確定房形。有空間位置不能確定房形的情況主要是掃描的平面圖只有一部分房子或分幅平面圖有折疊,此部分需查詢原始紙質檔案來進行確定。
(3)房產數據動態變化
房屋存量數據整理的對象為房產系統內的所有房屋,而整理過程中房產業務同時也在實時辦理,導致房屋檔案存在變化的情況。為了解決此類問題,會同房產部門,制訂了相應的整理更新流程,保證已整理數據的有效性和準確性。
(4)內外業“正”“反”向一體化技術不足之處
利用內外業“反”向調繪過程中仍有部分房屋無法準確整理。尤其是實地已拆遷的老舊房屋,但由于各種原因房屋權利人未進行房屋注銷登記,造成房產系統中的部分檔案信息與現狀不符,同時權利人配合較難,此類情況利用內外業“正”“反”向調繪一體化技術無法解決。由于日常登記業務較少,暫作為待整理房屋,等到相應房屋權利人辦理業務時,進行日常權籍調查解決。
房產存量數據整理是一個非常復雜的問題,暫時沒有可供參考的完美方案。本文在查閱各相關文獻資料和對沈陽市房產存量數據分析的基礎上,針對沈陽市不動產房產存量數據的特點,提出了基于內外業“正”“反”向調繪一體化技術的整理方案,介紹了整個不動產房產數據整理的技術路線和其他關鍵技術,總結了整理過程中的工作難點和不足,并根據整理中遇到的各種難點提出相應的解決方法。在沈陽市不動產房屋數據的整理工作中,利用內外業“正”“反”向調繪一體化技術提高了房產存量數據整理的速度和準確度,在實際生產中具有一定的參考價值。