摘要要:本文討論了地籍調查與管理一體化系統中,諸元素數據質量控制的分類、標準和方法。此外,還分析了數據產生差、漏、錯質量問題的原因和解決方法。
關鍵詞:數據質量控制;獨立元素;相關元素;閉環檢核
地籍調查中權屬要素是具有法律效力的關鍵元素,決不允許存在正確性、合法性之外的質量問題。因此,數據生產質量的優劣,將成為地籍測繪市場買方的需求主流。因而也直接關系到數據生產者的生存和發展,成為數據生產者當前的技術創新主攻方向。
1 數據元素類型
元素是空間地物、一般物的抽象對象及其屬性的統稱,數據是元素的數字表達形式統稱,元素和數據是同一個地物特征的二層表達方式。因此即便校對,其可靠性仍然較低。
2 數據關系類型
分為邏輯關系、幾何關系、拓撲關系和統計關系。
3 數據質量控制的概念
數據質量控制的概念從發展角度可分為傳統的質量管理和現代質量管理模式。
4 數據質量控制方法
數據質量控制按照設計、生產、總檢三階段來控制,概念上較清晰,實踐上也方便易行。
4.1 設計階段的質量控制
主要是通過方法、工藝流程、系統的功能等從整體上給予質量保證。包括三個方面:
(1)工藝流程設計主要原則:①作業流程內部工序之間在邏輯上連續、層次分明、結構關系緊密;②將有效的檢核方法科學地設置到數據采集、數據輸入、數據加工、數據傳輸等相應工序的關鍵點上;③檢核功能設置要求簡潔、經濟效益最大化、檢核系統化、檢核早期化(初始化)。
(2)質量控制技術“標準化”。在采用了一系列新技術生產之際,關鍵是對所有影響作業質量的崗位及其人員,明確其質量標準、質量職責,以及相應的權限和相應的獎懲。通過對人這個關鍵因素實施有效的技術責任、質量責任控制,達到從基礎上控制數據質量之目的。
(3)系統設計:
①人工系統的工藝流程設計。應在目標分析、環境分析的基礎上,著重吃透工序間的緊密關系和連續性,突出一體化的整體性,并在相應的工序檢核點建立模型、實現檢核功能。數據分析中重點是做好“數據質量控制”的五項工作。
②信息分類編碼數據結構的內涵設計。應突出其統一性、完整性和唯一性,實現對質量的有效控制。
4.2 生產階段的質量控制方法
(1)元素檢核:
①元素的檢核亦分為獨立元素和相關元素二類。(下面如無特指,即為獨立元素檢核)。獨立元素主要是運用質量特性對其進行正確性檢驗。一般為人工檢校,應注意其效率低、出錯率高。如果采用計算機二次輸入檢核法,則形成較顯著的重復勞動。在目前手段下雖然出錯率可明顯降低,但經濟效益不可行。檢核的主要內容有:正確性 、完整性 、合法性 、一致性 、可靠性 、時效。
②對獨立工序間的同名原始數據,可采取單一渠道集中采集,匯編于一個綜合性載體,并區分出獨立元素,這樣獨立元素只需檢核一次,在系統中在獨立工序間建立相關數據庫,可避免多載體、多頭采集,轉抄的重復操作。
如有土地登記申請書、地籍調查表、宗地圖、宗地關系圖等N個載體,其同名數據為M個,建立了相關數據庫,則可減少數據元素操作次數為M(N-1)次,或者說可避免了M(N-1)次操作出錯機會。這可以提高數據質量和工作效率。
③相關元素檢核在數據關系類型中已作有關介紹,這里不再復述。
( 2)知識性、經驗性檢視
是通過人的智力活動來完成的。如:
①技術路線、設計思想、技術方案,閉環作業方法的執行情況審查;
②舊街坊內部,控制簿弱區域建筑物位置產生質量問題可能性的分析;
③道路、水系、管線系統及附屬物表示合理性的檢視;
④符號間配置合理性等;
⑸、⑤總檢評審和總結經驗階段的質量控制活動
根據檢驗過程中發生的質量問題,用戶回訪中的反饋信息,開展對工藝流程的創新思想對質量控制作出深層次的創新研究。如若對元素關系有了重新認識,或開發了系統化檢核新功能,其成果應用于下階段的設計予以推廣應用。
5 數據產生差、漏、錯問題的原因及解決方法
本文討論的數據質量主要對象是操作數據時所生產的錯誤,即數據的差、漏、錯問題,而不是誤差分析。數據產生差、漏、錯等質量問題的原因較多,大體有儀器、設備、工具未經檢校;技術問題;人的責任心、大腦疲勞和理性素質低;環境條件的制約等原因。我們從信息和數據的本質著眼,認為這些原因只是數據質量問題的表層現象,透過這些現象可以發現它們都有一個共性的本質性原因,就是“這些差、漏、錯質量問題總是在人對客觀實體、空間對象及其屬性和數據發生操作時產生的”。在地籍調查數據產品生產過程中其操作可歸納為四類:
5.1 數據采集
具體的操作有:外業觀測(記錄);外業調查(記錄);內業數字化等。數據采集的對象是客觀的事實。一般被認為是沒有錯誤的。采集的數據屬原始數據,是整個系統各類數據的母本和基礎,是檢核的重點對象。
5.2 數據輸入
具體的操作有:外業觀測數據的記錄或輸入;外業調查數據的記錄或錄入;已知數據、數據處理后的中間成果抄錄或輸入,內業數字化等,所操作的對象是采集對象的數字信息或已知數據、中間成果數據。前者在數據輸入的操作之前就可能存在質量問題,因此應與輸入同步實施檢核,這個檢核有二個作用,一是對采集的數據正確性檢核,二是對輸入操作的數據質量進行檢核。后者是數據加工的依據,可在輸入操作前或輸入同步實施檢核。
5.3 數據加工
由分類、排序、計算、比較、選擇等構成。
具體的操作有:控制網平差計算、街坊宗地面積計算、數據質量檢核等。數據加工的對象一般是已在輸入環節檢核了的數據,也有些輸入數據是未經檢核的數據,因此數據加工時仍須設置檢核,檢核應與數據加工同步進行。
5.4 數據傳輸
是指將加工后的數據傳遞給使用者,這是指使用者用摘錄的方式接收數據。具體的有:已知成果摘錄、觀測數據摘錄、中間成果數據摘錄、同名數據、勘丈邊、宗地號、地類號、界標性質等向不同的載體,如宗地草圖、調查表、宗地關系圖上轉抄等。
操作的對象較復雜,有已知成果、觀測數據、中間成果、亦有最終成果、其檢核方法只能是校對。因此,摘錄轉抄的出錯率較高,效率較低。因此校對檢核是質量控制的重要內容。
5.5 解決的方法
前面已做了些具體介紹,這里主要是幾個環節上的方法。
⑴認識、分解所有的操作點上在必要操作點上設置相應的檢核點,運用各類檢核方法。
⑵建立獨立工序間的關系和相關數據庫以減少中間數據輸入、數據傳輸中的人工干預。
⑶擴大開發相關數據質量控制的范圍,獨立元素是數據質量控制研究的主要對象,獨立元素的相關規律是數據質量控制的主要研究方向。
⑷全過程構成閉環作業系統完善全過程質量控制,使整個數據采集、輸入、加工、傳輸等操作均在受控條件下作業,這是一個根本的方法,也是我們將要不斷努力的目標。</