康君
摘 要
2012年吉林省啟動社會保障一卡通建設工作,為使這項便民、利民和惠民的工程能夠盡快地實施,省人社廳決定采取數據采集和系統建設齊頭并進的方案來開展工作。由此社會保障卡持有人數據采集工作提到了重要日程,卡是社會保障一卡通的載體,采集持卡人的個人信息是社會保障一卡通建設最基礎的工作,由于全民納入社會保障的惠民政策,采集工作量非常巨大,又由于新的社會保障卡加載了金融功能,涉及到持卡人需要選擇相應的服務銀行,因此,必須由持卡人填表簽字確認。本文對社會保障一卡通數據的采集和整理技巧做出了相應的研究。
【關鍵詞】一卡通 持卡人 數據采集
1 前言
為了提高持卡人個人信息數據采集的效率,我們采取了利用已有個人基本信息數據先打印好《社會保障卡申領登記確認表》,然后再由持卡人確認簽字的方案,這樣可以省去填表的過程,極大地提高采集效率。由于采取了這樣的方案,那么,首先要做的工作就是利用相關部門的個人基本信息數據,制作規范化的excel數據表。
從相關部門獲得的個人基本信息數據,并不完全符合要求,需要對數據進行整理。應注意的問題包括列表結構順序、字段屬性等。
按照個人基本信息數據采集規范,必須對持卡人采集包括居民身份證號、身份證有效截止日期、姓名、性別、民族、出生年月、單位名稱、通訊地址、聯系電話和相片等信息。
從相關部門獲得的數據,其個人記錄信息一般都是正確的,但也有少數記錄信息存在錯誤,在姓名中存在同音不同字,如:姓名記錄為“張山”,而實際為“張珊”;性別記錄為“男”,而實際為“女”等。為了保證數據準確導入數據庫,就需要進行認真、仔細和準確的采集數據。為此,我們采用從不同部門獲得的個人基本信息數據進行比對、篩選,主要采信居民身份證信息,“性別”和“出生年月”按照居民身份證號規范進行提取生成,相片也要按照“358×441”像素的規格進行處理。
針對從相關部門獲得的個人基本信息數據要對各個字段進行字段屬性轉換,我們的經驗是除序號字段外,其他字段屬性一律設置成“文本屬性”,這樣做的好處是在以后的數據處理中不會出現意想不到的問題。
從相關部門獲得的個人基本信息數據通常與我們的要求并不相符,為了使數據符合《社會保障卡相關技術規范》,我們需要針對數據進行整理,這個數據整理工作不僅僅是為了打印《社會保障卡申領登記確認表》,也要為日后批量申請社會保障卡做好準備。
《社會保障卡相關技術規范》中規定社會保障卡數據格式為:
序號,居民身份證號,姓名,性別,民族,出生年月,單位名稱,聯系電話,服務銀行……
2 數據整理步驟
下面將具體數據整理步驟進行詳細說明:
2.1 準備數據
整理數據比較方便的應用軟件是MS_OFFICE組件中的EXCEL,相關部門獲得的數據與我們要求的數據字段名稱以及數據結構不盡相同,需要將相關部門的數據進行整理,整理過程中一定要按照《社會保障卡相關技術規范》的要求進行,也為將來數據上傳卡管系統做好準備。
2.2 數據整理過程中需要注意的問題
因為從相關單位獲得的數據與我們所要求的標準數據存在差異,如有些數據存在空格,有些數據存在字母大小寫不一致,有些數據存在重復數據,有些數據需要重新命名等,下面就常見的3個問題進行說明。
2.2.1 空格處理
數據中存在空格共有3種情況,一是字段的字符串前面有空格,二是字段的字符串后面有空格,三是字段的字符串中間部分有空格。在處理數據之前應該在相鄰處復制一列,防止處理數據時出現錯誤無法挽回,造成不必要的損失。復制的方法是,先在相鄰格間插入一列,然后,選中目標列,再按住CTRL健,同時將鼠標放置到選中列的邊框處,此時鼠標出現一個“+”號,按住鼠標左鍵向先前插入的空列拖動,拖動到空列后,空列被填充為要復制列的內容,松開鼠標左鍵,復制完成。
無論空格位置處在哪一種情況下,一般用函數substitute(text,old_text,new_text)將字符串中的部分字符串以新字符串替換。
例如:C2=substitute(B2," ",""),見圖1。
空格去除后,見圖2。
然后把C列復制,假如復制到B列,在B列選擇性粘帖為數值,這樣可以解除函數關聯,再將列標名(字段名)由“TEST”重新更名為“姓名”。
2.2.2 處理身份證中末位的字母
有的是大寫“X”,有的是小寫“x”,由于規定身份證號中字母要大寫,因此,對于小寫的字母要改成大寫,一般用函數upper(text)將小寫字符改寫成大寫字母。
2.2.3 對于“性別”的篩選整理
最好通過身份證號來獲得,對于18位的第二代身份證號碼格式,從左側數第17位是性別標識位,奇數是“男”,偶數是“女”。我們可以通過MID函數提取出該位,然后再用Excel的另一個函數MOD進行求余數,通過將該位與2進行求余,為0就是女性,為1就是男性,以18位第二代身份證為例:
=If(mod(mid(A2,17,1),2)=1,”男”,”女”)
需要說明的是在使用函數時要注意單元格的屬性,新的目標單元格屬性一般要設置成“常規”屬性,否則,函數失敗,不能進行改寫操作。
3 結語
關于數據采集和整理技巧就說到這里,實踐中還會遇到很多問題,希望大家摸索和挖掘更好的方法,以便解決相應的問題。
作者單位
四平市人力資源和社會保障信息中心 吉林省四平市 136000
電子技術與軟件工程2016年19期