陸 耘
(中國科學院國家科學圖書館,北京 100190)
中國科學引文數據庫(Chinese Science Citation Database,以下簡稱CSCD)創建于1989年,由中國科學院國家科學圖書館建設,并獲得國家自然科學基金委員會的支持。目前,該數據庫共收錄了我國自然科學、醫學、農業、工程技術學等領域中英文核心期刊和優秀期刊千余種,截至2012年12月,已積累論文記錄350余萬條,引文記錄3,500余萬條。歷經20多年的建設和發展,中國科學引文數據庫已成為具備專業性強、數據質量優良、數據體系完整、檢索方式多樣、簡單易用等特點的大型數據庫,深受用戶好評,對科技人員和科研評價等工作具有重要影響。
近年來,隨著數據采集量的逐年遞增,現有的數據加工人員越來越難以負荷海量基礎數據的加工工作,為順應數據庫建設的發展,改變基礎數據加工方式勢在必行。目前,基礎數據外包已經成為各類大型數據庫建設的一種主流方式,CSCD數據庫亦于2003年實行了基礎數據外包,這一改變是數據庫建設發展中的一次重要跨越,CSCD數據庫建設小組的工作模式亦由具體操作的作坊型向主要負責規劃設計、組織協調的統籌型轉變,原數據加工人員的工作分別轉向用戶需求分析、數據質量監控以及與數據供應商的協調等方面。其中,外包數據的質量控制更是新工作方式的重中之重。基礎數據質量的高低不僅影響數據后期規范化處理、統計產品的可靠性,還直接影響到數據庫對外服務水平,比如:與各類資源的融合度、開放鏈接服務水平等,直接關系到數據庫的生存和發展。筆者將結合CSCD建設的工作實踐,對如何做好外包數據質量控制進行初步的探討。
數據外包公司的服務質量直接決定數據質量。在對數據外包公司的選擇上,著重考慮了以下幾個方面:首先,要求外包公司具備相應資質和信譽,重點考察其相關工作的經歷和業績;其次,考慮外包服務的成本是否合理;第三,考慮到外包服務是初步階段,只將非核心業務外包,積累對數據外包工作的管理經驗。
綜合以上幾點,我們擬定了業務外包實施方案,經主管部門批準后,遵循公開、公平、公正的原則,采取對外公開招投標,由專家組成的評標委員會評標,擇優選擇了適合CSCD建設要求的外包數據服務公司。
在選定了外包公司之后,與中標公司簽訂詳細、明確的委托外包合同,包括合同期限、工作目標、合作范疇、運作方式、責任劃分、賠償問題等。在與外包公司簽訂詳盡的工作協議時,圍繞數據特點,盡可能考慮周全,將數據提交格式、質量標準、數量標準、任務完成期限、人員流動控制及違約的懲罰措施、解決突發問題的應急對策等可能出現的問題逐一進行約定,盡最大可能保障外包數據質量。
數據質量體現在對數據加工的全過程的把控,因此,數據加工各環節質量控制對策尤為重要。在外包數據的質量控制中,我們主要根據美國質量管理專家戴明的PDCA全程循環質量控制理論,制定了數據質量的全程控制模式。PDCA是一套廣泛用于質量管理的標準化、科學化循環系統,它將工作流程具體分為四個階段:計劃(plan)、實施(do)、檢查(check)、處理(action),流程執行實施一遍后,要對出現的問題和不足進行完善和改進,并在此基礎上,再一次進行PDCA的循環,從而提升質量控制水平。在實踐中,我們沒有機械地把四個內容從時間上劃分前后階段,而是把質量控制PDCA四項內容貫穿到數據加工的各個環節和時段,圍繞這四項內容,展開相互交融的全面的數據質量控制管理(見圖1)。
CSCD字段繁多、著錄內容多樣、邏輯關系復雜,加工難度大,其數據分為3個級別:①Ⅰ級數據,也稱原始數據。數據加工要求按照《中國科學引文數據庫著錄與錄入規范》,保證數據內容完整無遺漏,數據對應關系準確,字段分解正確。②Ⅱ級數據。根據《數據審核標準和規范手冊》對Ⅰ級數據進行質量檢查與修正,完成標準化、規范化處理。③Ⅲ級數據。在Ⅱ級數據的基礎上,根據統計產品需要,進一步深加工所形成的統計數據。外包工作主要是完成Ⅰ級數據加工。
2.1.1 做好數據加工人員崗前業務培訓,強化質量意識
為了使外包公司的數據質量盡早達到CSCD建設要求,我們根據著錄標準編制培訓講義,配備經驗豐富的審校人員對外包公司數據加工人員進行嚴格的崗前培訓和考核,培養他們保證質量的意識和能力。我們特別采取了請外包公司人員到項目組邊工作邊培訓的方式,盡快提升數據加工人員的加工水平,并及時發現問題和解決問題,從工作流程的源頭保證外包數據質量,實現數據加工工作方式的平穩轉變。
2.1.2 確定影響質量的主要因素,制定并完善工作標準和細則
在外包初期,我們對試驗數據采取一對一逐冊期刊審校的方式,嚴格按照著錄標準和質量要求進行仔細認真校對,將發現的質量問題進行歸納,形成數據錯誤表單,匯總統計表單中的內容,進行分析和歸納,找出影響質量的各種因素。這些因素可以分為人為因素、技術因素、客觀因素三類,就不同因素制定了相關細則和改進方案。比如:為幫助加工人員對某些著錄標準、字段含義準確理解,對西文文獻類型著錄內容的正確識別,我們編制了更為細化、直觀的培訓講義,提供了豐富直觀的樣例。另外,我們進一步整理和編制了各種詳盡、明了的工作手冊,如《各專業技術職稱分類》、《國外主要出版社一覽表》、《重點實驗室英文縮寫表》等,可有效指導數據加工人員甄別和解決工作中遇到的實際問題。
在人員培訓工作的基礎上,由項目組和外包公司雙方抽調責任心強、加工經驗豐富的人員建立質量管理小組,負責雙方的數據質量控制工作。
針對外包公司正式加工提交的數據,我方數據接收人員首先進行數據導入、查重、數量核對,并通過系統報錯追蹤等技術手段進行數據前期清理工作。之后由數據審校人員嚴格對照各項細則和審核標準進行逐個字段的審查,歸納整理所發現的新問題,及時反饋到外包公司質量管理人員,這樣使外包公司質控人員可以有重點地自查。另外,我們要求外包公司能夠對每條加工數據追溯到具體加工人員,通過“數據認責”方式強化加工人員質量意識,減少錯誤的重復出現。
本階段工作包括針對數據加工整體質量檢查和加工人員個體問題分析兩項內容:①經過計劃和執行階段后,我方根據合同規定,將對外包基礎數據質量進行全面檢查。主要采取定期檢查與隨機抽查相結合的方式,項目方的質量控制小組每兩個月對數據大檢查一次,并在每個月中不定時隨機抽查,由審校人員提交抽查報告,定期向外包公司提供質檢報告,包括以往問題的改進情況和近期發現的新問題,提出整改要求,督促外包公司不斷改進數據質量,完善數據檢驗流程,提高數據加工效率。②根據對錯誤數據的追溯,發現具體加工人員產生錯誤的原因,對加工人員提出改進建議,從源頭控制數據質量。
根據檢查結果,雙方的質量控制小組總結經驗教訓,對出現的問題加以分析,及時交流質量信息,并把這一循環周期未解決的遺留問題,轉到下一次PDCA循環中去,提出整改措施,防止類似情況的再次發生。
九年來,我們借鑒PDCA質量管理模式,對外包數據質量進行了全面、系統的綜合管理,使基礎數據加工達到了質量標準,數據合格率達95%以上,大大提高了工作效率,保證了數據庫檢索服務的及時和準確,為CSCD各類統計產品的按時出版發布打下了良好的數據基礎。
我們經過近幾年的數據外包實踐,在解決內部人力資源不足和縮小時差等方面取得一定成效,質量管控基本達到了預期目標,數據更新頻率實現了每周更新。但是,數據外包工作仍然面臨著一些問題,需要不斷地探索新方法,使外包工作不斷規范、更加完善。
目前的數據外包公司只有一家,這對于數據的安全存在一定的風險,如果這家公司出現問題,則外包數據必然出現問題。因此,如果有可能的話,外包公司應選擇兩家或以上,能夠在一定程度上規避數據風險,并可形成競爭,提高效率,更有效地保證數據質量。當然,管理兩家公司也會對我們的管理能力提出更高的要求,并增加管理成本。
CSCD的數據內容和數據結構都比較復雜,數據人員需要一定的時間才能熟練掌握數據加工要領,因此要求數據加工人員隊伍相對穩定。但是,當前由于外包公司內部管理等方面的問題,導致公司人員變動比較頻繁,給數據質量管控帶來了一定的困難。另外,CSCD收錄的千余種期刊,各類期刊的著錄內容和形式也不斷出現新變化,需要根據實際變化對數據加工人員進行及時的業務培訓指導。就以上問題,必須有持續的培訓機制,方能在各類新變化中有效實施數據動態質量控制。
相繼制定的工作細則、審核制度、定期檢查制度已經收到了一定的效果,但檢查制度的完善和執行力度上還存在著一些不足。我們還需不斷地完善對數據公司工作流程和各項質量管理制度的檢查和指導,通過有效配合,針對出現的問題能盡快產生解決方案。另外,要建立完善的質量評估系統,敦促數據公司做好針對人員及工作質量的考核,對工作中發生的質量問題嚴加控制。
以上是CSCD在建設模式實現轉變后,我們在數據外包加工中如何保證數據質量所做的一些實際工作和對現有問題的思考,希望通過本文與同行進行交流,向同行學習更多的經驗和方法。在今后的工作中,我們還將借鑒PDCA等各種有效的質量管理模式,結合現實情況的變化,不斷提高數據質量控制水平。
[1] 牛書東.圖書館業務外包的實踐與思考[J].河南圖書館學刊,2007(3):117-119.
[2] 馬桂艷.高校圖書館編目業務外包的全程規范管理[J].唐山師范學院學報,2008(1):155-156.
[3] 鄭有才.檔案工作全面質量管理[M].北京:科學普及出版社,1991.
[4] (意)帕累托等.你不可不知的30種管理方法[M].北京:當代中國出版社,2003.