石曉梅
(貴州財經大學 圖書館,貴州 貴陽 550004)
隨著大數據時代的到來,對于科學數據的管理問題成為人們密切關注的問題,科學數據管理的問題使許多的數據機構都深處挑戰之中。在大數據環境下,圖書館也面臨著各種各樣的數據管理挑戰,其中最為主要的問題就是數據管理中圖書館的角色還沒有明確的定位。在上游的研究周期內圖書館主要強化與研究團體的合作,在研究初期與研究人員進行緊密的合作,目的是使其能夠在數據管理中發揮作用。
政府和基金組織能夠對科技所需要的資源進行分配,其對科學數據的管理有著重要作用,能夠推動科學數據管理的發展。隨著大數據時代的到來,國家越來越重視科學數據對國家發展的意義,因此政府和基金組織建立了相應的政策和設施來推動科學數據的發展。其主要表現在3個方面:(1)政府應科學數據管理進行規劃,協調各個方面,并不斷地促進和引導,推動科學數據的發展。(2)由于科學研究的資金來源于政府和基金組織,因此政府和基金組織能夠有效地約束所產生數據的提交和共享行為,目的是使所研究數據的保存活動得到規范,促使研究數據的利用次數增多。(3)政府和基金組織應該給予科學研究大力的支持,使得科學數據管理研究和實踐能夠在政府和基金組織的支持下得到進一步的發展。
研究者和研究機構對科學數據進行創造的同時也在使用科學數據。研究者和研究機構作為科學數據的生產創造者,在科研項目的初級階段對科研數據管理計劃進行提交,在過程中要對科研數據進行不間斷的管理,在完成工作后規范數據并提交,以達到政府和基金組織在提交和管理上的要求標準。作為科學數據的使用者,其自身雖然會受到政府和基金組織的壓力,但是會對科學數據不斷地創新和探索。為了方便快捷地找到所需要的數據,研究者會不斷地推動科學數據創新。科研數據成為科研過程中的重要交流內容,導致研究人員的工作在不斷地變多變雜,研究人員面臨著諸多挑戰,他們需要圖書館給予支持。
在科學界還沒有完全認識到科學數據價值的時候,國家和政府的相關部門就已經將大量的數據進行保存了。大多數數據中心是由政府指導建成的,其中的數據整理和服務機構都是公益性的,并且在其中融入了一些由國家基金支持所完成的數據成果。國家通過給予數據支持推動數據管理的可持續性發展。為使科學數據在科學領域被積累和重新使用,在世界范圍內已經有許多數據中心被建立。由于數據中心在科學領域當中不斷地成熟與發展,逐漸成為一個科學數據管理機構,成為新時期科學數據管理的一個重要部分,通過對其以直接或間接的方式進行整合利用,有利于推動機構科學數據管理的實現。而圖書館和數據中心以合作的方式對數據共同的保存和管理,這更加有利于科學數據的可持續管理。
圖書館在數據管理方面的角色具有能夠參與到數據生命周期的上游—在數據生產階段管理該階段所產生的數據的優勢,這是其他科學數據管理機構所不具備且無法比擬的。圖書館在制定本機構的數據提交政策、管理方案、長期保存規劃的時候,應協同機構領導以及有關部門來完成,與此同時要將機構的階段和長期的科學數據管理計劃加以明確,并對數據管理架構和基礎設施進行構建。由于研究人員和研究機構在進行數據管理工作時希望圖書館能夠參與其中,與他們共同來完成這項工作,所以圖書館能夠在科學數據產生之前就參與到所研究的項目中,與研究人員一同評估項目中所產生的數據類型、數據量等,同時對他們所擬定和提交的項目數據管理計劃給予一定的幫助,以及對適合的數據方案、數據篩選機制進行確定等。在數據產生前的上游研究周期這段時間內,圖書館在定位與研究團體的合作關系上起到至關重要的作用。為保證后續工作的順利進行,圖書館應該在研究初始階段就與研究人員進行密切合作。現如今,許多大學聯合以探究各個領域的科研數據基本情況為目的展開數據監管項目,這為數據管理工作在后期能夠順利有序地開展作鋪墊。除此之外,圖書館可以在可續數據管理的調研當中給予科研人員支持,比如,當用戶在選擇和獲取科學數據時,圖書館為用戶提供技術指導以及相關資料。
科學數據的管理與傳統出版物的管理之間存在著一定的區別。傳統出版物的管理屬于一種靜態的管理方式,其管理的重點是最終的科研成果內容,其在管理過程中僅需建立索引,目的是在用戶查找和使用時能夠更加方便快捷。相比較而言,科學數據管理屬于一種動態的管理方式,其存在于科學數據整個生命周期的管理過程中。之所以圖書館存在于科學數據整個生命周期的管理過程中,是因為原生的科學數據與圖書、論文成果不一樣,圖書和論文成果可以直接進行閱讀和使用,但是原生的科學數據只有經過知識化的加工和完善之后才能被使用。我們稱這種基于過程的科學數據管理為數據監護。早前對數據監護的解釋為:數據監護的目的是保證數據在當前能夠使用,并且在未來也能夠再次利用,在數據開始產生的時候,數據監護能夠對數據進行管理和完善。對于動態數據集而言,數據監護只有保持不間斷地補充和更新,才能夠滿足用戶對數據的需求。在科學數據管理工作的過程當中數據監護工作尤為重要,其處在科學數據管理工作的環節中,目的是保證提交的所有數據和更新能夠達到所制定的標準; 為其他數據資源和文獻資源提供基于內容的關聯服務。最近幾年,國外的圖書館針對數據監護服務展開了諸多實踐工作,對于此工作的探索和開展有較強的積極性。這是因為圖書館在多個方面具有傳統和專業性的特點,并且圖書館在長期的發展中已經累積了諸多理論方法,圖書館具備為數據監護進行服務的能力。
因為科學數據具有動態性的特點,在科學研究的過程中,從開始產生數據到提交數據結束會產生大量的具有暫時性、動態性的中間數據,這些數據能夠保證科學研究的可持續性發展。相關研究人員在科研結束后會對所產生的數據進行評估,評估后將具有長期保存價值的數據進行暫時性維護和存檔。當科研結束后,人們會將一部分能夠稱為科研結果的數據進行長時間保存。與此同時,為使成為科研結果的數據能夠為人們發現、獲得,并加以利用,相關人員會維護被長期存檔和長期保存的數據。在國際上,曾有相關機構規定短時間的維護由出版者來負責,而圖書館承擔長期的保存責任。科學數據是人類通過不斷地探索,投入大量的人力物力財力而得到的,由圖書館這一傳統的機構進行保存是合理的,也是必要的。在大數據環境的推動下,圖書館為實現可持續性發展的目的,應秉承歷史責任感,自主地承擔長期保存科學數據的責任。由于圖書館在保存科研資料方面的經驗十分豐富,能夠對科研資料進行合理的、有效的保存,尤其是在高校圖書館中,其經驗更為豐富。現如今,由于許多的高校和科研機構想要更加高效合理地對科研數據進行保存,為此其對機構庫進行建立,圖書館需要不斷地探索更有效的保存科學數據的方法。目前,對機構庫的建立解決了當前的問題,為了使圖書館對科學數據進行可持續性的保存,相關人員對圖書館科學數據的保存需要不斷深入探索。
大數據時代的到來,使得在科研活動當中科學數據已成為至關重要的一部分,也是科研活動中的重要組成部分。在這樣一個新時期,如果一個研究者的素養和能力想要達到研究人員的標準,那么他就必須擁有足夠的能力對數據進行收集、整理和提交,根據信息素養的定義,我們可以稱這種能力為“數據素養”。在大數據時代,我們應注重對“數據驅動”和“科研大數據”時代學生的基礎數據素養教育。圖書館作為信息素養培訓機構,現如今負責培訓大量機構的信息管理人員,圖書館在全球的信息素養教育體系中是至關重要的一部分。科學數據對于圖書館來說是一種全新的管理對象,這對于圖書館和用戶來說既是機遇也是挑戰。首先,對圖書館而言,其對科學數據的管理是陌生的,在一開始要不斷地進行學習,通過不斷地學習才能夠積累科學數據管理方面的經驗,才能夠達到對機構內部工作人員進行素養教育的目的。其次,圖書館想要提高自身對數據的收集、管理、分析等能力,就需要其不斷地對科研人員進行課程培訓,以促使科研人員的數據意識得到加強。最后,圖書館能夠對全民的數據素質進行培養。為了使全國人民都能夠擁有數據管理意識,應在全民信息素養教育當中加入科研數據管理方法與素養教育,這能夠使得數據機構自身的重要性在各個領域當中得以體現,以促進其自身的科學創造價值得到充分發揮和利用,推動時代的發展和社會的進步。
伴隨著大數據時代的到來,對圖書館在科學網數據管理中進行定位是至關重要的,其能夠促進圖書館的可持續性發展,同時也能夠將研發出的科學數據進行保存。由于圖書館的科學數據管理正處于初始階段,因此應該給予實踐操作更多的重視,使未來圖書館的科學數據管理能夠不斷地發展下去,使科學數據管理服務成為未來圖書館服務發展的助推力。