高淑蓮
(中共承德市委黨校,河北 承德 067000)
隨著信息技術和數字信息資源的快速發展,科學研究活動正發生改變,第四科研范式——數據密集型科研時代已經來臨,科學研究數據呈現幾何級增長的態勢,人類整個科研活動所產生的數據總量已經達到每年數百EB(1EB=1ExaByte=1024PB=1024*1024*1024*1024MB)的規模。由此可見,一個數據類型多樣、數量龐大、價值巨大的數據時代已悄然來臨。“數據驅動科學發展,科學就是數據,數據就是科學”[1],對數據的獲取、分析和利用能力成為人們必備的技能素養之一。2010年在哥德堡召開的第76屆國際圖聯大會上,數據素養被作為一個重要的議題予以討論[2],2012年美國博物館與圖書館服務協會 (Institute Of Museum And Library Services,IMLS)資助了美國的數據素養項目,以探索培養科研人員數據搜集、整理及運用的能力[3],這說明數據素養問題已引起國外圖書館界的普遍關注。本文在闡釋數據素養概念內涵的基礎上,通過對國外數據素養教育實踐的分析,以期探尋國內數據素養教育的模式和對策。
數據素養的出現是大數據時代的必然要求,“大數據由巨型數據集組成,這些數據集大小常超出人類在可接受時間下的收集、管理和處理能力,大數據必須借由計算機對數據進行統計、比對、解析方能得出客觀結果”[4]。2008年《自然》雜志出版的大數據專刊,全面探討了科學領域大數據的應用問題,2011年《科學》雜志針對大數據的搜集、整理、利用刊載了系列文章。在大數據時代,數據作為一種信息資源,其作用和影響力越來越大,數據是創新的前提,個人生活、科學研究乃至社會管理都需要依靠數據進行決策,數據素養的重要意義和價值日益凸顯,并迅速引起學界關注。
數據素養是由數據和素養兩個詞語組合而成,素養指通過訓練和實踐而獲得的技巧或能力,數據的字面理解是數值或數量,但并不只有各種統計數字才是數據,從形式上說,數據包括各種數字、文字、影像視頻形式的文本或信息甚至信號,因此數據可以是相當廣義的指稱。國內外學者從不同的角度,對數據素養概念有不同的表述。國外關于數據素養代表性的概念有:美國的秦健博士認為數據素養是能夠理解、使用和管理科學數據的能力[5];瓦伊等人認為數據背景、數據表征、數據分析和數據說理是數據素養的重要內容,核心是進行數據轉換和根據數據進行說理;卡爾森提出數據素養不僅要從數據使用者的角度考慮,也要從數據生產者的角度去思考,包括一些更深層的能力:數據發現與采集、數據管理與利用、數據分析與增值等等[6]。國內關于數據素養概念代表性的觀點有:張靜波認為數據素養通常指的是研究者在工作中對科學數據的采集、組織管理、處理分析、共享等過程中應具備的能力,還應包括研究者在數據生命周期中普遍遵循的道德與行為規范[7];金兼斌從新聞記者的角度出發,認為數據素養包括數據意識、數據獲取能力、分析和理解數據的能力、運用數據進行決策的能力、批判和反思精神等五個方面[8];孟祥保認為數據素養包括三個層次:數據意識、數據基本知識與技能、數據利用能力等。
綜合已有研究,可以將數據素養表述為:公眾應具備的基本素質、學者的研究素養以及專業人員的分析技能,它由數據檢索、分析、整理、使用等技能組成,是多種有關數據的能力的統一體。
1.3.1 數據素養與量化素養、統計素養
數據素養作為新出現的概念,人們正在逐漸接受和認識它,本質上,數據素養和量化素養及統計素養有密切的關聯,也正是這些概念為今日數據素養的發展奠定了理論基礎。歐美等國家的量化素養教育起源于20世紀80年代末,統計素養是量化素養的一個重要組成部分。學者斯蒂爾、沃爾曼認為數據素養等同于量化素養、統計素養,這幾個概念的共同點都是批判性思維,但學者希爾德認為數據素養主要涉及對數據訪問、評估、處理、總結和表達的能力,而統計素養則強調批判性地解讀統計結果的能力[9]。
1.3.2 數據素養與信息素養
在美國高校與研究圖書館協會(ACRL)的高等教育信息素養標準中,信息素養被定義為個體識別信息需求并發現、評價、有效利用信息的能力集合,數據信息素養更加注重從數據和信息的生產與消費即數據活動的多元利益相關者的視角界定成功完成數據活動所需技能、知識和習慣。2011年10月英國研究信息網在《科研管理者在信息素養中的角色》報告中指出,數據是特殊的信息,對信息素養的理解要相應地予以擴展,以便適應大數據環境下的需要。英國高校與國家圖書館協會(SCONUL)對信息素養賦予了新的含義,指出“信息素養是一個總稱,它包括數字化、可視化和媒體素養以及學術素養、信息處理、信息技術、數據監護和數據管理這些概念”。由此可見,數據素養與信息素養概念密切相關。目前數據素養研究主要建立在信息素養模型基礎之上,或言之,數據信息素養是信息素養的深化與拓展。
目前,在歐美有20多所大學圖書館開展各具特色的數據素養教育,國外開展數據素養教育的理念和實踐,對我國開展數據素養教育具有啟發和借鑒意義。
2014年美國麻省理工學院學者迪赫爾從社會和文化的角度闡釋了對數據素養的理解,她指出:大數據背景下應該關注和提高青年人的數據素養,數據素養能夠激發民主參與和公民權利意識,培養終身學習能力,同時還能為知識經濟、競爭力和選擇能力提供支持。她主張,數據素養教育應該從青年人抓起,應該鼓勵廣大青少年和教育者參與到數據素養教育中來。2013年紐約公立中學開展了名為“數字城市中的彩票調查”項目[10],在該項目實施過程中,分別對彩票銷售人員和彩票購買人員進行采訪,調查了各彩票站的銷售量、彩民的購買習慣及社區居民態度等數據,通過對相關數據的統計分析,得出的結論為:低收入社區的居民具有較高的彩票購買意愿。在該項目中,學生們充分利用網上資源、調查數據進行分析,通過項目的開展,提高了他們的數據意識。2014年美國開展的“青少年形象重塑計劃之編碼”項目[11]是另一項受到廣泛關注的數據素養教育計劃,該項目是針對18歲以下青少年的全球性項目,利用免費開放的數據,讓青少年進行網站、手機應用和解決方案等數字制作,通過開發基本的數據素養,激發青少年的自信與創新能力。2014年11月,紐約丹頓大道小學開始為10歲的學生開發基礎的數據素養能力,主持這項工作的教師帕里西利用圖瓦實驗室提供的數據開展教學。與此同時,莫里小學的教師福特組織學生觀察記錄日照時間、溫度變化與食物腐爛的關系,通過對數據的收集和分析、理解并實現可視化,改變了學生對數學學習的畏難情緒。圖瓦實驗室收集紐約地區的真實數據并提供圖表分析結果導出給使用者,大約有55個國家的2 800所學校免費使用該實驗室提供的數據,福特還考慮將學生收集完成的數據上傳到圖瓦實驗室供大家使用。
美國高校數據素養教育起步較早,高校圖書館一直走在數據素養研究與教育的前列。雪城大學信息科學學院從2007年5月到2009年5月開展了科學數據素養項目(SDL),旨在培養學生的科學數據素養。該項目對數據素養定義進行了界定,提出了數據管理課程大綱。2008~2009年,項目組提供了面向科學和技術專業的本科生和研究生的“科學數據管理”課程,研究和評價了教師對數據管理的認知、課程結構對數據素養教育的影響、學生認知和能力的變化。加利福尼亞大學伯克利分校圖書館使用網絡軟件SDA提升本科生數據素養[12],從2008年開始為學生開設經濟人口學統計學課程,學生已經超過300人。課程將SDA作為伯克利大學計算機輔助調查方法,強調學生對原始數據進行創新性的定量分析,而非參考他人的研究以完成人口統計學方面的課題,SDA軟件非常方便學生在線獲取和分析數據,開展課題研究。2010年,馬薩諸塞大學阿默斯特分校圖書館成立數據工作小組,負責建立數據管理資源,提供數據管理相關咨詢以及開發數據管理課程。這些課程為學生提供了數據儲存選擇、共享和再利用政策、元數據、理論和合法注意事項以及數據的長期保存等數據管理核心技能的培訓。為了回應國家科學基金會2010年的數據管理計劃的強制要求,美國許多大學圖書館都提供了在線網頁指南并配以不同學科的數據館員咨詢服務,如麻省理工學院圖書館提供數據管理在線指南,介紹了數據管理技巧。
相比于國外的數據素養教育,國內的相關研究與實踐還比較薄弱,借鑒國外數據素養教育發展,國內數據素養教育應注重如下方面。
數據素養研究尚未引起國內學者的更多關注,對其重要價值和意義缺乏足夠的認識。因此,國內數據素養教育應從宣傳數據素養理念入手,只有研究者和社會大眾都充分認識到數據素養對科學研究和日常工作產生的價值,才能形成數據素養教育的源動力。國外圖書館在開展數據素養教育之前都非常重視用戶需求的調查,通過調查了解科研人員對數據的基本態度和觀點,掌握其數據獲取、使用的基本情況。國內圖書館在開展數據素養教育時也要加強與研究人員的溝通,積極宣傳數據管理與共享理念。
數據素養的內涵非常豐富,做好數據素養教育既需要講究一定的方式、方法,也需要一定的載體和平臺。將數據素養教育融入圖書館工作實踐及信息學相關課程之中,能夠起到事半功倍的教育成效。首先,圖書館應該抓住課題這一有效載體,將數據意識、數據素養滲透到《信息檢索》的相關課程中,使學生逐步認識到數據的價值與作用;其次,圖書館在向讀者提供服務時,如在日常的知識咨詢、學科服務工作,就可以用數據向用戶提供數據的檢索、管理服務,使用戶受到啟發,逐步養成查詢數據、使用數據的能力和素養。
數據素養和信息素養關聯密切,數據素養是信息素養的拓展與升華,信息素養教育研究已開展多年,積累了豐富的研究成果,信息素養教育的經驗比較成熟。因此,筆者認為可以借鑒信息素養教育的手段、方式、方法,在信息素養教育基礎上,探尋開展數據素養教育的新方法,爭取做到既有別于信息素養教育,又體現大數據時代數據素養的特征。北京大學圖書館開展的“一小時講座”就涉及“數據素養與統計數據資源介紹[13]”,為圖書館開展數據素養教育提供了很好的內容方面的參考,內容分為三個單元,包括通過實際案例為學生展示如何正確解讀數據和統計分析結果、如何進行數據清理、怎樣開展數據分析、如何科學地管理數據等內容。經濟統計類信息中有介紹并舉例講解了全球金融與企業資信分析數據庫(BvD)、世界經合組織(OECD)、國際貨幣基金組織(IMF)、中國經濟網等數據庫的具體使用方法。分門別類地對網絡上的開放獲取的統計資源進行介紹,包括:世界主要國家和經濟組織等官方網站的資源,學術團體、研究機構提供的統計資源,民間權威調查機構發布的統計數據以及利用搜索引擎查找統計資源的技巧等。
[1]HABSON B,Sugden A,Alberts B.Making Data Maximally Available[J].Science,2011,331(6018):649.
[2]Session74—Information Literacy with Reference and Information Services[EB/OL].[2015-04-20].http://www.ifla.org/node/6271.
[3]孟祥保,李愛國.國外高校圖書館科學數據素養教育研究[J].大學圖書館學報,2014(3):11-16.
[4]大數據[EB/OL].[2015-9-21].http://baike.baidu.com/linkur l=oCMFozTSjcDJHEN8tS4suVVkvXFwueQq_XJR9HU--xU1YnjNoQgVDkGC_6QRYKjBsRbZhZQYP9gVrudr4NOE2TlRb8ssG-L8EZ1ee7Y86a.
[5]Jian Qin and John D’Ignazio.Lessons learned from a twoyear experience in science data literacy education”[EB/OL].[2015-03-17].http://works.bepress.com/jian_qin/1/.
[6]CARLSON J,FOSMIRE M,MILLER C C,et al.Determining Data Information Literacy Needs:A Study of Students and Research Faculty[J].Portal-libraries and the academy,2011(2):629-657.
[7]張靜波.大數據時代的數據素養教育[J].科學,2013(4):29-32+4.
[8]金兼斌.財經記者與數據素養[J].新聞與寫作,2013(10):5-9.
[9]SCHIELD M.Information Literacy,Statistical Literacy and Data Literacy[J].IASSIST Quarterly,2004,28(2/3):6-11.
[10]City Digits[EB/OL].[2015-03-28].http://www.citydigits.org/.
[11]Young Rewired State[EB/OL].[2015-03-30].http://www.yrs.io/.
[12]DEKKER H.Using Web-based Software to Promote Data Literacy in a Large Enrollment Undergraduate Course[C].Goteborg:World Library And Information Congress:76th IFLA General Conference And Assembly.2010.
[13]北京大學圖書館.1小時講座[EB/OL].[2015-04-03].http://www.lib.pku.edu.cn/portal/fw/yixiaoshijiangzuo/ziyuanchazhao.