張娟
摘? ? 要: 數據倫理是數據素養的主要組成要素,是衡量個體數據素養水平的重要標準。教師的數據倫理水平,不僅影響自身的科學研究水平和教育教學工作,還對受教育者的數據倫理培養產生直接影響。綜合國內外數據倫理相關研究成果、文獻資訊,分析現有數據倫理及相關內涵,發現當前大數據環境下數據倫理問題已經凸顯,數據倫理教育愈顯重要。本文結合數據倫理多維度角度,為教師數據倫理的研究、評價和教育工作,提供理論參考。
關鍵詞: 數據倫理? ? 數據素養? ? 教育? ? 大數據環境
1.背景
科學技術的飛速發展,推動了信息科技與教育技術、教育理念的飛速融合,帶動了教育信息環境的全面變革,特別是近年來移動教育、在線教育不斷促進傳統教育模式的轉型發展,教育活動逐漸呈現出過程可量化、模式個性化、管理決策精準化、評價多元化及發展均衡化的趨勢[1](5-12),2017年新媒體聯盟發布的《中國高等教育技術展望地平線區域報告》指出,如何提升個體素養將成為未來教育中必須應對的問題,應對的關鍵措施之一就在于基于教育大數據的教師能力重構與角色重塑,對教師數據倫理教育的研究應成為重點之一[2]。
2.大數據環境下數據倫理問題凸顯
大數據環境下,各種數據呈現出飛速增長的態勢,這種“數據現象”是科學研究和技術發展的必然趨勢,得益于各種設施設備性能的提升,個體數據收集、分析能力得到了增強,造成了技術與科學研究方面的數據監管難題,使數據倫理問題成為社會發展必須重視和解決的問題。面向大數據的數據倫理研究側重于基于數據源的倫理道德問題,以個體的隱私與信息安全為出發點,涉及網絡信息傳播中的謠言、虛假廣告、詐騙等非道德問題。由于數據的有序性和邏輯性與現實環境的相對無序性和隨意性導致大數據并不是萬能的,只能實現數據的相對既關聯又獨立。數據倫理涉及的范疇更廣泛,不僅僅是產生于大數據領域,還包括數據素養教育涉及的數據意識、數據利用、數據分析等多個環節上,是基于個體素養教育引發的關于數據規范采集、應用、傳遞和決策范疇的整體,所以網絡環境催生了大數據倫理問題的研究,使社會個體素養教育需求成為提升數據倫理教育的重要基礎。
個體的數據素養水平高低是關乎其能否有效適應大數據環境、運用大數據及發掘大數據潛在價值并應用于分析決策的重要因素。數據倫理的價值與作用就在于個體能否在數據分析、傳遞、轉換、應用與決策過程中自覺遵守相應的數據應用與分析規范,在允許的應用范疇內合理合法地傳遞和使用數據和進行數據分析決策。所以,數據倫理教育是數據素養教育的基本范疇,也是影響個體數據素養教育效果的重要元素。
3.數據倫理相關述評
3.1數據倫理釋義
數據倫理是數據素養的準則,通常與道德一起,被表述為數據倫理道德。有研究遠程教育的學者將數據倫理與數據意識結合起來定義為數據文化素養,具體闡述為“對數據價值認知的敏銳度,以及對數據安全、隱私保護、數據合理合法使用和數據交換規則的認知水平”[3](62-68)(78)。也有學者將數據倫理與數據意識聯合起來,將數據倫理界定在個體意識范疇,即個體擁有對應的數據倫理道德意識,表現為個體在整個數據生命周期中都遵守基本的數據道德規范[4](38-46)。或將數據倫理與數據規范聯合起來進行描述,組成數據素養水平的主要判別因素之一,解釋為個體運用數據思維收集、分析、使用、傳播數據信息的能力及在此過程中體現出來的數據倫理和數據規范,其中數據倫理是指在使用傳播數據過程中能夠遵守基本的價值規范和道德倫理,即在數據使用過程中,使用本身不損害任何個人和組織的利益,不侵犯他人的隱私,避免對數據的誤用和錯誤表達等給任何組織和個人造成任何損失(經濟、名譽等方面)的意識與行為。數據規范是指社會主體在數據使用各環節中應該遵守的法律法規和政策規范,是提升數據素養的他律因素,這種數據規范主要在大數據環境下闡述,主要表現形式是各級各類法律法規和政策規范。這兩者在一定程度上具有交叉性,并不能完全區分界定[5](50-56)。所以,釋義的多樣性造成了相關研究中對于數據倫理測度的差異。
3.2數據素養與數據倫理
數據意識[6](11-16),數據倫理[7],獲取、使用、評價數據的能力[8](30-37)及管理和貢獻數據的能力和意識[9]等構成了衡量個體數據素養的主要因素,這也是大多數研究者提到的數據素養的主要因素,在此基礎上細化出數據知識、數據態度、數據批判、數據轉化等要素,并且能在數據生命周期中客觀、批判性地認識數據并規范地處理、分析、利用數據且遵守數據倫理與道德,是大多數數據素養研究者的共識[10]](9-11)。David H.在Data Literacy:A Users Guide中指出,數據素養是對數據的確認、獲取、評價、整理、分析和可視化過程中體現出的個體素養,數據倫理則是整個數據處理過程中個體對數據規則、道德的遵守[11](14-19)(34)。這種共識在對科研數據認知方面尤為明顯,具體表現為“在數據操作過程中遵守的原則和規范,主要體現科研人員的道德素質與行為規范”,也有少數研究者將教師的數據倫理、數據意識歸入數據意識范疇,并未單獨表述數據倫理[12](109-116)。或將數據倫理結合個體態度進行解釋,如數據態度,指個體對待數據的心理反應傾向,主要包括主觀能動性方面的內容,對數據價值和數據倫理方面的內容,是道德觀和價值觀的表現[13](58-63)。
3.3數據倫理測度方式
具體測度方式可以從三個方面描述:遵守數據政策、執行數據引用規則(使用范圍等)、具有學科規范(分學科的數據倫理問題,如生物學)。具體表現為:個體在法律和道德允許的范圍內獲取和使用數據[14](120-128);尊重他人的數據,使用時能夠注明出處(能夠制作準確的書目數據引文表[15](525-540),對數據知識產權具有正確認識;包括在收集、使用數據過程中能夠遵守行業或研究領域內的特定數據處理規范。也有學者將數據倫理描述為數據誠信,包含重復利用數據的意識與信心,對科研數據和數據共享的態度,以及遵守與信息、數據相關的版權法的要求[16](96-102)。以教師為例,具有良好的數據倫理意識具體表現為在數據處理、應用、轉換、分享和決策的過程中對于相關的法律法規及數據來源和數據樣本的基本隱私和數據利用的基本準則的尊重和嚴格執行;既要在國家、教育機構、社會群體、個體的監督和道德法度的允許下進行數據利用,又要對社會上出現的教育數據利用行為進行監督,堅決抵制違規、違法和不道德的數據利用行為,保障數據權益人和數據來源、數據樣本的正當權益。
4.數據倫理教育現實思考
數字技術的不斷發展,促進了各種科學研究對于數據的應用與分享,使得數據的采集、處理、共享變得更加便利,然而數據運用過程中涉及的數據倫理問題常常由于相關研究的隱蔽性與利益關系而被忽視,這種現象在大數據環境下顯得較為明顯[17](303-341)。對個體數據倫理意識的培養應當優先于對數據能力、數據意識的培養,數據倫理和道德教育必須被放在優先的位置,這是開展一切數據活動的準則[18],然而有研究指出,目前即使是碩士研究生也存在很大一部分對數據倫理問題不了解,具體表現為忽視數據引用規則、數據傳遞和分享不規范等因素[19],然而除針對個體的數據倫理教育的不足外,以下幾個方面也是目前數據倫理教育實踐中的現實情況。
4.1語境、場景信息缺失
數據集往往是在一段時間或某個場景下對樣本進行觀察、測驗才能形成的,但由于在數據采集過程中語境、場景常常被簡單地剝離,所以數據通常不包括它所產生的社會背景信息[20](465-482),因此單對數據本身進行研究會造成因語境、場景信息剝離而造成數據釋義偏離[21](405-411)。所以,個體必須清楚地認識到數據只是以特定方式收集和解釋、描述某一特征事實、特征現象、特征事物的方法,它的重點和功能僅僅在于記錄特定的問題、現象或表述特殊事實,在進行數據相關操作或分析時需要充分認識它們的語境和產生場景。所以不論是事實分析還是假設研究,用于數據收集的方式方法、處理過程與工具、樣本篩選方法、決策模型選擇不當等都易使分析結果形成數據背景缺失,從而造成數據倫理問題,所以數據的有效性需要依托一定的場景或環境,即通過結合數據的“上下文”或場景解釋數據的含義。對于教師而言,認識到這一點尤為重要,不同的場景會對學生的數據分析造成差異性影響,影響數據所能真實表達的含義。
4.2數據“敏感”不夠
數據倫理是進行一切科研活動的準則,是指在數據的獲取和利用過程中,要樹立法制觀念,在不斷提高數據評判能力的基礎上,合理合法使用數據資源。然而,在實際的科學研究特別是教育研究過程中,數據來源的多樣化、非規范化常常使部分未處理和“未脫敏”的數據得以在網絡上匿名甚至公然傳播,這都是部分數據倫理不高的個體導致的社會問題[22](91-92)。所以,近年來期刊論文中出現的數據論文正是對數據倫理道德中的數據脫敏、數據合法發布和分享等問題的有效嘗試。通過對已有文獻的匯總分析,結合數據各相關主體,如數據所有者、數據樣本、數據共享者及其他利益相關者,有關數據“脫敏”總共涉及以下幾個方面:知情同意,隱私(包括匿名性和數據保護要求),所有權,主體對數據的認識論和客觀性,大數據造成的“數字鴻溝”。隨著數據倫理問題的不斷深入,數據倫理還將面臨如下考驗:基于利益的源于非所有權主體的使用風險,個體主觀認識能力不足或偏差對數據運用方式、范圍的影響,“學術研究”和“商業利用”的嵌套造成使用目的難以有效區分,衍生數據、衍生知識的所有權與倫理問題。這些都是數據倫理可能涉及的一些問題,需要個體通過案例學習,分析、理解多元文化信息社會、復雜網絡環境對數據倫理的挑戰[23](28-36)(101)。
4.3隱性倫理問題監督有待加強
通過數據倫理教育防止數據道德問題的技術手段傾向于關注個人,卻忽視對隱性倫理問題的監督。當前,數據保護立法和脫敏技術不能杜絕個體在后續分析中探尋匿名數據集背后隱含的數據來源主體的隱私。對于教師來講,既是數據采集者又是數據利用監管者的雙重身份容易造成隱性的道德與認知問題,即數據脫敏失效。雖然利用系統權限或更為先進的分析方法(采用“倫理護理”將特定的研究或假設置于“禁區”是避免數據倫理問題的解決方案之一)來避免非道德的數據利用行為的出現,能夠一定程度上避免數據倫理問題但是無法避免個體對于數據的主觀判斷產生對數據的認知偏向。所以,目前加強針對個體的隱性倫理道德的監督還是一個難題[24]。
4.4數據分析動機缺乏重視
數據利用的目的性,可以視其未來用途和可能的使用方向劃分為“學術”和“商業”目的,以進一步辨別數據分析利用主體可能對數據的潛在用途造成的影響。以醫藥衛生研究領域為例,部分研究并未告知用戶其所收集的數據的最終用途是基于學術或商業目的[25](856-859),但運用于學術與運用于商業目的會對數據采集行為及最終形成的數據集的審查形成一定的觀念性的影響,從而對管理和審查人員產生不一樣的概念并影響判斷標準[26](1-11)。雖然“學術”和“商業”不能絕對區分,卻可以對評判結果產生必要影響,這就是基于數據倫理差異造成的影響。這種基于目的的區分不是用于判斷數據本身的倫理意義,而在于數據分析的動機所帶來的倫理問題。以科學研究與產品開發為例,就數據和數據集本身可能會用到的方向和研究方法而言,商業和學術研究可能會采用相似的方法并用于類似的方向,但動機會對研究目的的道德評判產生極大影響;同樣的,社會基礎研究需要的數據實踐往往會經過正式的道德審查和監督,商業實踐會盡量降低社會對于自身相關數據研究的關注,同時在數據發布展示上盡量抹去負面研究數據從而降低公眾對其數據倫理問題的關注。
4.5數據訪問權限保護意識需要加強
數據技術、網絡技術的發展極大地提升了數據開放度,也進一步降低了數據傳播、獲取的成本,隨之產生的數據濫用、侵犯知識產權行為屢見不鮮。所以,在大數據環境不斷發展的當下,加強數據倫理教育,將數據倫理和道德意識融入對個體的數據素養教育和數據生命周期和科研管理過程中就尤為重要,特別是在培養個體知識產權意識方面,尤其注重對于個體引用數據的規范性教育,力爭實現鼓勵數據共享和保護知識產權的平衡,讓科研成果在合理合法的基礎上實現最大限度的傳播,發揮應有的價值[19]。強調對于自身的數據權益的保護主要在于科研工作、科研項目涉及的數據會涉及大量不能公開的技術參數及研究者、參與者的個人信息,這些數據一旦泄露就會使權益人的權益甚至項目研究都受到影響,所以科研數據倫理中重點提出了對于自身權益的保護[27](68-73)。
5.結語
在當前大數據環境下,社會對數據的敏感性愈加凸顯,針對教育數據的分析與運用逐漸呈現出許多數據倫理問題,特別是在數據驅動決策逐漸融入教育教學活動后,對于數據倫理問題的探討既是對現有數據素養教育的促進,又是對相關教育活動的一種理性約束,希望通過本文探討的數據倫理問題為進一步數據倫理教育及大數據環境下的數據規范管理與應用提供參考。
參考文獻:
[1]楊現民,唐斯斯,李冀紅.教育大數據的技術體系框架與發展趨勢:“教育大數據研究與實踐專欄”之整體框架篇[J].現代教育技術,2016,26(1).
[2]S.亞當斯貝克爾,黃榮懷,劉德建,等.2017新媒體聯盟中國高等教育技術展望:地平線項目區域報告[EB/OL][2018-12-16].http://jwc.hlju.edu.cn/info/2070/3586.htm.
[3]張斌,劉三女牙,劉智,等.面向大數據的師范生數據素養課程體系構建研究[J].中國遠程教育,2018(4).
[4]韓金鳳.加拿大高校圖書館科研數據管理服務調研及啟示[J].國家圖書館學刊,2017(1).
[5]陳明星,錢鵬.跨學科、多主體、多視角——數據素養研究特點綜述[J].圖書館建設,2016(10).
[6]孟祥保,李愛國.國外高校圖書館科學數據素養教育研究[J].大學圖書館學報,2014,32(3).
[7]Hogenboom K.,Phillips C. M.,Hensley M. K..Show Me the Data!Partnering with Instructors to Teach Data Literacy[EB/OL].[2018-12-09]. http://www.ala.org/acrl/sites/ala.org.acrl/files/content/conferences/confsandpreconfs/national/2011/papers/show_me_the_data.pdf.
[8]Mandinach E. B.,Gummer E. S..A Systemic View of Implementing Data Literacy in Educator Preparation[J].Educational Researcher,2013,42(1).
[9]Zubiaga A.,Namee B. M..Knowing What You Don't Know:Choosing? the Right Chart to Show Data Distributions to Non-Expert Users[EB/OL].[2018-12-09]. http://www.zubiaga.org/publications/files/charts-dl2015.pdf.
[10]任一姝,王曉軍.大數據時代:如何提升公民的數據素養能力[J].中國教育信息化,2016(17).
[11]張進良,李保臻.大數據背景下教師數據素養的內涵、價值與發展路徑[J].電化教育研究,2015,36(7).
[12]劉雅馨,楊現民,李新,等.大數據時代教師數據素養模型構建[J].電化教育研究,2018,39(2).
[13]郝媛玲,沈婷婷.數據素養及其培養機制的構建與策略思考[J].情報理論與實踐,2016,39(1).
[14]李青,任一姝.國外教師數據素養教育研究與實踐現狀述評[J].電化教育研究,2016(5).
[15]Stephenson E., Caravello P. S.. Incorporating Data Literacy Into Undergraduate Information Literacy Programs in the Social Sciences: A Pilot Project[J]. Reference Services Review,2007,35(4).
[16]王維佳,曹樹金,廖昀赟.數據素養能力評價與大學圖書館數據素養教育的思考[J].圖書館雜志,2016(8).
[17]Mittelstadt B. D., Floridi L.. The Ethics of Big Data: Current and Foreseeable Issues in Biomedical Contexts[J]. Science & Engineering Ethics, 2016, 22(2).
[18]Mandinach E. B.,Ryan C. M.. Blended Learning and Data Use in Three Technology-Infused Charter Schools. [EB/OL].[2018-11-22]http: //learninglandscapes. ca/index. php/learnland/article/download/931/923.
[19]程璐.我國碩士研究生數據素養現狀調查[D].武漢:武漢大學,2017.
[20]Bail C. A.. The Cultural Environment: Measuring Culture with Big Data[J]. Theory and Society,2014,43(3/4).
[21]Markowetz A., B?覥aszkiewicz K., Montag C.et al. Psycho Informatics: Big Data Shaping Modern Psychometrics[J]. Medical Hypotheses, 2014,82(4).
[22]宋文.“互聯網+”時代圖書館員數據素養的構成與培養[J].河南圖書館學刊,2016,36(10).
[23]司莉,姚瑞妃.圖書情報專業研究生數據素養課程設置及特征分析——基于iSchool聯盟院校的調查[J].圖書與情報,2018(1).
[24]Taylor L., Floridi L.. Group Privacy: New Challenges of Data Technologies[M].New York:Springer,2017.
[25]Lupton D.. The Commodification of Patient Opinion: The Digital Patient Experience Economy in the Age of Big Data[J]. Sociology of Health & Illness,2014,36(6).
[26]Schroeder R.. Big Data and the Brave New World Of Social Media Research[J]. Big Data & Society, 2014,1(2).
[27]沈婷婷.數據素養及其對科學數據管理的影響[J].圖書館論壇,2015,35(1).
2017年四川外國語大學青年項目“用戶數據素養教育與嵌入式學科服務深度融合的策略研究”(項目編號:sisu201761。