楊虎民,蘇春景
(1.魯東大學 教育科學學院,山東 煙臺 264025;2.阜陽師范學院 教育學院,安徽 阜陽 236037)
大數據視角下問題青少年教育研究范式的創新
楊虎民1,2,蘇春景1
(1.魯東大學 教育科學學院,山東 煙臺 264025;2.阜陽師范學院 教育學院,安徽 阜陽 236037)
目前,隨著大數據時代的到來,對傳統問題青少年研究提出了全新的機遇與挑戰,它引發了問題青少年研究范式的轉變與創新.大數據視域下問題青少年研究范式創新主要包括培育大數據思維方式,找出問題青少年教育研究的內在規律;構建供科學研究使用的問題青少年教育研究數據庫,實現資源共享;推進問題青少年研究技術的革新,提高研究計算機與網絡的智能化程度;大數據范式拓展與擴充問題青少年研究領域與研究內容;大數據范式在確立問題青少年研究理論框架和分析模型基礎上,重視知識的原創性.同時,研究者要清醒的認識到,大數據背景下問題青少年研究容易侵犯問題青少年的隱私,這需要采取必要措施來預防.
大數據;問題青少年;研究范式
隨著大數據時代的到來,它已給問題青少年教育研究與整個社會發展帶來了全新的機遇與挑戰.為了應對這種時代潮流,許多國家把對大數據研究與發展提升到了國家戰略層面.本文主要探究了大數據時代背景下問題青少年教育矯正研究范式的轉變與創新.
大數據的內涵是什么?到目前為止,并沒有統一的定義.美國麥肯錫全球研究認為大數據是指規模超出了典型的數據庫軟件工具的捕獲、存儲、管理和分析的能力的數據集[1];國際數據中心(IDC)在2011年的報告中把大數據定義為,大數據技術描述了一個技術和體系的新時代,被設計為從大規模、多樣化的數據中通過高速捕獲、發現和分析技術提取數據的價值[2].與傳統數據相比,大數據顯著特點表現為:數據規模與體量巨大(Volume)、數據種類多樣(Variety)、數據生產與處理速度快(Velocity)、數據具有極大的潛在價值(Value).
在大數據時代,科學研究范式發生了革命性的變化,已由傳統的知識驅動科學發展轉變到由數據驅動科學發展軌跡中來.吉姆·格雷(Jim Gray)在2007年闡述了“指數級增長的科學數據”背景下數據密集型科學研究的第四范式[3],他認為科學研究范式經歷了四種變化,具體包括:(1)實驗科學范式.實驗科學主要形式是經驗主義,客觀的描述自然現象并闡述其本質內涵;(2)理論科學范式.理論科學主要采用數學模型和歸納的方法來開展科學研究;(3)計算科學范式.計算科學主要采用模擬的方法來認識更為復雜的現象,以了解事物發展的規律;(4)數據密集型科學范式[4].數據密集型科學也就是格雷所說的科學研究的第四范式,或者被稱為“大數據范式”,而且得到了學術界的認同.普林斯基(M.H.Prensky)與格雷的觀點基本相同,他指出:“科學家不再必須做出受過良好訓練的那種猜想,或者構想假設和模型,通過基于數據的實驗和例子來驗證它們.相反,他們能夠為顯示效果的模型采集完整的數據集,來產生科學結論,而無需更進一步的實驗.”[5]科學研究第四范式主要形式是數據密集型和統計性探索,利用數據相關性可以找出事物背后隱藏的規律性,引導人們更為深刻的認識事物的發展與變化.吉姆?格雷所謂的范式是指一個時代科學研究的總體特征,這與科學哲學家托馬斯?庫恩(ThomasS.Kuhn)于1962年在《科學革命的結構》中提出的范式具有很大的差異.庫恩認為:“范式有兩種意義不同的使用方式.一方面,它代表著一個特定共同體的成員所共有的信念、價值、技術等構成的整體.另一方面,它指為著那個整體的一種元素.”[6]依據吉姆·格雷的自然科學研究范式:從定性研究—定量研究—模擬研究—第四范式,我們也可以認為社會科學研究范式也經歷著與自然科學相同的范式,目前正處于嶄新的第四范式階段.
問題青少年是指對家庭學校和社會生活適應不良,偏離或違背社會規范及違法犯罪的特殊群體,主要包括道德淪喪青少年、心理問題青少年和違法犯罪青少年[4].問題青少年教育研究包括預防教育和矯正干預,對正常青少年、虞犯青少年分別進行超前預防、臨界預防,對違法犯罪青少年通過實施監禁矯正和非監禁矯正干預,使他們順利回歸社會生活.問題青少年教育矯正研究涉及了司法學、犯罪學、教育學和心理學等不同學科和領域,眾多的研究者以各自所在領域的范式進行科學探究,但是傳統研究方法已不能滿足目前所面臨的實際情況了,社會發展需要新的研究范式以應對這一迫切問題.作為科學研究第四范式的數據密集型科學,由于具有容錯性、全量樣本性和關聯性特征,所以它能很好地解決傳統定性和定量研究不能解決的復雜問題.具體表現如下:
傳統問題青少年研究范式中,注重通過抽樣來發現內在規律,研究水平高低依賴于樣本數據大小.而大數據時代問題青少年研究不受樣本的影響,因為隨著儲存和軟硬件的經濟性和工具的先進,海量數據的處理能力得到提升,數據挖掘算法不斷改進與豐富,特別是統計分析和機器學習的神經網絡建模技術發展,抽樣并非是必要的手段和方法論[7].雖然問題青少年研究的相關數據規模之大、類型之多樣化令人目不暇接,但是我們可以采用全體數據取代抽樣樣本的研究模式,通過處理和問題青少年相關的所有數據,就可以發現數據背后隱藏的內在規律.
在傳統的科學研究中,每條數據都包含該研究所需的信息,然后對信息進行歸納、抽象等處理,這使得研究的精確度得以確保.大數據時代,由于數據規模比較大、數據種類較多,因此,研究追求的不僅僅是精確度,也可以允許存在一些不太精確性和一定的誤差[8].第四研究范式追求的不是精確性,而是高效性,不必擔心單個數據對整體研究的影響.維克托邁爾?舍恩伯格說:對于這些紛繁復雜的數據,企圖消耗高昂的成本消除所有的誤差是得不償失的,我們應該試著容許細微錯誤的存在.”“我們掌握的數據庫越來越全面,它不再只包括我們手頭現象的一點點可憐的數據,而是包括了與這些現象相關的大量甚至全部數據.我們不再需要那么多擔心某個數據點對整套分析的不利影響.我們要做的就是要接受這么紛繁的數據并從中受益.”[9]
傳統科學研究重在揭示自變量如何影響因變量的因果關系,而在大數據時代,科學研究重在于通過相關關系去發現事物的本質規律.所謂關聯效應是指通過對信息數據的相關分析、聯想分析和聚類分析,可以找出事物之間的內在聯系.大數據的研究不同于傳統邏輯推理研究,而是對數量巨大的數據做統計性的搜索、比較、聚類、分類等分析歸納[10].在大數據時代,不僅僅探求自變量影響因變量的因果關系,我們更要利用大數據的關聯效應來揭示隱藏在社會中關于問題青少年豐富的、聯系的、海量數據,然后通過統計方法分析數據中的關聯性來尋找問題青少年教育發展中的規律性.正如維克托邁爾·舍恩伯格和肯尼思·庫克耶所說:“我們不能再把精確性當成重心,我們需要接受混亂和錯誤的存在.我們應該側重分析相關關系,而不再尋求每個預測背后的原因.”[11]
大數據時代的問題青少年研究,需要在科學理論基礎上對運用多種方法獲取的公共資源數據進行深度挖掘并進行準確的分析,使研究結論真正能為問題青少年研究提供堅實的理論基礎.大數據包含著內容豐富的資料,亞歷克斯·彭蘭特曾指出:“大數據是社會科學的一座金礦.”[12]這座金山需要廣大的問題青少年教育者去挖掘和開采,找到更多價值連城的寶物,就像維克托邁爾·舍恩伯格說的:“我們應該對數據進行更深度的探討,從不同角度、更細致地觀察和研究數據的方方面面.”[13]在大數據時代,對大多數問題青少年研究者而言,最為可行的辦法并不是親自去獲取大數據,而是充分利用現有的大型數據庫,要深度挖掘公共數據資源.這既有利于培育大數據思維方式,以便找出問題青少年教育研究的內在規律,也能根據規律為問題青少年問題解決對策提供理論依據.例如,通過問題青少年對網頁瀏覽的時間、地點、對象等信息可以確定問題青少年的興趣焦點與活動區域,進而及時掌握問題青少年的學習與生活軌跡,迅速把握其未來發展的動向并采取有效措施應對問題青少年發展中出現的問題,并依據大數據所隱藏的規律為問題青少年的教育矯正發展提供個性化的服務.
大數據時代,使問題青少年研究方法的改變與創新具備了可行性條件.研究者應該既要利用社會科學方法,又要利用自然科學方法全面收集問題青少年發展的數據資料,構建供科學研究使用的“問題青少年教育研究數據庫”,實現資源共享,為問題青少年研究打下堅實的理論基礎.在“問題青少年教育數據庫”結構方面,軟件采用Oracle或MYSQL等數據庫平臺,硬件采用采用一系列以“86”為結尾處理器作為CPU的服務器.在客戶的使用端方面,采用Web化的B/S架構,簡化了系統的開發、維護和使用.這保證了系統對數據輸入、加工、儲存、輸出的安全性.在“問題青少年教育矯正數據庫”的內容建設方面,既要包括問題青少年的品德、心理健康等方面的內容,又要包括問題青少年監禁矯正和社區矯正的內容.目前,我國正在實施國家大數據戰略,其關鍵在于推進數據資源開放共享.推進大數據戰略,并不需要政府花錢大量補貼和建立這一領域的新興產業,只需加快政府數據開放共享,就能催生一個重要的新增長點——新型的服務業[14].因此,構建不同類型的問題青少年科研信息共享平臺具有重要的戰略意義.
從技術來看,大數據時代問題青少年研究工作者正在由傳統教育工作者向現代教育工作者轉型,這促使計算機與網絡智能化的進一步發展,同時也要求廣大問題青少年研究者掌握計算機和網絡知識以應對大數據時代的問題.大數據時代,問題青少年研究越來越需要利用信息化技術和智能化的技術來完成信息加工任務,需要利用傳感技術敏銳的獲取海量數據,需要利用通信技術來傳遞和交換信息數據,需要利用云計算從海量數據信息挖掘隱藏的科學規律.大數據時代的問題青少年研究內涵已經擴大,面對的是海量的問題青少年信息和數據.研究人員需要采集問題青少年的人口學信息、網絡使用信息和同輩群體信息等,但是用傳統的方法已經很難處理這些錯綜復雜和類型多樣的信息,這就要求問題青少年研究工作者采用計算機智能化方式對海量信息資源進行自動化處理,充分挖掘這些數據和信息背后的規律,用超前的問題青少年教育信息服務國家問題青少年教育發展決策.
大數據時代,關于問題青少年研究內容正從活生生的現實世界轉向虛擬的網絡世界.通過大數據研究問題青少年,我們需要記錄、分析、研究的數據范圍在不斷擴大,問題青少年研究涉及不同行業與領域,單一領域的數據已不再滿足研究客觀需要了.研究者應特別注意要把傳統企業數據、機器和傳感器數據、社交數據三種類型的大數據信息相互補充以獲取問題青少年研究關注的主要內容.問題青少年在網絡世界里可以利用虛擬的身份登錄,可以隱瞞自己的姓名和性別等.人與人之間沒有社會地位的差異,大家都是以平等的身份介入其中并自由、平等的進行交流.問題青少年利用網絡瀏覽感興趣的論壇與新聞;利用網絡進行資金轉賬,滿足自己的購物需求;利用電子信箱、聊天室等作為交流平臺,可以沒有后顧之憂地說出自己關于世界、他人和自己真實問題,也不必擔心自己的隱私遭到泄露.這些信息有利于分析研究問題青少年網絡世界的發展趨向,及時、準確的把握問題青少年內心動態與需要,做到有的放矢,從而提高問題青少年研究工作的針對性和準確性,這無疑在很大程度上拓展了問題青少年研究領域.
大數據既為問題青少年教育研究帶來了嶄新的視角,也為問題青少年教育研究提供了全新的數字化工具.隨著社會科學和自然科學的迅速發展,已經形成了問題主導視角和發展主導視角的問題青少年教育研究理論,在此基礎上,可以在綜合利用信息技術、高級統計技術、認知神經科學和具身認知科學等基礎上構建大數據的分析模型,形成具有中國特色的問題青少年教育研究范式.在確立問題青少年教育研究理論基礎和分析模型基礎上,要特別重視對知識的原創性貢獻.長期以來,我國教育學、心理學、犯罪學和社會學等關于問題青少年研究的理論主要是來自于西方國家,要不就是探究在西方某個著名理論視域下的啟示,要不就是重復或模仿國外的研究,幾乎沒有具有中國文化背景的成熟的、系統化的問題青少年教育研究理論,即使有學者提出過某個問題青少年研究理論,因為缺乏學術話語權和獨創性,也很難被國際學術界廣泛認可.因此,在大數據時代,不同學科背景的問題青少年研究者要群策群力,高度重視理論的原創性,在借鑒西方國家成熟理論和吸取我國優秀傳統文化基礎上,提出具有知識產權的中國特色問題青少年教育研究理論,為問題青少年研究做出應有的原創性貢獻.
大數據視域下科學研究范式完全不同于傳統的科學研究范式,給問題青少年教育研究帶來了極大的高效性和創新性,但是研究者也要防止大數據帶來的嚴重挑戰—侵犯問題青少年的隱私.美國科技研究教授希勒·杰瑟諾夫(Sheila Jasanoff)曾指出,大數據可以被視為一種財產、一種公共資源或一種個人身份信息的表達[15],這說明大數據的使用與個體的隱私、社會規則、社會倫理等密切相關.實質上,大數據本身并沒有好壞之分,關鍵在于人們如何使用它.正如美國科技史學家梅爾文·克蘭茲伯格(Melvin Kranzberg)提出的一個非常重要的觀點:“技術既不是好的,也不是壞的,也不是中立的.”[16]如果大數據被應用于正確的領域,那么通過大數據技術分析出來的結果會促進科學研究與社會文明進步;反之,則會危害社會、國家和他人利益.
〔1〕McKinsey Global Institute.Big Data:The Next Frontier for Innovation,Competition,and Productivity[R].http://www.mckinsey.com/mgihttp://www.mckinsey.com/insights/business technology/ big_data_the_next_frontier_for_innovation.2015-06-28,1.
〔2〕Gantz,J.,& Reinsel,D.Extracting value from chaos[R].IDC iView,2011.1-12.
〔3〕亞歷山大·斯扎萊,吉姆·格雷,劉超.指數級增長的科學數據[J].世界科學,2006(5):37-39.
〔4〕Tony Hey,Stewart Tansley,Kristin Tolle.The Fourth Paradigm:Data-Intensive Scientific Discovery[M].Washingtong D.C.:Microsoft Research Press,2009:xviii.
〔5〕Prensky M.H.,Sapiens Digital:From Digital Immigrants and Digital Natives to Digital Wisdom.[J].Innovate:Journal of Online Education,2009,Vol.5(3):1-9.
〔6〕托馬斯·庫恩.科學革命的結構(第四版)[M].北京:北京大學出版社,2012.147.
〔7〕沈潔,黃曉蘭.大數據助力科學研究:挑戰與創新[J].現代傳媒(中國傳媒大學學報),2013(8).
〔8〕馮文全,馬星光,張倩.論我國教育研究范式的轉變-基于大數據的視角[J].教育科學研究,2016(8):29-33.
〔9〕〔11〕〔13〕維克托邁爾·舍恩伯格,肯尼思·庫克耶.大數據時代:生活工作與思維的大變革[M].杭州:浙江人民出版社,2013:15,29,56,81,921.
〔10〕李國杰,程學旗.大數據研究:未來科技及經濟社會發展的重大戰略領域—大數據的研究現狀與科學思考[J].中國科學學院院刊,2012(6):647-657.
〔12〕Alex Pentland.SocialPhysice:How Human Social Networks Spread Ideas[EB/OL].http://www.brookings.edu/~/media/events/2014/2/18 -social -physics/20140218_social_physics_transcript.pdf.2015-06-28.
〔14〕張新紅.大數據時代三個“關鍵詞”[N].經濟日報,2016-09-22(014).
〔15〕Ray Ganong.Big Data vs Your Data[EB/OL].http://fotobounce.com/big-data-vs-your-data,2015-01-20.
〔16〕Melvin Kranzberg, Technology and History:“Kranzberg’s Laws”.Technology and Culture,1986,27(3):544-560.
B844.2
A
1673-260X(2017)09-0145-03
2017-06-08
山東省2015年度青少年規劃重點課題:基于復原力提升的不同類型未成年犯罪的社會干預研究(SDYSA150205)