馮雪晴



摘 要:隨著教育信息化的逐漸發展,新型技術和創新理論不斷衍生。圖書館借閱數據是重要的教育大數據,僅用于圖書管理難以發揮其真正價值,如何基于閱讀行為數據優化學生閱讀是當前研究的關鍵問題。從學生閱讀實際需求出發,借助量化自我理論衍生出量化自我閱讀的概念與框架,以江南大學圖書館借閱現狀為例分析其可行性,并構建量化自我閱讀系統。該系統包括學生基本信息、個人借閱信息、專業書目推薦、個性閱讀推薦、互動學習討論和系統使用建議6個模塊。構建量化自我閱讀系統有利于圖書館數據充分利用和館藏資源利用率提升,為優化學生閱讀提供了新思路。
關鍵詞:教育大數據;圖書館借閱數據;量化自我理論;閱讀系統
DOI:10. 11907/rjdk. 201021 開放科學(資源服務)標識碼(OSID):
中圖分類號:TP319文獻標識碼:A 文章編號:1672-7800(2020)005-0136-05
0 引言
閱讀是學生進行高質量學習的重要過程,而圖書館是支持學生閱讀的關鍵場所,圖書館借閱數據飽含有關學生閱讀行為的寶貴信息。從知網數據看,以“圖書館”為關鍵詞的相關研究共180 995篇,而以“圖書館+借閱數據”為關鍵詞的僅73篇,以“圖書館+量化分析”為關鍵詞的更是低至20篇(檢索時間截至2019年12月22日)。就研究現狀看,雖然學術界并無對圖書館借閱數據概念的統一界定,但已有學者對其展開了相關研究。韓翠峰[1]從大數據技術對圖書館的影響角度出發,提出傳統信息服務將會轉變為以數據為核心、以數據挖掘技術為關鍵的個性化服務;李艷等[2]基于大數據挖掘技術和決策分析流程構建了資源使用率統計與甄選模型、外部聲譽監控與預警模型和高效科研分析模型,通過對圖書館數據的挖掘分析優化“微服務”水平、提供個性化服務,為管理者提供決策支持等。還有學者針對圖書館“業務數據”進行數據挖掘,發現數據背后隱藏的用戶需求,從而提供館藏結構優化和館藏推薦等創新性服務[3]。從已有研究看,圖書館借閱行為數據主要用于幫助管理者和決策者提高工作效率和質量,以及如何幫助圖書館優化工作服務等方面[4],將數據價值作用于借閱行為主體的研究較少,缺乏站在學生角度思考“借閱數據對于學生自身的幫助”是什么的相關研究。
本文創新性地從量化自我理論出發,以幫助學生優化自身閱讀為根本目標,通過大數據技術獲取借閱行為主體(學生)的閱讀現狀和需求。隨著教育信息化的推進,科技進步與理論創新對圖書館發展及其服務內容提出了新的要求和挑戰[5]。從被動應用轉向主動迎合學生需求,從支持學生閱讀到幫助優化學生閱讀是圖書館創新發展的必經之路。量化自我理論為圖書館借閱數據的充分應用提供了參考路徑,將學生借閱行為產生的數據經過挖掘分析展示給學生個人,從而幫助判斷、指導選擇并優化學生閱讀。
1 教育大數據
1.1 大數據起源與定義
“大數據”的概念最早由美國NASA的研究人員Michael Cox&DavidEllsworth[6]于1997年提出,用來描述超級計算機生成的巨大數據,這些數據具有難處理、難分析等特點,對當時技術水平是一項巨大挑戰。目前,大數據有多種定義,《國務院關于印發促進大數據發展行動綱要的通知》將大數據定義為對多元化的海量數據進行采集、存儲、關聯分析,從中發現新知識,創造較高價值,并提升數據應用價值[7]。有學者[8]認為,大數據是指太大或種類太多,以至于傳統工具無法有效管理的數據;也有學者認為,大數據即一般軟件或工具難以捕捉、管理和分析的海量數據,通過對這些海量數據的交換、整合、分析,可以發現新知識、創造新價值,從而帶來大知識、大科技、大利潤和大發展[9]。大數據具有以下基本特征:數據量較大、難以管理和分析、數據背后具有豐富的信息和重要意義。
1.2 教育大數據與圖書館借閱數據
楊現民等[10]認為教育大數據是“大數據”的子集,是指整個教育活動過程中產生的以及根據教育需要采集到的,一切用于教育發展并可創造巨大潛在價值的數據集合。教育大數據涉及到教育活動的方方面面,每個環節所產生的數據經過深入挖掘和有效分析后都將對教育效果產生影響。其中,圖書館作為學生活動的重要場所,學生借閱行為過程會產生大量數據,尤其是最明顯又容易被忽視的借閱數據。
本文認為圖書館借閱數據即學生在圖書館借閱書籍過程中產生的行為數據,記錄學生借閱書目、借閱時間和歸還時間等信息。看似簡單的數據,經過有效的數據匯聚、整合和分析,可以得出優化師生閱讀的重要信息,通過向學生提供閱讀書目推薦服務、生成量化閱讀報告優化學生閱讀,如圖1所示。
2 圖書館借閱數據潛在價值
2.1 借閱數據是寶貴的教育大數據
圖書館是學生獲取精神食糧的“食堂”,是滿足學生學習需求、提升學生專業知識的“第二課堂”,在該場所每天會產生很多數據,這些數據不僅僅有利于圖書館管理,更是了解學生閱讀需求、優化學生閱讀的重要依據。圖書館借閱數據中包括學生基本信息、借閱歷史、檢索記錄等,潛藏著關于學生閱讀的多重信息,對學生學習效果具有重要影響,是教育過程中寶貴的教育大數據。
2.2 數據分析可挖掘學生閱讀需求
數據挖掘是一門跨越多個學科,利用各種數據庫、人工智能、機器學習、統計學、神經網絡等相關技術,從存放在數據庫、數據倉庫或其它信息庫的數據中挖掘有用知識的新興技術。其在圖書館中的應用主要包括兩個方面:①優化圖書館管理工作,提高圖書利用率;②獲取讀者閱讀需求,實現智能化服務[11]。目前,圖書館根據借閱數據實現的智能化服務主要是站在管理者的視角,若能將學生借閱行為信息處理后展示給學生會實現數據的更大價值。量化自我理論的基礎是通過個體行為數據判斷個體情況,借閱數據是學生借閱行為所產生的數據,挖掘分析后有助于了解學生閱讀情況、把握閱讀需求,向學生提供推薦服務。同時,讓學生直觀看到自己的借閱信息,也能夠讓學生明確自己的閱讀情況。
2.3 閱讀推薦有助于資源充分利用
信息時代,人們每天習慣通過各種公眾號進行快餐式閱讀,很容易在信息的海洋中迷航。這種現象不僅僅由信息時代的到來和人們日益忙碌的快節奏生活所致,更多是在信息化環境下紙質書籍和圖書館沒有應對時代變換作出相應調整而造成。在面對圖書館龐大的館藏量時,學生不僅僅是欣喜,也會被“我該讀哪些書籍”難題所困擾,導致學生閱讀需求無法滿足且館藏圖書未被充分利用。
館藏書籍的利用率高低受兩方面影響:一是館藏書籍是否符合學生需求;二是學生(讀者)的情報素質,即情報意識和情報能力的綜合水平[12]。準確的閱讀推薦和服務可有效輔助學生選擇圖書,減少因情報素質不足而無法發現并閱讀圖書的情況,提高館藏書籍利用率。
3 量化自我理論與閱讀系統可行性分析
“Quantified Self”(簡稱QS)即“量化自我”由美國《連線》雜志Gary Wolf&Kevin Kelly[13]最先提出,指人們利用可穿戴設備和傳感器等技術記錄自身狀態與行為活動的過程[14],該理論的應用可提高“自我意識”、幫助“自我發現”、增強“自我了解”、促進“自我進步”,在此基礎上實現系統性的“自我改進”,總而言之就是對自身信息的跟蹤、記錄和反饋[15]。目前,量化自我理論應用已逐漸從健康檢測領域發展到個體學習領域,主要涉及學習分析研究,依賴于大數據的支撐,是對大數據價值的延展和實踐[16]。大數據是量化自我產生的基礎,數據獲取設備是實現量化自我的關鍵,大數據處理技術和可視化技術是將數據轉化為信息流的手段。量化自我除個體的量化自我外還包括集體的量化自我,即將個體的量化自我數據匯聚成更大的數據集,讓個人與他人的數據進行比較等,從而優化個人行為或預測集體行為[17]。
根據學生基本信息和閱讀信息,可以對學生進行閱讀書目推薦,從效率和效果上優化學生閱讀。量化自我閱讀基本框架如圖2所示。利用各種技術手段獲取學生閱讀數據,通過量化分析等過程制定出調控策略,并最終優化學生閱讀。量化自我閱讀系統即通過技術手段收集學生個體及群體閱讀行為數據,并基于量化自我理論對數據進行分析,從而向學生個體進行閱讀推薦、生成量化自我閱讀報告以優化學生閱讀。
3.1 “校園卡”即借閱數據集合載體
教育活動中的數據并不都是有效的,也會產生大量無意義的噪聲數據[7]。因此,保障數據的有效性尤為必要。以江南大學圖書館為例,學生借閱書籍、歸還書籍時均需使用學生卡,此舉有利于圖書館對圖書的規范管理,能夠確保書籍借閱、歸還在可控的時間范圍內。QS理論強調獲取數據的“可穿戴設備”,“校園卡”是學生在學校學習、生活必須隨身攜帶的設備,在圖書館借閱數據收集中即相當于“可穿戴設備”。
從以下角度論證“校園卡”即圖書借閱數據集合載體:①圖書館借閱需要使用記錄個人信息的校園卡,由于校園卡即消費卡,也是宿舍、教學樓、圖書館等場所的門禁卡,學生需隨身攜帶,為借閱信息采集提供了一定可靠性;②校園卡會記載學生個人信息,其中專業和年級可將學生歸為一類群體,如:孟某、人文學院、2017級教育技術學研究生;③圖書館借閱數據會采集所借的書籍信息,通過分析學生經常借閱的書籍類型,獲知學生閱讀傾向和興趣;④借閱書籍和歸還書籍的時間有記錄,根據此時間差,大致推斷出學生閱讀速度;⑤通過分析“集體的量化自我”數據集,可獲得館藏書籍借閱頻次排名信息。
3.2 借閱信息是“量化自我”的依據
學生可以根據自身學習數據分析結果,了解近期學習情況,并通過預測進行適應性學習和自我導向學習[18]。借閱信息是學生借閱行為的表征,可作為“量化自我”的依據,將學生行為數據可視化后展示給學生。這一方面有助于學生根據“個人的量化自我”數據了解自身閱讀情況,調整閱讀行為,適應自身需求;另一方面有助于學生根據“集體的量化自我”數據獲得寶貴的集體經驗,引導自身優化閱讀。
3.3 技術可支撐“閱讀優化”實現
信息化社會帶來的先進技術可支撐圖書館借閱數據的挖掘和分析,通過對學生借閱行為產生的大量數據進行可視化,可獲知學生的閱讀需求,并通過有效的圖書館服務方式實現對學生的“閱讀優化”。如通過關聯規則、聚類、決策樹和時間序列等多種數據挖掘技術,處理分析圖書館借閱數據,從而預測出學生在未來某個時間段的借閱行為,為學生提供準確的個性化支持服務,促進圖書館管理工作智能化[19]。
4 量化自我閱讀系統理論構建
從目前可獲得的圖書館借閱數據和學生基本閱讀需求考慮,量化自我閱讀系統應該包括學生基本信息模塊、個人借閱信息模塊、專業書目推薦模塊、個性化閱讀推薦模塊、互動學習討論模塊、系統使用建議模塊,其中后兩個模塊為該閱讀系統的基礎模塊。學生基本信息模塊和個人借閱信息模塊屬于上文量化自我閱讀框架中的閱讀數據部分,利用技術獲取學生數據,經過量化分析過程制定調控決策。優化學生閱讀的調控決策部分在該系統中體現為專業書目推薦模塊和個性化閱讀推薦模塊,如圖4所示。
(1)學生基本信息模塊。該模塊較簡單,采集學生基本信息,如姓名、性別、學院、專業、班級等。這些基本信息雖然簡單但也非常關鍵,通過這些基本信息可以對學生進行一些需求分析,如所學專業信息可以作為專業書目推薦模塊的依據。該模塊是“集體量化自我”理論應用的基礎,根據該模塊可將個體歸類,并將一類(如,同一專業)個體的“量化自我”數據匯聚成“數據集”,從而獲取集體閱讀經驗,為學生提供引導和自我檢測。
(2)個人借閱信息模塊。通過采集學生借閱信息,可以統計學生借閱種類、借閱數量、借閱時間和歸還時間差等,將這些信息以數據形式直觀呈現,并將學生個人數據與其他學生數據進行對比,如該學生在某一個時間段借閱書籍的數量超過了多少學生。這種直觀的具有互動性的數據可以在感官和心理上刺激學生的閱讀沖動。從這方面而言,該模塊不僅有助于學生了解自身閱讀情況,還可以激發學生閱讀興趣。個人借閱信息模塊,可以說在某種層面上使學生在閱讀范圍內量化了自我的閱讀興趣、能力、數量等。
(3)專業書目推薦模塊。美國著名的成人教育家林德曼和諾爾斯[20]認為,“在成人教育活動中,要重視經驗的作用”。該理論強調經驗在教育活動中的重要性。根據學生基本信息,將學生歸為一個集體,使得具有相似閱讀需求的集體,可以更方便地獲得書目推薦,如專業書目推薦。學生想要獲得更多專業知識和更深入復雜的專業信息,就需要閱讀一定量的著作。但每個專業的相關書籍有很多,為幫助學生在短期內正確選擇閱讀書目,迫切需要教師指導幫助和他人經驗。在專業書目推薦模塊,至少應該包括兩方面內容:一是專業教師推薦書目;二是以往該專業學生借閱量較多的一些書目。專業教師推薦書目由該專業的教師們討論得出,教師根據教學需要和時代變化對該書目進行增加和刪減。由于是專業教師精心挑選,因此具有非常大的指導價值,在很大程度上指出了學生閱讀方向。此外,參考以往該專業學生借閱量較多的書目有助于學生快速作出選擇。
(4)個性閱讀推薦模塊。個人閱讀推薦模塊可滿足學生除專業書籍以外的閱讀需求,根據學生在閱讀系統中留下的行為數據,如搜索、收藏和借閱等,確定學生閱讀興趣標簽從而根據個性化需求向其推薦書目[21]。在該模塊中,可根據個人借閱信息模塊有關信息,為學生提供個性化書目推薦。個人借閱信息模塊呈現了學生個人閱讀的書籍種類和數量,該信息有助于分析出學生的閱讀興趣和方向。因此,可以根據學生閱讀興趣標簽向其推薦同一類型的閱讀書目。如張某同學的個人借閱信息模塊中顯示其酷愛歷史書籍,經常借閱歷史人物傳記、歷史題材小說等,則個性化閱讀推薦模塊會檢索出一系列相關題材的書籍目錄,推薦給該學生。
(5)互動學習討論模塊。交互性對話有利于激發學生學習動機[22],在學習過程中起到升華知識的作用,在閱讀時學生需要在互動環節對閱讀感悟和知識進行深入加工。一方面,互動形式能夠調動學生繼續閱讀的積極性,在一本書籍閱讀的過程中能夠分享自己的觀點并評價他人言論,這極大提升了學生閱讀過程中的參與感,使學生豐富閱讀體驗,激發興趣并提高深入閱讀能力;另一方面,互動討論環節所產生的數據、留言可作為分析學生需求的重要依據[23],可提高個性化閱讀推薦的準確性和及時性。互動學習討論模塊可以設置個人動態、話題討論和求助提問等互動形式。學生可以發表個人閱讀心得、體會或疑惑,在與人分享的過程中進一步思考閱讀內容;可以圍繞某個話題形成一個話題討論群體;如果在閱讀中遇到問題,可以在求助提問區進行提問,其他學生以評論、點贊等方式參與。
(6)系統使用建議模塊。學生在使用該閱讀系統初級版本的過程中,難免會遇到一些系統無法滿足的需求。為了更好地向學生提供量化自我閱讀服務,可在該模塊提供留言陳述建議功能,與系統開發管理人員共同完善該閱讀系統。
5 結語
“大數據”技術、“量化自我”理論與教育的深度融合有助于學習效果提升和教育發展。將信息化時代的先進技術與結合理論研究相結合并作用于教育領域,是教育信息化發展的要求,也是促進我國教育質量提升的有效路徑。量化自我閱讀系統本質上是利用技術手段幫助學生更好地了解自己,調整閱讀行為從而優化閱讀,對學生有效閱讀具有重要影響。圖書館最根本的價值是為閱讀者提供服務、支持讀者閱讀行為、滿足讀者閱讀需求,不管是利用借閱數據提高管理人員工作效率,還是根據數據顯示需求為讀者提供個性化服務,其最終價值取向都是“以讀者需求為導向,優化閱讀體驗和效果”。
參考文獻:
[1] 韓翠峰. 大數據帶給圖書館的影響與挑戰[J]. 圖書與情報,2012(5):37-40.
[2] 李艷,呂鵬,李瓏. 基于大數據挖掘與決策分析體系的高校圖書館個性化服務研究[J]. 圖書情報知識,2016(2):60-68.
[3] 廖文果,廖光萍. 基于數據挖掘的圖書館創新服務研究[J]. 軟件導刊,2014,13(8):116-118.
[4] 王最,王立宏,劉斌. 高校圖書館大數據統計分析研究[J]. 軟件導刊,2017,16(11):200-201,205.
[5] 高麗,鄒春梅,王竹. 教學研究型大學圖書館信息支持平臺研究[J]. 軟件導刊,2014,13(11):62-64.
[6] 何克抗. 大數據面面觀[J]. 電化教育研究,2014,35(10):8-16,22.
[7] 劉克成,耿凱峰. 大數據在高校教學信息化中的應用[J]. 軟件導刊,2019,18(2):222-224.
[8] 張杰夫. 大數據 大視野 大教育[J]. 中小學信息技術教育,2013(10):12-14.
[9] 徐子沛. 大數據:正在到來的數據革命,以及它如何改變政府、商業與我們的生活[M]. 桂林:廣西師范大學出版社,2012.
[10] 楊現民,唐斯斯,李冀紅. 發展教育大數據:內涵、價值和挑戰[J]. 現代遠程教育研究,2016(1):50-61.
[11] 劉曉東. 數據挖掘在圖書館工作中的應用[J]. 情報雜志,2005(8):63-65.
[12] 潘玉田. 藏書保障發展的量化分析[J]. 圖書館理論與實踐,1988(3):61-63,23.
[13] LEE R.Whats Happening in the “Quantified Self” Movement?[EB/OL]. [2017-12-02]. http://digitalcommons.usu.edu/itlsfacpub/491.
[14] AMON R, FEDERICA C, JUDY K, et al. The future of personal data: envisioning new personalized services enabled by quantified self technologies[EB/OL]. http://www.cs.usyd.edu.au/-judy/Homec/Pubs/2016_FuturePD_preface.pdf,2017.
[15] 王鵬濤,路璐. 量化自我與碎片化閱讀融合進路中的閱讀效率提升機制研究[J]. 出版發行研究,2019(3):82-86.
[16] 方海光,羅金萍,陳俊達,等. 基于教育大數據的量化自我MOOC自適應學習系統研究[J]. 電化教育研究,2016,37(11):38-42,92.
[17] 劉詠梅,劇曉紅. 量化自我在健康領域的應用——基于大數據的角度[J]. 情報資料工作,2018(4):56-63.
[18] JOHNSON L,ADAMS S,CUMMINS M.The NMC Horizon report: 2012 higher education edition[R]. Texas: The New Media Consortium,2012.
[19] 蔣細芳,劉羽,馮現坤. 基于時間序列的圖書館個性化服務研究[J]. 軟件導刊,2011,10(5):125-126.
[20] 方海光,羅金萍,陳俊達,杜婧敏. 基于教育大數據的量化自我MOOC自適應學習系統研究[J]. 電化教育研究,2016,37(11):38-42,92.
[21] 孫承愛,季勝男,田剛. 基于混合模型的個性化閱讀系統設計[J]. 軟件導刊,2019,18(8):80-82,87.
[22] KATHARINA K,ALEXANDER G,ANN K P,et al. Effects of a classroom discourse intervention on teachers ‘practice and students motivation to learn mathematics and science[J]. ?Learning and Instruction,2015(35):94-103.
[23] 田娜,周驛,嚴蓉. 基于MOOC的課程討論文本話題挖掘研究[J/OL]. 軟件導刊:1-5. [2020-01-04]. http://kns.cnki.net/kcms/detail/42.1671.TP.20200102.1620.020.html.
(責任編輯:孫 娟)