唐娟 潘志安



摘? 要:關系代數語言是用傳統的集合運算和專門的關系運算來表達查詢的抽象語言,提供了一系列的關系代數操作,通過這種數學運行來指導數據庫在關系操作上的程序實現。場景教學系統中每一個場景對應一個實際應用,場景中設置了問題,本文以系統數據庫為例,給出了基于關系代數運算的數據統計分析過程,采用抽取樣本法計算期望學習時長和學習時長標準差,并設計了一個測算學習者投入度的公式,對評價場景教學具有指導意義。
關鍵詞:場景教學;數據庫;關系代數運算
中圖分類號:TP391? ? ?文獻標識碼:A
Abstract:The relational algebra language is an abstract language that expresses queries by traditional set operations and special relational operations.It provides a series of relational algebraic operations,which can guide the implementation of relational operations in database.Every scene in the scene teaching system corresponds to a practical application.Questions are set in the scene.Taking the database of the system as an example,this paper presents the statistical analysis process of data based on relational algebraic operation,calculates the standard deviation of expected learning time and learning time by sampling method,and designs a formula to measure learner's engagement,which has directional significance for evaluating the scene teaching.
Keywords:scene teaching;database;relational algebra operations
1? ?引言(Introduction)
1970年,E.F.Codd提出關系數據庫理論基礎,關系數據庫應用數學方法來處理數據庫中的數據,20世紀80年代后成為最重要、最流行的數據庫系統。
關系代數語言是用傳統的集合運算和專門的關系運算來表達查詢的抽象語言,提供了一系列的關系代數操作:并、差、笛卡爾積、選擇、投影和更名等基本操作,交、連接和關系除等擴展操作。關系代數操作以一個或多個關系為輸入,結果是有一個新的關系,具有一定過程性,是學習其他數據庫語言,如SQL等的基礎。關系代數運算主要運算符如圖1所示[1]。
場景教學系統搭設在云平臺上,每一個場景對應一個實際應用,教師和學生可以通過網絡選擇其中一個場景進行交互式學習。場景教學理念為“做中學,學中做”,學習內容鑲嵌在具體的操作流程中,場景中設置的問題,為一個實際操作,完成場景內的所有操作任務,就解決了一個實際問題[2]。本文以場景教學系統數據庫為例,基于關系代數運算,對數據進行統計與分析。
2? 系統數據庫表結構(Table structure of system database)
數據庫系統是現代計算機系統的一個重要組成部分,現代的管理信息系統幾乎都是以數據庫作為核心的[3]。場景教學系統數據庫的庫表結構如下:
3? ?數據統計(Data statistics)
基于云平臺的場景教學,覆蓋面廣、學習者需求復雜,應該注重學習測評結果的統計分析和學習測評的質量分析[4]。針對設置的每個問題,給出平均正確率、平均答題用時。針對場景,給出學習次數、平均學習時長、問題的提交率和平均正確率,針對整門課程也能給出以上相應的參數。這些參數可以供系統設計者挑選使用,如學習者學完一個場景,需要生成一個學習報告,學習報告中可以羅列出本人的學習時長及答題正確率、場景的平均正確率及平均答題用時等,以便于學習者比對和參考。
下面列舉出其中幾個參數的關系代數運算過程。
4? ?數據分析(Data analysis)
學習分析研究正從關注大數據轉向有意義數據的探索。如何抓取到學習活動信息流中的關鍵行為數據并解析出學習者的個性學習行為特征是今后研究中要解決的一個問題[5]。故基于場景教學數據庫表,需要抽取合適的樣本進行數據分析,以此來判斷不同場景的教學效果。
4.1? ?期望學習時長
數學期望(mean)(或均值,亦簡稱期望)是試驗中每次可能結果的概率乘以其結果的總和,是最基本的數學特征之一[6]。它反映隨機變量平均取值的大小。一個場景的期望學習時長應該是學習者正常進行學習時的學習時長平均值。針對答題記錄表中某個場景所有記錄測算期望學習時長,并不合理,因為有的用戶可能只是匆匆瀏覽后離開場景頁面,也有的用戶可能是停留在該頁面長時間未進行學習活動,這些非正常記錄會干擾正常學習時長的判定,考慮這兩種情況會導致學習時長過短或過長,可以初步定一個學習時長的上下限,在此范圍內篩選出樣本表。設場景01的學習時長樣本表為R1:
為方便數據統計,將樣本R1投影為樣本T1,T1中僅有屬性“學習時長”。
再根據T1計算期望學習時長。將T1中每條記錄的學習時長看成是一個獨立的值,其發生的概率均等,故可以直接求平均值作為期望學習時長,場景01的期望學習時長E可以通過公式(1)計算。
4.2? ?學習時長標準差
標準差表示的就是樣本數據的離散程度,通常是相對于樣本數據的平均值而定的,用M±SD來表示,表示樣本某個數據觀察值相距平均值有多遠[7]。
μ為均值,計算標準差理論公式:
通過學習時長標準差,可以判斷不同學習者對一個場景的學習時長是否聚集在期望學習時長附近。數據庫系統中一般有相應函數計算標準差,以mySql為例,標準差函數為STD,則場景01學習時長的標準差可以通過公式(2)計算。
現有兩個場景01和02,分別取樣本T1和T2,兩個樣本的學習時長發生散點圖如圖2所示。
標準差越小,表明數據越聚集;標準差越大,表明數據越離散。從圖2中可以看到,場景01和場景02比較,場景02學習時長的聚集度比場景01略高,經過計算標準差值較小。
4.3? ?學習者投入度
將文中給出的統計和分析參數進行組合和加工,可以從不同的維度分析場景教學效果。如為了比較不同場景的教學內容是否能吸引學習者,可以測算不同場景的學習者投入度。學習者投入度至少應從兩個參數進行分析:
一是場景的學習時長標準差。學習時長標準差越小,則學習時長聚集度高,這表明學習該場景時學習者的學習狀態越一致和越穩定。
二是場景問題提交率,其計算方法前文已述,場景教學理念是課中邊學邊做,問題設置在課中,問題是否提交能很好地判斷學習者是否在參與學習,問題提交率高表明學習者的參與度高。
場景的學習時長標準差和問題提交率兩參數呈蹺板式,一個要求越低越好,另一個要求越高越好,蹺板斜度越大,說明該場景的教學吸引力越強,學習者的投入度越高。
假設一個場景學習時長方差為σ場景ID,±1/σ場景ID的學習者為學習投入者,同時場景中問題提交者也在這部分人群中,M場景ID為問題提交率,則可以設計一個測算學習者投入度att的公式(3)。
計算結果表明,場景02的學習者投入度比場景01略高。教學系統中可以設定一個標準,如某場景學習者投入度低于40%,則應著重分析該場景教學的過程和內容,做出相應的診改。
5? ?結論(Conclusion)
本文以場景教學系統數據庫為例,基于關系代數運算給出了數據統計和分析過程,通過這種數學運行來指導數據庫在關系操作上的程序實現,熟悉關系代數的操作就很容易寫出復雜的SQL語句。本研究采用抽取樣本法計算期望學習時長和學習時長標準差,設計了一個測算場景學習者投入度的公式,對評價場景教學具有指導意義。當然,分析場景教學效果應從多維度進行,如答題效果、訪問量、學習者評價等等,這些維度本文沒有探討,為后續研究和其他教學評測人員提供研究思路。
參考文獻(References)
[1] 何玉潔.數據庫原理與應用(第三版)[M].北京:機械工業出版社,2017(6):31-33.
[2] 唐娟.面向軟件技術專業的云平臺場景教學應用研究[J].軟件工程,2018,21(05):60-62.
[3] 蘇俊.數據庫基礎教程[M].北京:中國人民大學出版社,2014:1.
[4] 何曉新,陶水龍,孫志娟.論遠程開放教育環境下工科課程的學習測評模型[J].廣播電視大學學報(哲學社會科學版),2008(04):117-121.
[5] 牟智佳,武法提.MOOC學習結果預測指標探索與學習群體特征分析[J].現代遠程教育研究,2017(03):58-65.
[6] 陳希孺.概率論與數理統計[M].中國科學技術大學出版社,1992:25.
[7] 劉忠廣.標準差、標準誤差和估計標準誤差辨析[J].消費導刊,2018(11):203-204.
作者簡介:
唐? ?娟(1976-),女,碩士,實驗師,講師.研究領域:軟件工程,實踐教學.
潘志安(1967-),男,碩士,教授.研究領域:計算機網絡.