顧小清,馮園園,胡思暢
(華東師范大學 教育信息技術學系,上海 200062 )
超越碎片化學習:語義圖示與深度學習
顧小清,馮園園,胡思暢
(華東師范大學 教育信息技術學系,上海 200062 )
泛在技術的普及使得信息的獲取更加便捷,與之伴隨地是信息消費中的碎片化、多任務和淺層讀圖的現象。針對這一問題,該文依托于“語義圖示”所開展的研究,提出一個有助于提高學習深度的方案——語義圖示工具模型。作為一種幫助學習者達到深層學習的工具,語義圖示工具的設計超越碎片化的知識獲取方式,為學習者提供系統而全面的學習支持。該文首先追溯機器學習和教育領域中深度學習的發展;接著在語義圖示工具的設計中,借助人工智能技術,設計專家系統作為后臺支持,以實現可視化語義建模、語義推薦以及動態模擬的核心功能,這些功能旨在通過語義圖示幫助學習者做出決策、解決問題,以超越碎片化的信息獲取方式;最后,該文以案例的方式呈現語義圖示工具中的幾個核心功能,以示例如何通過可視化的語義圖示超越碎片化的語義獲取。
碎片化;語義圖示;深度學習;機器學習
信息技術的飛速發展及其在社會生活中的普及,除了給公眾帶來更多的信息選擇和信息消費方式之外,同時帶來的,是信息獲取和信息消費的“碎片化”——泛在技術所帶來的副產品。一些調查顯示,近7成用戶每天通過手機訪問互聯網[1],平均每天會查看自己的移動設備150次[2],花費在移動設備上的時間每天長達2小時42分鐘[3]。據第十一次全國國民閱讀調查結果顯示,數字化閱讀方式的接觸率為50.1%,其中44.4%的讀者通過網絡在線閱讀,41.9%的讀者通過手機閱讀。并且信息獲取功能越來越受到成年網民的重視,有74.2%的網民將“閱讀新聞”作為主要網上活動之一,有45.0%的網民將“查詢各類信息”作為主要網上活動之一[4]。
以上調查從不同角度刻畫出信息獲取和信息消費的碎片化特征。碎片化的原因,一方面由于信息來源的多樣性和信息獲取的多渠道。在信息來源方面,小眾媒體、自媒體和大眾傳媒共存;在獲取渠道方面,移動終端成為公眾獲取多種渠道信息的主要載體,主動獲取和推送方式并行。另一方面,信息獲取的圖像化、信息消費的多任務特征,某種程度上也引起了碎片化的發生。信息技術的飛速發展推動了“讀圖時代”的到來,讀圖以“圖說”形式代替“言說”,符合當代人的生活節奏和閱讀取向[5]。圖像的生動現場感給人們帶來的視覺沖擊,有時是任何語言的描述都無法企及的。雖然說“一圖勝千言”,然而,圖像的出現打斷了文字固有的邏輯性與連貫性,其所呈現的信息難以達到系統性和完整性的知識建構要求。而且,當面對圖像時,讀者滿足于圖像所提供的直觀信息,被動的接受而喪失了對文字的主動索取以及再造想象的空間。雖然在某種程度上,圖像的信息量大于文字,但是平面的形象缺乏文字所包含的深層含義。另外,典型的信息消費方式,往往也同時體現多任務的特征,從而加劇了信息消費的碎片化特性。無論是在線的閱讀還是移動中的閱讀,伴隨著多任務的特征:電腦上同時開啟多個窗口并行著多項任務;移動中更是如此,甚至是在通勤、對話、會議的間隙中并行著多任務。
隨著泛在移動技術成為數字學習的一種重要載體,上述信息消費中的碎片化、多任務和讀圖現象也開始出現在數字學習領域。當學習者期冀在生活工作的間隙實現任意時間、任意地點的學習,借助移動泛在技術所實現的碎片化學習也就成為頗具潛力的一種學習方式。但是隨之產生的碎片化、多任務和讀圖等特征所帶來的學習深度問題也隨之浮出水面。某種程度上而言,人類拾取信息的自然方式本身就是碎片化的,學習就是對碎片化的知識、信息等“構件”(Building Block)進行加工的過程[6],但這只是故事的一個方面。故事的另一面,是碎片化的信息獲取所構成的學習,往往具有淺閱讀的特征[7-10]。學習者從圖像中獲取信息,呈現感官化的審美取向,但同時可能帶來的,是文字感悟能力和抽象思維能力的喪失,學習者對知識的理解停留在淺表的感受層面,并且圖像作為典型的碎片化信息載體,在形式上難以建立系統的知識結構。與此同時,當學習者在不同的媒介(電子文檔、電子書、電子課本)、不同的載體(電腦、手機、平板)、不同的任務之間跳轉,人們開始擔憂這樣的學習恐怕缺乏對內容的深入思考,不能將信息做廣泛聯系,學習僅僅停留在了獲取知識的淺層面,而缺少了對知識的匯集、過濾、歸納、反饋和創新。因此構建“深度”的學習環境就成為突破淺層學習的關鍵。如何在學習者的認知突觸中留下軌跡,以便成為知識結構中的組成部分?如何有效地對信息組織加工、構建知識結構、引導學習者建構對整個問題的認識、促進學習者進行反思以及知識的遷移與應用?成為我們關注的焦點。
本文所介紹的,是我們團隊針對上述現象,嘗試以“語義圖示”來突破碎片化和讀圖所帶來的學習深度缺乏問題而開展的研究。語義圖示,作為承載知識信息的新一代圖示媒介,將抽象的知識信息通過帶有語義規則的圖形、圖像、動畫等可視化元素予以表征,促進知識從認識到理解的過程[11]。本研究在語義圖示的研究實踐過程中關注“深度”學習情境的建構,基于語義關系試圖構建“語義圖示”工具,通過建立知識碎片間的語義關聯幫助學習者形成個人的知識體系,從而突破淺層學習,進行更深層面的可視化信息加工和知識建構,構建類似專家系統的語義模型,實現類似推理功能,幫助學習者認識和理解,達到深層學習。
數字學習所伴隨的碎片化、多任務和讀圖特征,給學習方式帶來多樣性及便利的同時,也帶來了學習缺乏深度的問題。應對的明智方式,肯定不是倒洗澡水地同時也拋掉孩子這樣簡單。那么,在擁抱技術給學習帶來的可能性的同時,是否能夠發揮技術的潛力,提供深度的學習?如果我們把碎片化的學習看作是價值有待挖掘的學習信息拾取部分,并把學習的深度聚焦于將碎片化的資源加以聚合、將片段性獲取的信息加以邏輯組織,那么,目前發展勢頭迅猛的自動化技術,包括機器學習/人工智能技術,會是幫助提升學習的深度的良方嗎?
50多年前,人們就開始關注人工智能技術,希望有朝一日計算機能夠產生“自我”的意識,具有類人的、同時超越于人類局限的思維[12]。近年來,人工智能和機器學習技術取得了長足的進步,在大量現成數據的幫助下,計算機已經能夠表現得十分強大。那么,能否借助機器學習和人工智能技術,幫助學習者組織碎片化學習資源,構建自己的知識體系,輔助和促進深度學習的發生?在下面的部分,我們首先對深度學習進行綜述,以理清機器學習/人工智能技術與深度學習之間的關系。
(1)機器學習中的深度學習
實際上,搶注了“深度學習”這個名詞的,最早就是機器學習領域。在機器學習中,深度學習被定義為“一系列試圖使用多重非線性變換對數據進行多層抽象的算法”[13][14]。機器學習算法是一類從數據中自動分析獲得規律,并利用規律對未知數據進行預測的算法[15][16],是對人的意識、思維和信息過程的模擬,是一門人工智能的科學[17]。而深度學習是機器學習中表征學習方法的一類,其關系如圖1所示。

圖1 深度學習、機器學習、人工智能間的關系
自2006年起,深度學習(或者稱為層次學習)成為機器學習研究的一個新領域。深度學習技術采用的方法主要是無監督學習,取代了人參與的特征選取的過程,自動進行特征學習,通過對原始輸入數據的處理分析自主發現一些有效特征[18]。一個典型的設置:一臺電腦面臨著一個大的數據集,需要對這些數據進行分類,類似沒有具體指令的情況下讓孩子對玩具進行分類。孩子可能對它們的顏色、形狀或功能,或其他的方面進行分類。機器學習者嘗試這樣做,例如對數以百萬計的手寫體進行大規模學習,把這些手寫體數據相互對比,在相似性的基礎上對他們“聚類”[19]。
之所以把這種學習稱為“深度”,是相對于之前的機器學習方法的“淺層”性。深度學習技術是對人工神經網絡(Artificial Neural Network,ANN)的發展,通過模仿人腦的逐層抽象機制來解釋數據,設計算法對事物進行多層級分布式表示[20],組合低層特征,自主發現有效特征,進行特征繼承,而形成抽象的高層級的表示[21],在更高水平上表達抽象概念,以建立、模擬人腦進行分析學習的神經網絡[22]。
神經網絡可以看作是深度學習的基礎。該領域的研究可以追溯到二十世紀五十年代,弗蘭克·羅森布拉特試圖建立模擬人類感知能力的機器,1957年成功完成感知機的仿真,1959年實現基于感知機的神經計算機Mark1,在算法上發展了一種迭代、試錯、類似于人類學習過程的學習算法,能夠識別一些英文字母。上世紀八十年代,“反向傳播”算法出現,“隱層”概念被提出,解決了原始感知器無法解決的異或功能,構建出更復雜的虛擬神經元網絡。2006年,杰弗里·辛頓提出深度學習的概念,對“神經網絡”進行改進,增加隱層的層數(深度),發現如果人工神經網絡的隱層足夠多,選擇適當的連接函數和架構,并增加一個非監督學習的“預訓練”網絡組成,具有更強的表述能力[23]。
深度學習的發展不僅吸引了來自學術領域的目光,也吸引了工業領域的目光。過去的幾年里,谷歌、蘋果、IBM積極參與到深度學習技術的研究當中。2007年開始,紐昂斯通訊公司開發以語音識別技術為基礎的虛擬個人助手“蘋果語音助手”;2012年6月,谷歌大腦通過模擬神經連接來模擬人類學習[24];2012年11月,微軟公開演示全自動同聲傳譯系統,實現自動語音識別、英中機器翻譯和中文語音合成,深度學習技術推動了語音識別精確度的提高[25];2014年3月,Facebook人臉識別技術的識別率達到了97.25%,準確率幾乎媲美人類(97.5%)[26]。這些成功背后的技術支持都來源于機器學習領域的深度學習技術。
(2)教育中的深度學習
由于深度學習這個概念已被計算機領域“搶注”,我們用深層學習來闡述教育領域對深層/深度學習的研究。與計算機領域的深度學習意義不同,教育領域的深層學習是一種學習方式,目的是為了構建有意義的學習,在記憶的基礎上理解、歸納、掌握、運用,結合原有認知結構,批判性地接收和學習新知識,建立知識間的相互聯系,通過分析,做出決策和解決問題的學習。與淺層學習停留于信息的接收不同的是,深層學習關注于對新知識的批判性吸收,將它們與已有知識建立關聯,引起對概念的理解和長期保留,以便于應用到解決新的環境中所遇到的問題[27]。深層學習與淺層學習的主要特征對比如表1所示。

表1 深層學習與淺層學習的特征[28]

續表1
早在20世紀80年代,認知科學家發現當學習者學習深層知識并清楚在真實世界和實際情況中如何運用這些知識時,知識會在學生頭腦中保持得更為持久[29]。最初,深層學習的概念由Marton and Saljo(1976)提出,通過測試學生閱讀文章,發現采用不同學習過程和策略的學生在理解和記憶中的表現有所不同,而采用深層學習還是淺層學習主要受到學習者意愿的影響[30]。隨后Biggs(1987)沿用深層學習和淺層學習的概念,指出不同的學習動機和學習策略的結合對學習效果的影響,同時,個人能力和流程控制影響元認知。為了了解學習者理解能力[31],Pask(1977)將學習過程分為序列型(Serialist)和整體型(Holist),序列型指按部就班閱讀文本,整體型指閱讀所有吸引注意力的文本[32]。研究發現,整體型更強調已有知識的構建表達,而序列型更加關注程序細節,因此在理解力的表現上有很大不同。William & Flora Hewlett Foundation針對深層學習做了一系列研究,了解是否有一種實現方法推動深層學習的發生,發現:(1)通過設定明確的學習目標,設計基于項目的課程和實踐,改善教學策略,給予學習支持,以及追蹤內容評估,可以幫助學習者掌握核心知識和批判性思維能力[33]。(2)網絡環境為學習者提供更多進行深度學習的機會,有助于復雜問題的解決,人際間的協作與交流,及時反饋,使得學習者更好地學習如何學習,進行跨學科學習,并建立知識與實踐的聯系,更好地應對和解決復雜問題[34]。索耶(2010)指出深層學習需要學習者在新舊知識、概念、經驗之間建立聯系,能夠將他們的知識歸納到相關的概念系統中,在學習過程中尋找學習模式和基本原理,并評價新的想法,能夠將這些想法與結論聯系起來。同時,要求學習者了解對話的過程,對話的過程就是知識產生的過程,在這個過程中,能夠批判地檢查論據的邏輯性,并對其理解及學習的過程進行反思[35]。
可以看出,深層學習的發生受到學習者學習動機、個人能力、學習流程、學習策略、學習環境以及情感和行為投入等因素的影響,強調高階認知目標層次和思維能力,總的來說,是一種有意義的學習,一種主動學習。因此,研究團隊希望通過對機器學習領域以及教育領域中深度學習的研究,找到一個可落地的深度學習方案,來輔助學習者完成深度學習的過程。
碎片化學習中信息的片段化拾取往往是零碎的甚至閑散的,這樣的信息獲取往往缺乏對內容的深入思考,不能建立信息的廣泛聯系,學習僅僅停留在淺層面;同時,“讀圖”方式的信息感知往往停留在對信息的感性認知而忽略其內部邏輯聯系,不易進行學習的推理。如果學習只能停留在這種無組織、孤立的知識片段層面,也就難以超越碎片化導致的淺層學習局限。那么,上述的機器學習、深度學習技術,抑或教育領域中的深層學習策略,是否是超越淺層學習的良方?
信息零碎、分散、缺乏邏輯性和連貫性是問題的關鍵。教育領域下的深層學習被視為一種學習方式,需要批判性地吸收建構知識,強調新舊知識之間的相互聯系,通過分析做出決策,解決實際問題。深層學習的內涵恰好可以填補碎片化學習中淺層學習的空缺。超越碎片化實現深層學習,是探索解決碎片化問題的要義。但是,深層學習雖然描述了一種有意義的學習,提出了對學習的要求,卻并沒有給出可操作的實施方案。那么,機器學習/人工智能技術,是否提供深層學習道路?專家系統作為人工智能的重要研究領域,是一類具有專門知識和經驗的計算機智能程序系統,其內部含有大量的某個領域專家水平的知識與經驗,通過推理和判斷,模擬人類專家的決策過程,解決那些需要人類專家處理的復雜問題[36],可以對人的意識、思維和信息處理過程進行模擬,從而像專家一樣解決學習者學習過程中遇到的問題。
知識庫和推理機是專家系統的核心,建立知識庫的關鍵是知識的獲取和表示,通過推理機將獲取的知識進行邏輯化、系統化處理,可以作為輔助人類提升學習深度的有力工具。知識庫存放著搜集來的知識,通過系統地表達或模塊化,使得計算機能夠推論和解決問題。知識庫中的知識包含兩種,一種為知識本身,對物質及概念的實體分析,并確定彼此關系;另一種為人類專家特有的經驗法則、判斷與直覺[37]。推理機基于某種邏輯規則,針對當前問題的條件或已知信息,反復匹配知識庫中的規則,獲得新的結論,以得到問題的求解結果。推理模式有正向和反向推理兩種,正向推理是從條件匹配到結論,反向推理則先假設結論成立,看條件是否得到滿足[38]。由此可見,推理機與專家解決問題的思維方式相似,而知識庫通過推理機實現其價值。
如果使用機器學習技術作為專家系統的推理機制,則專家系統主要的功能和任務就是根據給出的一系列特征推理出正確的分類結果。這種專家系統表現為,當學習者給出知識的特征(或屬性),如圖2所示x1、x2、x3,專家系統可以依據數據訓練而生成的預測模型進行推理,從而計算出知識目標變量,也就是最后的分類結果,如圖2中輸出結果。知識特征可以是一個也可以是多個,不同的知識特征有不同的權重,代表著對最后結果的影響程度,如圖2所示w1、w2、w3。例如某個用于辨別鳥的類別的專家系統,可以根據所給的特征推理出鳥的類別,不同類型的鳥具有不同的特征,如后背顏色、體重、翼展、腳蹼等。當學習者向該專家系統輸入某一只鳥的特征信息:“體重為3千克,翼展為11厘米,無腳蹼,后背顏色為綠色”,專家系統可以提取問題根據其中的知識特征推理出知識的目標變量值為“瑰麗蜂鳥”。專家系統這種獨立而準確的“思考”能力是我們需要借鑒利用的。

圖2 專家系統工作原理
利用這樣的專家系統,在學生學習過程中扮演虛擬教師的角色,提供準確、實時的知識推送、信息反饋、動態模擬、學習建議,幫助學習者建立知識間的聯系,促進學習者進行學習反思,能夠在一定程度上輔助學習者實現深層學習,滿足數字化學習時代超越碎片化的訴求。本文所介紹的語義圖示研究,正是試圖結合深層學習的方法和深度學習的專家系統,設計一個具有語義關系的圖示工具,該工具不僅能夠可視化地表征知識語義關系,便于人們對零散的知識片段形成整體而又形象的認識和理解,還能通過分析語義模型實現推理、反饋、模擬等功能,從而在一定程度上破解碎片化和讀圖所帶來的學習深度缺乏問題。
在碎片化學習的時代,學習者必須突破淺層學習的局限,以實現深度學習的目標為努力方向,從而真正從數字化學習中受益。作為一種探索中的技術方案,本研究團隊嘗試以“語義圖示”來尋求突破碎片化和讀圖所帶來的學習深度缺乏問題。語義圖示工具模型的核心包括:(1)進行可視化知識表征的語義關系;(2)語義模型以及專家系統生成的語義推薦;(3)基于語義規則的語義建模和動態模擬。工具模型如圖3所示。該語義圖示工具模型使得學習者能夠以類似學科專家的方式,通過對帶有語義規則的圖形、圖像、動畫等可視化元素的操作,進行知識的建模,通過語義推薦功能,為學習者提供反饋和建議,使得學習者能夠在有支架的情況下,像專業人員一樣運用復雜的表征來進行交流,像科學家、數學家一樣利用具體的可視化模型[39][40]。同時,學生可以可視化地建立系統的學習者知識模型,通過得到的推薦進行反思從而不斷對形成的知識體系更新完善,通過語義的知識動態模擬直觀清晰地把握概念之間的關系。

圖3 基于專家系統的語義圖示工具模型
能夠用來進行知識的可視化表征或建立知識模型的語義關系圖,是語義圖示工具模型的最基本組成部分。深度學習的實質表現是知識建模,而語義關系圖的主要功能,正是提供學習者進行知識梳理,建立知識對象和屬性、知識關系及過程的知識模型。語義圖示的這一功能提供了邁向深度學習的第一步。
語義圖示強調將抽象的知識進行可視化表征,在可視化界面,學習者看到的不是大段文字,而是攜帶語義的圖形、圖像。當圖形、圖像攜帶語義,相比于傳統的讀圖,學習者可以更容易地把握知識的邏輯關系,建立碎片信息間的聯系。語義圖示對信息的可視化加工,大大增加了閱讀的效率,能夠適應當代人的生活節奏與閱讀取向。
學習者可以對這些可視化元素進行添加、刪除、編輯等操作,通過拖放它們的位置、改變它們的屬性,最后組成一個組圖,來表征某一知識及其關系,形成自己的知識體系。為了方便學習者的操作,這些可視化元素還可以提煉為語義圖示控件、語義圖示模板,使學生能夠快捷搭建自己想要的模型。
能夠用來進行基于規則的知識結構化的語義模型,以及以語義模型為基礎的專家系統,是語義圖示工具模型實現深度學習的核心功能。語義模型是以模型為媒介來實現數據語義關系形式化描述的一種方式。狹義的語義關系可以理解為文本的詞義關系。Kintsch and van Dijk (1978)在他們的早期模型中提出,文本的意義可以被解析為語義單元,它們依據連貫的語義關系互相聯系[41]。閱讀理解被視作是匯總語義單元的過程,推理被視作具有搭建文本連貫性缺口的橋梁作用。而廣義的語義關系表示概念間的單向潛在聯系[42]。常見的重要語義關系有:因果關系、上下位關系、所屬關系、同義關系、反義關系、能動關系、被動關系等。語義圖示中的語義關系是對語義的廣義理解。通過賦予圖形圖像一定的語義規則,為建立語義模型提供基礎。
語義模型可以通過兩種途徑產生:(1)人類賦予;(2)通過計算模型產生[43]。語義圖示中的語義包含了這兩種產生方式:學習者建立的語義模型由人來定義,而專家系統中的語義模型則通過計算機生成。語義圖示工具模型中的專家系統,其核心正是由計算機生成的特定知識領域的預測語義模型。基于語義模型,專家系統能夠進行基于規則的推理。需要說明的是,作為一種可落地的深度學習方案,這里所運用的專家系統采用的是基于經驗專家的模型,而非通過機器學習獲取。兩種途徑的語義根據彼此的語義模型進行溝通。通過在學習者的知識需求和專家系統的知識庫之間搭建一座橋梁,將兩者從語義的角度建立關聯,對抽象的知識/信息進行基于語義模型的解析,以滿足學習者對深度學習的需求。
語義圖示工具模型的一項核心功能是專家系統通過獲取來自學習者的知識特征變量,利用預測語義模型進行分析推理,最后得到輸出,即知識的目標變量。當學習者通過可視化界面的交互操作完成知識表征時,所形成的可視化圖像并不能直接被計算機理解,所以需要根據其語義將其解析成計算機可理解的語義模型。此時專家系統根據學習者在可視化界面建構的知識模型,基于專家系統的知識庫生成相對標準的、正確的專家預測語義模型。專家系統得出的知識目標變量,很可能就是學習者遺漏的知識點,不確定的問題答案,這些反饋的信息就代表著學習者還需努力進步的方向,并反饋到用戶操作界面上。
學習者獲取碎片化知識片段時,很容易造成與先期知識之間的連接不足,專家系統可以推送相應的知識來提示學習者進行關聯;學習者完成一次知識的建模后,可以與專家系統中較為標準完善的知識模型進行比對,專家系統給出反饋,提示知識的疏漏或者錯誤,學習者從而進行更深層的知識加工;在進行多次知識模型的比較后,專家系統根據總體的數據分析給出學習建議。這些反饋結果的形式多樣,可以是一些數據,例如兩種語義模型的匹配百分比、錯誤知識節點的數量;可以是知識節點,例如推送的學習者未能聯系起來的知識節點;也可以是知識模型,例如專家系統生成的標準語義模型。
學習者在使用基于專家系統的語義圖示工具時,不僅可以通過可視化的方式進行知識建模,幫助自己梳理知識,建立知識間的聯系,并對知識有整體而形象的認識理解,還可以在學習的過程中不斷得到提示、評估、建議,從而促進在學習中不斷反思,鍛煉高階思維能力,進行知識的深度加工,實現深度學習。
當學習者在面對一些現實問題無法進行親身經歷和實踐時,或者希望通過已知條件和現有數據,分析及預測趨勢時,對學習場景“情境化”是很好的解決方案,實現情境性學習環境設計是深度學習關注的一個核心,也是語義圖示工具設計的關鍵。
語義建模和動態模擬是語義圖示工具的核心功能。學習不僅僅是傳遞和獲得概念,學習者參與到類似學科專家研究的日常活動中有利于獲得深度學習的發生[44]。語義圖示工具為學習者提供一個交互式的、解決復雜問題的環境,超越單一的對知識進行記憶,在這里,學習者可以像學科專家一樣建模、分析,將學習過程中的思維可視化,將學習者的內在認知過程外化,幫助知識建構和思路整理。同時,工具對真實存在的對象關系進行描述,建構相似的、有意義的、可被操作的場景。在建模的基礎上,語義圖示工具實現過程的動態模擬:(1)針對群體型。群體型的動態模擬建立在數量的變化上,透過變化曲線,可以分析數據的變化和走向,例如羊群中的羊的數量變化。(2)針對個體型。在個體型的動態模擬中,需要對粒度進行劃分,這影響著整個系統的運算能力和靈活性,每個個體遵循各自的規則和算法調節自己的狀態。通過個體型動態系統可以模擬群體中每個個體的運動和軌跡,以實現真實場景的模擬,從而解決現實生活中遇到的實際問題,例如羊群中闖進一只狼,每只羊的運動狀態。
學習者通過建模,以及直觀可視化的情境模擬,參與到學習場景中,在反復不斷對系統進行建構和修改的過程中,鍛煉學習者思維和邏輯能力。同時,工具的可視化結果為學習者提供反饋,形成一個學習閉環。
死記硬背和簡單的記憶對個人的知識建構的作用是淺顯的,起主要作用的是有意義學習的發生[45]。因此,本研究設計的語義圖示工具試圖幫助學習者實現深度的學習。以下的案例是現有的、能夠借用來從不同角度闡釋語義圖示功能,包括達到實現語義層級結構模式的WordNet、實現語義推薦并與專家模型比對的Cmaptools,以及實現知識表征模擬過程的Insightmaker。
語義關系的構建是設計語義圖示系統最關鍵和基礎的部分。現有的工具中,WordNet的類似功能能夠很好地對此予以闡釋。WordNet是由普林斯頓大學的心理詞匯學家和語言學家于1985年開始承擔開發的一個基于心理語言學理論的在線詞典參照系統。系統中的名詞、動詞、副詞和形容詞聚類為代表某一基本詞匯概念的同義詞集合,并在這些同義詞集合之間建立起各種語義關系[46]。
傳統字典通常根據詞形,標準的按字母順序對詞匯排序,而WordNet試圖根據詞義而不是詞形來組織詞匯信息,更像是作為人的智能結構一部分的“內在詞典”[47],那么能夠表達詞匯概念的性質和組織方式就顯得十分重要。在詞匯語言學中采用詞匯矩陣的概念來表示詞匯的組織方式,將詞按照“詞形”和“詞義”映射,“詞形”特指詞語或主題詞,“詞義”表示詞形所代表的詞匯概念[48]。如表2所示說明了詞匯矩陣的概念,假定列代表詞形,行代表詞義。如果同一表中,列中有多個表項,則該詞形為多義詞;行中有多個表項,則對應的詞形是同義,相應的詞為同義詞。

表2 詞匯矩陣[49]
詞形與詞義之間的映射是多種多樣的,有些詞形有多個不同的詞義,有些詞義可以用幾種不同的詞形來表達,WordNet中表示詞與詞之間的關系眾多,以同義、反義、上下位關系、整體部分關系為例進行介紹。
(1)同義關系
因為判斷詞之間關系的能力是在詞匯矩陣中表達詞義的先決條件,其中同義關系是WordNet中最重要的關系。將同義關系與上下文相關聯,如果兩種表達方式在語言文本中相互替代又不改變其真值,則這兩種表達就是同義的[50]。
(2)反義關系
反義關系并不是一種簡單的對稱關系,有些詞概念上相對,卻不能稱為反義詞。反義詞是一種詞形間的詞匯關系,而不是詞義間的語義關系,區分詞形之間的語義關系和詞義之間的語義關系十分必要。
(3)上下位關系
上下位關系是對詞義之間語義關系的描述,又稱為從屬/上屬關系、子集/超集關系或ISA關系。通常情況下,下位詞繼承上位詞的一般化概念的所有屬性,并且至少增加一種屬性,以區別于上位詞以及上位詞的其他下位詞。同時,上下位關系具有不對稱的關系,通常情況下,一個詞只有唯一的上屬關系,產生一種層次語義結構[51]。對于名詞來說,最終的根節點都是實體[52]。
(4)整體部分關系
整體部分關系指某一個詞集是整體,而另一個詞集在含義上是該詞集的部分,“部分”可以進行繼承。
語義圖示系統試圖實現的語義推薦功能,能夠通過CmapTools予以闡釋。CmapTools是人機識別研究院IHMC(the Institute of Human & Machine Cognition)開發的軟件,用戶可以利用它創建、導航、共享和分析評價以概念圖形式表示的知識模型[53]。學習者可以通過Cmaptools整合網絡資源、課堂資源、實驗資源以及領域知識,進行課程安排,記錄相關閱讀,整理數據,支持小組協作,整理畫圖、照片、視頻,進行多學科整合,用于演講、研究和課前、課后評價等活動,同時Cmaptools為學習者提供腳手架支持,帶來一種新的教育模式[54]。
Cmaptools包含“節點”“連線”和“連接詞”。節點代表某一命題或知識領域的關鍵知識概念,節點間的連線表示概念間的邏輯關系,連線上的連接詞表示概念間通過何種方式進行連接,如圖4所示。

圖4 Cmaptools要素組成
1977年,Novak提出知識組成的關鍵要素是概念以及概念間的關系的命題[55],當關鍵概念和概念間的相關關系通過概念圖呈現給學習者時,Novak發現這對學習者學習十分有效[56]。因此Cmaptools包含一個重要的功能,即學習者以“專家骨骼”為基礎,通過對“專家骨骼”修改或者重構,來幫助構建自己的知識體系。Cmaptools中包括近300種概念圖合理涵蓋1到12年級,6到18歲的科學領域,很多科學家專注于某一領域,并且不斷改進概念圖以達到更好的效果[57]。Camptools可以進行語義結構比對,以及根據節點的語義關系及相關節點進行推薦,但是這種推薦并不是機器學習的結果,而是之前人為的已經做好的一個穩定的語義結構,如圖5所示。

圖5 Cmaptools語義推薦
這種“概念圖式”的知識建模過程,幫助學習者理清思路,梳理概念間相互關系;語義自動推薦功能為學習者提供腳手架,引導并支持學習者進行下一步學習;語義比對功能,與專家結構的對照能夠快速發現自主學習中的不足并及時矯正。
語義圖示作為超越碎片化的最重要功能,是實現基于語義的知識判斷,而現有的工具中,Insightmaker所具有的知識表征模擬過程能夠對此予以示例。Insightmaker是一個基于Web的可視化建模和模擬工具,包含兩種通用的建模方法,分別為系統動力的建模和基于代理的建模,具有同樣的建模要素和規則[58]。Insightmaker的模擬功能將知識間的關系和變化進行動態展示,超越了停留在靜態理解層面上的認知,有助于達到深度學習的發生。
系統動力的建模,關注系統的整體集合。比如水桶漏水,將水視為一個整體,關心的是水的數量,而不是某一滴水。系統動力的建模主要運用四類基本元素,集合/原料(Stocks)、流程(Flows)、變量(Variables)和鏈接(Links)。Stock是儲存原料的集合,例如一個銀行賬戶是一個Stock儲存貨幣。Flow表示Stock中存儲的原料的移動,例如從存款到取款的過程,可以看做銀行賬戶中存儲的貨幣的移動。Variable是動態計算值或常量,例如一個銀行賬戶模型中,可以設一個變量表示利率,這個變量既可以是固定的,也可以是隨時間而變動的。Links表示不同原料之間的信息傳輸,如果兩個原料鏈接,那么它們以某種方式相關。如圖6和7所示,通過集合/原料、流程、變量和鏈接對羅亞爾島上狼和鹿的相互作用進行建模,用真實的數據可視化模擬狼和鹿數量的變化。

圖6 系統動力的建模案例—狼和鹿數量關系建模

圖7 系統動力的建模案例-狼和鹿數量關系模擬
基于代理的建模,關注集合中的對象。對群體中的個體進行模擬時,我們需要獨立的代理來代表人群中的每一個個體,每一個代理都需要一系列的屬性來定義它的狀態。例如,當對一個捕食模型進行建模時,追捕者應當設置“饑餓”和“飽食”兩個狀態,當捕食者狀態為“饑餓”時找尋獵物,當狀態為“飽食”時保持靜止,如圖8所示。基于代理的建模支持兩種空間結構,分別為地理結構和網絡結構。地理結構即通過給定每一個代理x,y坐標,代理間的互動基于坐標進行移動。網絡結構表示代理與代理間的關聯,代理間的互相關聯會影響到它們的行為。如圖8和9所示,這是一個果園。消費者圍繞果園尋找果樹,當他們發現了肥沃的果樹,他們消滅掉所有的水果,即轉換為不肥沃的果樹。然而,隨著時間的推移,不肥沃的果樹漸漸長出新鮮的水果,又成為肥沃的果樹。

圖8 基于代理的建模案例—果園采摘與生長模型建模

圖9 基于代理的建模案例—果園采摘與生長模型模擬
以上即為研究團隊正在努力開發的語義圖示工具。Novak曾在一次訪談中說過,學習新知識的方式有兩種:一是機械學習,學習者將概念與命題隔離開;二是意義學習,學習者積極將已有概念與命題相結合,并對已有知識進行組織。然而,機械學習無法使得知識被長時記憶,只有意義學習可以應用在解決新問題的情境中,促進以后的相關學習[59]。語義圖示工具設計的目的就是促進意義學習的發生,與以往概念圖、思維導圖不同,學習者通過語義圖示工具建立知識模型,實現思維方式的可視化;借助工具的語義推薦和比對,實現對學習過程的支持輔助;運用系統動態模擬仿真,實現真實場景的模擬,提高學習環境的情境性和沉浸性。學習的發生正在從外部環境設計向內在認知過程和思維水平的培養進行過渡。
想要弄清楚深層學習“黑箱”的內部過程,需要借助技術手段,更多地關注學習者的內在學習過程,促進有意義學習的發生,使得超越碎片化成為現實。雖然新技術的發展,有利有弊,為教育帶來更多可能性的同時,也帶來了教育的困擾。但本研究在探究不同類型技術的過程中,剔除冗雜信息,旨在實現促進深層學習的功能,達到深層學習的教育價值,同時,處理好技術和教學的融合關系,更好地引發學習者深度學習的發生。
正如Berliner(2002)所說,教育是最難的科學,它和人相關;但同時也是最樸實的,其最終目的是為了促進人的發展。這也正是本研究團隊的立足所在,關注教育,發展教育,期待技術不斷地推動教育的發展[60]。
[1]Google.Our Mobile Planet:China [EB/OL].https://think.withgoogle.com/mobileplanet/zh-cn/,2014-12-31.
[2]Meeker M,Wu L.KPCB Internet Trends 2013[EB/OL].http://www.docin.com/p-659833489.html,2014-12-31.
[3]Flurry.Apps Solidify Leadership Six Years into the Mobile Revolution[EB/OL].http://www.flurry.com/bid/109749/Apps-Solidify-Leadership-Six-Years-into-the-Mobile-Revolution#.VIwA6_mUdvs,2014-12-31.
[4]“第十一次全國國民閱讀調查”成果發布[EB/OL].www.chuban.cc,2014-12-31.
[5]楊松芳.解析“讀圖時代”[J].沈陽師范大學學報(社會科學版),2006,30(3):49-51.
[6]Gagne E D,Yekovich C W,Yekovich F R.The cognitive psychology of school learning [M].New York:HarperCollins College Publishers,1993.
[7]王佑鎂.國內外數字化閱讀發展及閱讀服務創新研究[J].中國信息界,2012,(12):42-43.
[8]王佑鎂.數字化閱讀對未成年人認知發展的影響研究[J].中國電化教育,2013,(11):6-11.
[9]潘雙林.網絡閱讀深度化的實踐探索[J].中國電化教育,2012 ,(4):110-112.
[10]李曉源.論網絡環境中的“碎片化”閱讀[J].情報資料工作,2011,(6):84-87.
[11]顧小清,權國龍.以語義圖示實現可視化知識表征與建模的研究綜述[J].電化教育研究,2014,(5):45-52.
[12]Turing A M.Computing machinery and intelligence [J].Mind,1950,(49):433-460.
[13]Bengio Y.Learning deep architectures for AI [J].Foundations and trends?in Machine Learning,2009,2(1):1-127.
[14]Bengio Y,Courville A,Vincent P.Representation learning:A review and new perspectives [J].Pattern Analysis and Machine Intelligence,IEEE Transactions on,2013,35(8):1798-1828.
[15]Mitchell T M.Does machine learning really work? [J].AI magazine,1997,18(3):11-20.
[16]Alpaydin,Ethem.Introduction to machine learning [M].Cambridge:MIT press,2004.
[17]Langley P.Elements of machine learning [M].San Francisco:Morgan Kaufmann,1996.
[18][21]Deng L,Li J,Huang J T,et al.Recent advances in deep learning for speech research at Microsoft [A].Rabab Ward.2013 IEEE International Conference on Acoustics,Speech,and Signal Processing[C].Vancouver:IEEE,2013.8604-8608.
[19]Marcus G.Is“Deep Learning”a Revolution in Artificial Intelligence?[EB/OL].http://www.newyorker.com/news/news-desk/is-deeplearning-a-revolution-in-artificial-intelligence,2014-12-31.
[20]Bengio Y.Deep learning of representations:Looking forward[A].Adrian-Horia Dediu.Statistical Language and Speech Processing[C].Berlin,Heidelberg:Springer Berlin Heidelberg,2013.1-37.
[22][24]Jones N.THE LEARNING MACHINES[J].NATURE,2014,(505):146-148.
[23]Hinton G E.Learning multiple layers of representation [J].Trends in cognitive sciences,2007,11(10):428-434.
[25]Scientists see promise in deep-learning programs[EB/OL].http://www.nytimes.com/2012/11/24/science/scientists-see-advances-in-deeplearning-a-part-of-artificial-intelligence.html?pagewanted=all&_r=0,2012-11-23.
[26]Facebook’s DeepFace software recognizes faces as well as humans do[EB/OL].http://www.nydailynews.com/life-style/facebook-hightech-deepface-article-1.1728372,2014-12-31.
[27]Houghton W.Engineering subject centre guide:Learning and teaching theory for engineering academics [M].Loughborough:Higher Education Academy Engineering Subject Centre,2004.
[28]Lublin J.Deep,surface and strategic approaches to learning [R].Dublin:Centre for Teaching and Learning,2003.
[29][36][40][44]R.Keith.Sayyer.The Cambridge handbook of the learning sciences [M].New York:Cambridge University Press,2006.
[30]Marton F,S?lj? R.On Qualitative Differences in Learning:I—Outcome and process*[J].British journal of educational psychology,1976,46(1):4-11.
[31]Biggs J B.Student approaches to learning and studying [M].Melbourne:Australian Council for Educational Research,1987.
[32]Pask,G.Third Progress Report on SSRC Programme HR2708[R].Richmond:System Research Ltd,1977.
[33]Mette Huberman,Catherine Bitter,Jennifer Anthony,Jennifer O’Day.The Shape of Deeper Learning:Strategies,Structures,and Cultures in Deeper Learning Network High Schools[R].Washington:American Institutes for Research,2014.
[34]Catherine Bitter,James Taylor,Kristina L.Zeiser,Jordan Rickles.Providing Opportunities for Deeper Learning[R].Washington:American Institutes for Research,2014.
[35]Kristina L.Zeiser,James Taylor,Jordan Rickles,Michael S.Garet,Michael Segeritz.Evidence of Deeper Learning Outcomes[R].Washington:American Institutes for Research,2014.
[37]Liao S H.Expert system methodologies and applications—a decade review from 1995 to 2004[J].Expert systems with applications,2005,28(1):93-103.
[38]畢學工,杭迎秋,李昕等.專家系統綜述[J].教育技術導刊,2009,7(12):7-9.
[39]Hayes-Roth F,Waterman D A,Lenat D B.Building expert system[J].Addison-Wesley Pub,1983,(1):405-420.
[41]Kintsch W,Van Dijk T A.Toward a model of text comprehension and production [J].Psychological review,1978,85(5):363.
[42]Blanco E,Cankaya H C,Moldovan D.Composition of semantic relations:Model and applications[A].Aravind K.Joshi.COLING '10 Proceedings of the 23rd International Conference on Computational Linguistics:Posters[C].Stroudsburg:Association for Computational Linguistics,2010.72-80.
[43]牟冬梅,陳倩,王麗偉.基于語義模型的數字圖書館知識組織信息抽取策略[J].圖書情報工作,2009,53(15):21-25.
[45][54][56][57]Novak J D,Ca?as A J.Building on new constructivist ideas and CmapTools to create a new model for education[A].Jaime Sanchez Ilabaca.IX Taller Internacional de Software Educativo TISE 2004[C].Santiago:Universidad de Chile.2004.
[46][49][50][51]Miller G A,Beckwith R,Fellbaum C,et al.Introduction to wordnet:An on-line lexical database*[J].International journal of lexicography,1990,3(4):235-244.
[47]姚天順,張俐,高竹.WordNet 綜述[J].語言文字應用,2004 (1):27-32.
[48]Miller G A.Dictionaries in the Mind [J].Language and Cognitive Processes,1986,1(3):171-185.
[52]WordNet Relations [EB/OL].http://wordnet.princeton.edu/wordnet/,2014-12-31.
[53]Ca?as A J,Hill G,Carff R,et al.CmapTools:A knowledge modeling and sharing environment [A].Alberto J Can?as.Concept maps:Theory,methodology,technology.Proceedings of the first international conference on concept mapping [C].Pamplona:Direccion de Publicaciones de la Universidad Publica de Navarra,2004.125-133.
[55]Novak,J.D.A Theory of Education [M].NY:Cornell University Press,1977.
[58]Fortmann-Roe S.Insight Maker:A general-purpose tool for webbased modeling & simulation [J].Simulation Modelling Practice and Theory,2014,(47):28-45.
[59]希建華,趙國慶.“概念圖”解讀:背景,理論,實踐及發展——訪教育心理學國際著名專家約瑟夫· D· 諾瓦卡教授[J].開放教育研究,2006,12(1):4-8.
[60]Berliner D C.Comment:Educational research:The hardest science of all [J].Educational researcher,2002,31(8):18-20.
顧小清:博士,教授,研究方向為教育信息化理論與實踐、CSCL、學習技術系統用戶行為研究(xqgu@ses.ecnu.edu.cn)。
馮園園:在讀碩士,研究方向為知識可視化表征(irisfeng11@gmail.com)。
胡思暢:在讀碩士,研究方向為知識可視化表征(cc_fairy@hotmail.com)。
2015年1月12日
責任編輯:李馨 趙云建
Go beyond the Fragmentation:Semantic Diagram and Deep Learning
Gu Xiaoqing,Feng Yuanyuan,Hu Sichang
(Department of Education Information Technology,East China Normal University,Shanghai 200062)
Wide use of technology in education enables the convenient access to much richer information,while on the other hand,produce the so called phenomenon of“fragmented learning”,when the learners frequently engage in multi-task and pick up fragmented information,among which visual are always preferred.This phenomenon resulted in shallow learning is the problem that this paper tried to focused on.A“semantic diagram”model was proposed in this study as a way to help learners achieve deep learning,which can provide learners with a systematic and comprehensive learning support,to integrate the fragmented knowledge into a systematic knowledge base.This paper reviewed the development of deep learning in the field of machine learning and education at fi rst; then introduce the design of the semantic diagram tools based on the arti fi cial intelligence technology,using expert system as a back-end support to visualize semantic modeling,semantic recommendation and dynamic simulation,in order to help learners make decision and solve problems.At last,this paper listed three semantic tools as examples to represent core functions and illustrate how it works to help resolve the issue of learning fragmentation.
Fragmented learning; Semantic Diagram; Deep Learning; Machine Learning
G434
A
1006—9860(2015)03—0039—10