迪麗努爾·克依木
新疆師范大學,新疆烏魯木齊,830054
在傳統的教學模式中,由于學生在知識基礎、認知能力、興趣等方面的差異,造成其對知識結構的組織方式也不盡相同。一般學生在學習過程中,都能發現知識的關系,并把新舊知識連接在一起。但部分大學生知識結構不完整、知識聯系不清,不能形成系統的理解。長期下去,學生的學習和思考能力就會出現停滯,從而影響了學生的學習和思考能力的提升,更別說實施個性化教學了。從以上兩方面來看,無論是對傳統的教學,還是對網上的教學,都需要對課程知識點的相互關系進行分析。知識圖譜可視化技術展示了各知識點的分布狀態及其相互關系。這樣就可以幫助學生對相關知識點進行系統的理解,幫助他們建立起知識的聯系。另外,在互聯網教學中,將會為個性化的推薦學習提供極大的幫助,因此,建立一個教育領域的知識圖譜是非常有必要的。
維基百科清晰地指出了知識圖譜的內涵,也就是Google用于強化其搜索引擎的知識庫[1]。谷歌公司使用它是因為它可以讓谷歌搜索引擎的相關功能得到拓展和提升,讓用戶擁有更好的體驗感。谷歌的知識圖譜最早是在2012推出的,它以freebase網站的服務為基礎,捕獲與應用維基百科以及類似的更多數據發源地的數據,最后創造出了知識圖譜。兩年過后,谷歌公司對知識圖譜下了定義,之后將知識圖譜的功能融合到了搜索引擎中,提高了谷歌搜索引擎的搜索能力,有助于用戶更精準、更迅速地獲取自己需求的知識和資訊。其他搜索引擎公司也邁進了知識圖譜的探索領域[2],就像facebook研發出了facebook社會圖表知識圖譜,而我們國家的Baidu公司也研發出自己的知心知識圖譜,還有Sogou公司的知立方知識圖譜等。經過不斷的探索和開發,它慢慢地被擴展到了其他行業,就像在AI問答、個性化傳播等智能信息的運用,知識圖譜形成的學術價值以及商業價值巨大[3]。
近年來,學術界和工業界都建立了自己的知識圖譜,根據應用可以將其分為兩個主要類別[4]:一種是通用知識圖譜,也稱為開放領域知識圖譜。通俗地講就是大眾版,其沒有特別深的行業知識及專業內容,通常解決科普知識和常識性問題,適合互聯網的大規模搜索、問答以及推薦。還有一種就是行業知識圖譜,也被稱作特定領域知識圖譜以及垂直領域知識圖譜。簡單來說,其指的是專業版,經過深層次調研某個領域或子領域并編制相應的版本,應對專業問題,是目前知識圖譜更具價值的研究方向[5]。
就目前的研究現狀來看,國內外在構建通用知識圖譜方面獲取了一定的成效,比如,從國外的通用知識圖譜角度出發,由Cyc公司1984年開始創建推出的常識知識庫,其規模最大,經典的常識知識有“Every tree is a plant”“Plants die eventually”等;另外還有:Princeton 大學知識科學實驗室自20世紀80年代研發的應用在語句消除分歧方面的WordNet詞典知識庫(主要用于詞義消歧)、2010年被谷歌公司收購的MateWeb公司開發的Freebase知識圖庫(完全免費并允許商業化的開放許可協議)、被維基媒體基金會倡導能夠自己制作編寫的包含很多國家語種的百科知識庫Wikidata知識圖譜(目標是構件全世界最大的免費知識庫,但是仍然面臨知識缺失嚴重的問題)以及如今國際上包含領域最多的各種語種百科同義詞典BabelNet知識圖譜等[6]。而在中國,就知識圖譜的開發而言,也取得了一定的成效:Baidu公司研發出了大規模知識圖譜;Sogou公司制造出了知立方圖譜;清華大學得到了XLore知識圖譜;復旦大學研發了CN-DBpedia知識圖譜(中文通用百科知識圖譜),信息的搜集主要源于中文百科類網站的文本資訊,經過過濾、融合和推斷后,形成高質量的結構化數據,供人和機器使用;上海交通大學推出的利用百度百科、互動百科和維基百科等三個知識庫做成類似于DBpedia的中文百科Zhishi.me,是國內構建的最早的知識庫[7]。
相對于國內外在通用知識圖譜上取得的成效,我國在知識圖譜領域缺少專業數據,獲取的成效存在一定的缺陷[8]。現如今研發的知識圖譜中,相對成熟的領域十分稀少,僅有歐洲聯盟的重要合作研究項目藥物領域的知識圖譜Open PHACTS、醫療領域的知識圖譜體重指數的Watson機器人。根據《2018知識圖譜發展報告》,我國在電商、企業商業、圖情、創投四個領域均在開展知識建模[9]。
總的來說,盡管目前知識圖譜研究方面可謂是碩果累累,而且許多科研發現都轉化成了商業利潤,例如語義檢索、智能問答、語境分析、還有智能知識體系等。然而,研究知識圖譜及其使用價值依然很有意義。①中文句子的識別、中文關系抽取較英文語法復雜很多,在中文知識圖譜的研究和應用方面仍有很大的發展空間。并且目前互聯網高速發展,人工智能不斷向深研究,也從側面驗證了中文知識圖譜的商業應用價值以及學術研究價值相對較高[10]。②對比通用知識圖譜,成熟的領域知識圖譜需要更為專業的、深入行業的人員來建立,而且領域知識圖譜覆蓋的行業相對寬泛,其調研價值相對較高。簡單來說,從中文角度出發,選取某一領域,比如在這篇文章中的課程構建知識圖譜,建立領域知識圖譜具有很大的研究價值和發展前景[11]。
知識圖譜具有強大的語義處理能力,能夠在互聯網的網頁上建立概念之間的連接關系,以最小的代價可以將互聯網上有價值的信息組織起來;知識圖譜還具有強大的開放互聯能力,能夠不斷地加入互聯網中新增的信息。憑借這些功能,知識圖譜在檢索和教育等領域將會有出色的表現。教育知識圖譜能夠將學科知識和教學資源借助標準化的、形式化的手段密切關聯在一起,進而完成在線教育資源的合理組織。
在大學教育時期,國內著名的課程在線學習平臺,如學堂在線、中國大學MOOC(幕課)、精品課程等,絕大多數是對優質課程視頻學習資源的描述,展示了不同課程的聯系、和知識相關的課程體系,而課程知識圖譜的稀缺導致學生在課程視頻學習結束以后,并未構建起完備的知識體系,學習成效并未達到預期目標。現如今,盡管大學課程和有關教材的版本豐富多彩,但課程知識圖譜的構建離不開各行業專業的交流與制造,其操作十分嚴苛、復雜,并且知識更新十分迅速,因此現如今大學課程缺少知識圖譜的構建。
當今,網絡信息資源數量在不斷遞增,傳統的知識組織結構十分分散,但用戶在知識服務方面的需要也在不斷遞增,因此兩者之間存在一定的矛盾。在知識圖譜技術出現以后,其與用戶的認知需求相互適應,對比傳統人工組織某學科領域發展的宏觀狀況,知識圖譜技術的效率相對較高,并且十分合理,所以知識圖譜的出現是社會發展的必然。
從教育領域角度出發,知識圖譜不僅能夠幫助學生從互聯網上獲取教學資源,作為自主學習的知識來源,還可以幫助學生快速分清知識點的主次關系以及它們之間的內在邏輯關系。因此,學生有效利用知識圖譜能夠提高學習效率,加深知識點的理解和記憶能力,從而讓學校打破傳統的教育模式,實現個性化教育。
隨著互聯網技術和人工智能技術的飛速發展,智能教學在教師的教學和學生的自主學習方面也有了很大的突破。課程的知識圖譜是智能教學方式的一種體現,構建知識圖譜和應用涉及自然語言處理相關的基礎技術,因此構建教育領域的知識圖譜不單單是教育行業鉆研的焦點,也是人工智能層面的研究熱點,具有實際應用價值和科研價值。
知識圖譜是結構化的語義網絡,能夠描述生活中的概念和概念之間的關系。知識圖譜的構建步驟涉及四點,分別是知識獲取、知識表述、知識存儲以及知識可視化。知識獲取是從一些公開的結構化、半結構化和非結構化的數據中利用知識抽取技術獲得實體、屬性和關系等知識要素,再次結合知識交融以及知識推斷等技術構建語義知識庫,確保其結構化。知識抽取主要有兩部分,一部分是實體抽取,也就是從選取的數據源中選取實體組織類別劃分,同時把文章中的實體和知識庫中的實體構建密切聯系;另一部分是關系抽取,也就是數據源中的非結構化信息,開展的是不同實體關系的抽取,最終獲取各個實體的語義關系。從數據結構課程的知識圖譜角度出發,知識圖譜需求的理論主要源于專業書籍,相關技術網站以及部分專業知識庫。
教育信息化導致共享信息資源的迅猛遞增,但是學習資源的形式豐富多彩,導致學習過程中出現了知識不連貫以及知識碎片化等情形。在各種資源中,學生需要耗用龐大的精力去查詢無效內容,導致學生不能迅速、準確、高效地搜集自己需求的理論,造成學生陷入了知識誤區。
數據結構在計算機學科中屬于專業學科,帶有綜合性的特點,也是編寫計算機程序過程中的關鍵理論基石和技術手段。課程的原理十分復雜,涉及的知識點較多,學生很難梳理不同知識點的聯系。在學習知識過程中,需要了解知識的排列順序。只有了解了學習過程中的所有知識點,才可以有效地把控某一領域的有關理論。課程知識圖譜實際上是精準地提取課程中的教材內容,借助圖片等形式促使學科知識可視化,對學生構建清楚的課程知識體系有積極意義,同時還有助于提升知識學習的趣味性。
將數據結構教材、大綱、網絡資源等作為參考依據,通過使用Python網絡爬蟲技術搜集并整合和課程有關的知識數據,運用知識圖譜構建技術把獲取到的數據轉變為“實體-關系-實體”三元組,利用圖數據庫加以保存,設計有關算法和流程來處理數據語料庫,獲取并調整和數據結構學科領域有關的內涵和關聯。
知識圖譜對學生學習效率的提升有積極意義,運用網頁信息創建學科知識圖譜,公開學科知識體系,探究學科領域知識圖譜的切入點十分關鍵。而構建數據結構課程知識圖譜的創新點是運用人工智能技術來展示知識點的內容以及知識結構,指引學習者更好地認識并探究課程內容,促使學生在線學習的品質以及效率不斷提升;借助層次遞進形式展示知識圖譜,調整可視化頁面,促使學習者可以清楚地、方便快捷地了解知識圖譜。
隨著“互聯網+”教育的到來,各種學習平臺、教學課程資源日益豐富,為學生的學習帶來了極大的方便,使他們能夠從課堂上獲得更多知識。在廣度上,知識的學習得到了持續擴展。然而,海量的學習資源也使學習者不堪重負,而大量的知識碎片又使學習者很難掌握所學的內容。如果沒有正確的組織方式,就不能系統地了解所學的知識,而且還會浪費很多寶貴的時間。這會對學生的學習效果產生一定的影響。在數據結構基礎上構建知識圖譜則有助于應對上述難題,也就是說:知識圖譜能將多個知識點結合起來,并能反映出知識點的結構和分布。