999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基礎教育課程知識圖譜構建技術框架研究

2019-09-10 07:22:44朱曉悅杜雨雯王家若
南北橋 2019年18期

朱曉悅 杜雨雯 王家若

【摘? ? 要】基礎教育知識圖譜能體現出知識之間的聯系,以可視化方式向教師與學生反饋結構化知識,進行教學支架服務,輔助學生進行知識管理和教師教與學的設計。本文從基礎教育知識圖譜構建的框架出發,分實體抽取和實體關系抽取兩個角度研究知識圖譜構建的技術路徑,并生成高中數學必修二的知識圖譜。

【關鍵詞】知識圖譜? 實體抽取? 實體關系抽取? 基礎教育

中圖分類號:G4? ? ? 文獻標識碼:A DOI:10.3969/j.issn.1672-0407.2019.18.007

一、緒論

(一)研究背景與意義

在課堂教學過程中,教師通過圖像、視頻、互動軟件等多媒體教學載體的應用,教學知識的表達有了越來越多圖形化、生動化的展現方式。隨著大數據與機器學習的深入發展,通過數據挖掘的方式能夠發現更深層次的知識聯系。知識圖譜就是其中一種表達方式,知識圖譜是結構化的語義知識庫,用于以符號形式描述物理世界中的概念及其相互關系:實體間通過關系相互聯結,構成網狀的知識結構。

(二)國內研究現狀

知識圖譜的應用領域一般具有“新”或“熱”的特征,旨在通過對目標領域的分析把握其發展態勢。因此,統計并梳理知識圖譜應用領域的新關鍵詞,可以窺見我國各時間段的研究重點及整體趨勢。1.研究重點。從關鍵詞來看,我國知識圖譜應用較多的是對某學科和某主題進行知識圖譜分析。如學科知識圖譜:王琪等以1991-2009年間與“體育”相關的博士論文為數據,深入探討了科學知識圖譜在體育學科研究中的應用前景。如主題知識圖譜:王晴用CitespaceⅢ分析2015年以前的“慕課”研究相關文獻,發現當前我國“慕課”研究的熱點集中在技術支持、教學效果、教學活動、教學模式等問題。2.整體趨勢。時代化。通過觀察知識圖譜應用領域的相關關鍵詞發現,從“數據挖掘”到“云計算”再到“慕課”,知識圖譜的研究對象一直緊跟時代、與時俱進。通過研讀論文發現,目前中國在學科知識圖譜方面的研究還是比較缺乏的,而本項目的研究內容就關注于基礎教育學科的知識數據庫的建立,并通過知識圖譜建立一個知識框架,以作為一個學科標準對照。

二、知識圖譜構建技術框架

(一)實體抽取

實體抽取是圖譜構建中最關鍵的步驟,它是決定了圖譜質量的關鍵。簡單來說實體抽取就是從文本中抽取關鍵詞,實體抽取流程大致如圖2-1所示,將文本切分成獨立的詞,并對詞進行分析(本質是聚類分析),常見方法有機器學習分析、統計分析與語義分析,由于技術水平等限制,我們采用了統計分析方式。

1.分詞。分詞是將連續字符串切分成詞的過程,為避免漏詞,本項目使用ansj分詞工具中的最小顆粒度分詞再進行復合詞拼接,將文本中的內容切分成獨立的詞,并進行詞性標注。同時在分詞結果中進行詞性過濾,考慮到漢語語法,作為關鍵詞只保留動詞相關、名詞相關等詞性。2.復合詞拼接。需要將分割后的詞拼接,以達到較高的召回率,本項目采用基于統計的規則進行拼接,主要體現在兩點上:互信息與信息熵。這里簡單介紹:互信息體現兩個變量的相互依賴程度,常用定義如下:

其中X、Y表示相鄰詞語,該公式為相鄰詞出現的概率與作為單獨詞出現的概率之比的對數,數值越大則說明二者作為一個詞的概率較大信息熵主要是用詞語的左邊界熵和右邊界熵,用來判斷兩個詞出現的順序可能性。3.關鍵詞抽取。在得到候選復合詞之后,需要進行進一步處理得到關鍵詞。關鍵詞作為一篇文章中重要的詞,其特點是出現頻率高并且與其他文章相關度不高,綜合考慮下,本項目使用簡單的TF-IDF算法進行關鍵詞抽取,TF-IDF算法用以評估某詞對文檔集的重要程度。計算公式如:TF-IDF=TF*IDF

(二)實體關系抽取

在提取完實體后,需要進行實體間關系的抽取。本文中,分類關系和非分類關系是兩種主要的實體關系類型。分類關系中最典型的是上下位關系,它表明了上位詞和下位詞之間的層次關系,例如銳角與三角形。而非分類關系體現了實體之間的關聯性,實體間沒有層次之分,例如銳角與鈍角。在獲得實體間分類關系的過程中,我們利用字符串匹配法。即通過字符串匹配遍歷列表中的詞,提取概念之間的詞串包含關系,這種概念之間的分類關系是顯而易見的。在獲取實體間非分類關系的過程中,本項目采用了Apriori算法。通過計算支持度(support)、置信度(confidence)和提升度,找出數據中的頻繁項集,從而挖掘出數據間的關聯規則。

三、結果分析

按照上述流程,采用手動+自動結合的方式,以人教版高中數學必修一為例,提取教案、課本、教材等57個純文本文件作為語料,手動設置閾值,將最終得到的實體與實體關系通過網頁D3.js展現出如下圖所示結果:

由于是人工評測(實際應為由現有語料庫自動評測,但限于項目人工調整閾值等因素,采用專家評估),單就實體抽取來說結果如下:抽取詞共37個,實際應有實體98個,錯誤1個

P=97.3%? R=36.7%? F=53.2%

總的來看:我們過于追求準確而丟失了很多數據,導致F值有點低,且由于是人工調整閾值效率極低,需要改進方法。

參考文獻

[1]劉嶠等:《知識圖譜構建技術綜述》,《計算機研究與發展》2016年第三期.

[2]王琪,徐成立.知識圖譜視野下我國體育科學研究的發展路徑——基于1991~2009年體育學博士論文關鍵詞共詞網絡的可視化分析[J].體育學刊,2010,17(12):118-125.

主站蜘蛛池模板: 免费亚洲成人| 亚洲天堂免费| 中文无码精品A∨在线观看不卡| 亚洲欧美不卡视频| 久久综合丝袜日本网| 欧美日韩成人| 五月天久久婷婷| 九九热视频在线免费观看| 日韩在线视频网站| 精品国产乱码久久久久久一区二区| 全部免费毛片免费播放| 亚洲日韩AV无码一区二区三区人| 婷婷中文在线| 国产久草视频| 国产资源站| 亚洲欧美另类视频| 久久香蕉国产线| 国产福利小视频高清在线观看| 一本二本三本不卡无码| 欧美激情综合| 日本午夜三级| 91成人在线观看视频| 色综合婷婷| 久精品色妇丰满人妻| 91福利在线看| 亚洲美女一区二区三区| 国产SUV精品一区二区6| 91九色最新地址| 色天天综合| 欧美在线黄| 一级看片免费视频| 天堂成人av| 亚洲精品无码高潮喷水A| a国产精品| 日本道中文字幕久久一区| 亚洲成人77777| 国产91成人| 伊人AV天堂| 大陆精大陆国产国语精品1024 | 欧日韩在线不卡视频| 国产网站免费看| 亚洲AV成人一区二区三区AV| 国产福利拍拍拍| 国产超薄肉色丝袜网站| 国产资源免费观看| 日本国产在线| 毛片a级毛片免费观看免下载| 国产日本欧美在线观看| 97视频免费在线观看| 国产精品19p| 国产在线视频自拍| 久久毛片基地| 极品国产在线| 欧美亚洲欧美| 白丝美女办公室高潮喷水视频| 久久精品视频亚洲| 国产丝袜无码精品| 亚洲精品爱草草视频在线| 乱系列中文字幕在线视频| 67194在线午夜亚洲| 亚洲第一香蕉视频| 国产精品专区第一页在线观看| 亚洲精品视频免费观看| 国产网友愉拍精品| 亚洲综合色婷婷| 99伊人精品| 亚洲av色吊丝无码| 国产福利在线免费观看| 特级毛片免费视频| 亚洲一区二区三区国产精品| 无码一区二区波多野结衣播放搜索| 1级黄色毛片| 蜜芽国产尤物av尤物在线看| 国内精品免费| 99精品高清在线播放| 国产午夜精品一区二区三| 亚洲国产午夜精华无码福利| 在线播放真实国产乱子伦| 中文纯内无码H| 午夜不卡福利| 为你提供最新久久精品久久综合| 婷婷色婷婷|