999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于知識圖譜的智能答疑系統研究

2018-04-18 11:07:46陳志云錢冬明
計算機應用與軟件 2018年2期
關鍵詞:分類智能系統

陳志云 商 月 錢冬明

(華東師范大學 上海 200062)

0 引 言

隨著互聯網技術的發展,自然語言處理領域的深入,語義Web技術的不斷完善,答疑系統已經成為MOOC系統的研究熱點。目前廣泛應用的答疑系統一般通過Email、BBS或借助聊天工具等方式在線答疑,促進了師生之間的互動,學生的疑問得到反饋,教師的工作壓力得以減輕。但缺乏對以往問題答案的自動歸納總結和課程知識的智能表示,在自動答疑等智能化方面還有所欠缺。

智能答疑系統支持用戶以自然語言進行提問,語義分析后在知識數據庫中檢索出相關準確答案,因此,智能答疑系統可以不受時間、空間限制,直接為學生服務。

(1) 智能答疑系統研究發展現狀目前國際上研究比較成熟的答疑系統有美國著名搜索引擎AskJeeves,智能答疑系統AnswerBus,麻省理工學院開發的Start問答系統,美國芝加哥大學AI實驗室開發的FAQFinder系統[1],Google開發的智能語音助手服務Google Now等[2]。這些系統有強大的搜索引擎技術支持,資源檢索庫豐富,智能化程度較高。但是由于中文的語法語義、句子結構等語言特點和英文大不相同,因此國外的研究成果往往難以運用到中文的答疑系統中。

近年來,國內也陸續出現一些中文智能答疑系統,它們結合了數據挖掘技術、卷積神經網絡、詞向量技術[3]、文本分類算法[4]等,利用Flex[5]、Lucene[3]等開源工具,使得知識庫中的知識量不斷擴大,答疑效率和準確度得到提高。比如哈爾濱工業大學開發的HIT相關自然語言處理工具[6]實現了分詞、語義標注、句法依賴、實體識別等功能。臺灣“國防大學”研發的中文問答系統CQAS從命名實體及其關系的處理入手,來搜尋和返回答案[2]。這些相對成熟的技術為中文問答系統的研發奠定了基礎。另外比較熱門的聊天機器人,如百度研發的小度機器人,實際上也是一個“Q&A”數據庫,其作用相當于答疑檢索,基于定義好的規則庫和知識庫針對輸入搜索回答,或者加上學習功能,在個人生活、公司客服、政府服務方面都有很好的應用。但是與國外的答疑系統相比,國內答疑系統的答疑呈現方式單一,智能性依然不夠。

(2) 智能答疑系統目前存在的問題一些在線答疑系統,如愛課程網的“中國大學MOOC”“學堂在線”、軍隊的“夢課平臺”等,這些平臺對于學生提出的問題,多采用BBS或者Email的答疑方式;另外如香港中文大學參考AskJeeves開發的中文提問式搜索引擎Weniwen、上海理工大學的遠程智能答疑系統、華南理工大學開發的智能答疑系統則采用關鍵字匹配技術,基本實現了智能答疑[7]。一般的智能答疑系統首先應該具備對用戶提問的語義理解能力,其次需要智能表示課程知識,在答疑方式上實現多樣化[8]。這些答疑系統具備高校師生問題交流的語義理解能力,但依然缺乏對以往問題答案的自動歸納總結和課程知識的智能表示。本文以華東師范大學的公共計算機課教學答疑系統作為研究實例,進行智能答疑系統的探索。

1 智能答疑系統的研究目的

華東師范大學公共計算機課的教學答疑系統已經運行有幾年了,每年都有幾千學生在使用,是集成了學校每學期課程答疑工作的網絡系統。系統要求實現的基本功能如下:學生對已有問題進行更新或提出新問題,教師和其他學生均可以選擇某課程查看所有問題,也可以根據關鍵字檢索某個問題,并進行回答討論,討論后根據回答情況,教師進行結題。同時系統為促使學生互動以及學生解答的積極性,還設置有提問扣除積分,解答賺取積分的任務制,積分由提問人自主設置,教師可根據積分考量學生的平時成績。

通過分析,可以發現現有的答疑系統在智能化實現上存在兩個主要方面的問題:

智能答疑方面:目前師生一般檢索課程后,只能根據問題時間或檢索關鍵字查看問題。按時間順序瀏覽問題會出現雜亂或者冗余的信息,檢索問題關鍵字容易出現描述不準確而檢索不到的情況,不能系統查看某課程某個知識點的所有相關問題。

知識點抓取方面:當學生查看某個問題的詳細解答時,需要翻看查找書本資料、隨堂筆記或相關教學課件,耗費時間和精力。學生在提問問題時,對問題關鍵字描述不準確容易導致無法檢索相關問題。同時,教師也無法通過學生的提問了解學生學習的情況。

針對以上教學答疑系統存在的問題,本文設計了以下解決方法:

(1) 針對智能答疑方面,運用知識圖譜顯示知識點樹,將問題關鍵字按照知識點樹中的知識點進行歸類,一層層展現與該課程某個知識點相匹配的全部提問。

(2) 針對知識抓取方面,本文將問題關鍵字與智能教學案例課件系統的課件進行分類匹配,在問題頁面添加指向相關課件的超鏈接,學生通過點擊超鏈接進入該問題相關知識點的演示課件頁面,便于對知識的查漏補缺,消化吸收。

2 智能答疑系統主要要素分析

2.1 知識圖譜

針對智能答疑方面的問題,借助知識圖譜可以實現Web從網頁鏈接向概念鏈接轉變[9],以知識點樹的形式向用戶反饋結構化的知識點及相關問題,方便用戶準確定位和深度獲取答疑知識。

2.1.1知識圖譜的概念

知識圖譜本質上是語義網絡,即一種基于圖的數據結構。最早谷歌用于增強其搜索引擎功能,隨業界發展,目前可以將其理解為顯示知識結構關系的可視化技術。

2.1.2知識圖譜的研究現狀

知識圖譜對語義識別技術要求較高,需要依賴大量用戶的行為數據庫,對社會化開源內容有很強的支撐需求,因此目前知識圖譜在搜索引擎中的應用更為普遍,像谷歌的Knowledge Graph、百度知心和搜狗知立方等。

現階段國外構建知識圖譜的方法較為成熟,國內對知識圖譜的研究手段和方法相對滯后。如尋徑網絡、自組織特征映射、力矢量布局算法、潛在語義算法、最小生成樹算法、三角測量等較為先進的映射技術在國外已有實驗報道,但在國內除尋徑網絡的方法外僅有簡單評介[10]。知識圖譜的應用工具也多為國外開發,數據格式與國內主要數據庫有所差別,因此很難應用在國內的中文知識圖譜研究上。目前國內的代表性研究成果主要有:清華大學的跨語言知識圖譜Xlore是國內第一個大規模雙語知識圖譜,上海交通大學構建了中文知識圖譜研究平臺zhishi.me[9],復旦大學GDM實驗室推出的中文知識圖譜展示平臺項目[11],中國科學院計算技術研究所基于OpenKN(開放知識網絡)建立了“人立方、事立方、知立方系統”,中國科學院數學與系統科學研究院陸汝鈐院士提出知件(Knowware)的概念[12]等。

2.2 文本分類算法

文本分類算法主要用來進行知識點與學生提問問題關鍵字的匹配,以及課件案例中抓取的關鍵字與問題關鍵字之間的匹配。

文本分類可以被稱之為機器學習領域的一種學習方法,也可以被稱之為數據挖掘領域的一種算法。目前常用的文本分類算法有樸素貝葉斯算法、支持向量機(SVM)、K最鄰近分類算法、決策樹算法等。其中支持向量機是建立在統計學習理論基礎上的一種小樣本機器學習方法,用于解決二分類問題[13],但在解決實際問題中遇到的多分類問題時并不適用。K最鄰近分類算法K值的確定目前沒有很好的方法,決策樹算法處理缺失數據比較困難[14],而樸素貝葉斯算法對缺失數據不太敏感,更適用于智能教學答疑系統學生漏填問題知識點導致的數據缺失情況,同時方法簡單、準確率高[15-16],在處理不確定性信息的智能化系統中被廣泛使用,本文選用樸素貝葉斯算法。

3 智能答疑系統的關鍵實現

3.1 知識圖譜在智能教學答疑系統的應用

在瀏覽學生問題時使用知識圖譜,可以從語義層面理解學生或教師的查找意圖,改進瀏覽問題質量,從而真正實現語義檢索。目前知識圖譜作為知識表示的最新方法,在智能答疑中的開發和應用還處在前沿發展階段。本文將知識圖譜技術應用到智能教學答疑平臺中,對知識點數據構建本體和推理,將其整合為計算機可以處理的結構化數據。知識圖譜知識點的可視化呈現,能夠清晰地展示知識點的覆蓋廣度和知識點相關問題之間的關系[17]。

智能教學答疑系統中知識圖譜構建過程如下:

(1) 知識圖譜的數據來源:一般數據來源于合作網站API和網站抓取,包括百科知識站點和垂直站點的結構化數據,以及半結構化數據和搜索日志挖掘[18]。本系統的知識圖譜目前針對教學課程,因此選用教學平臺中知識點庫的知識點數據。圖1為數據處理與管理學科知識圖譜。

圖1 數據處理與管理學科知識圖譜

(2) 知識圖譜的數據整合:即數據規范化的過程,主要指實體對齊和知識圖譜Schema的構建。實體對齊是指對于異構數據源知識庫中的各個實體,找出屬于現實世界中的同一實體。不同知識源的描述不同,一個統一的Schema也不容易得出[19]。由于本系統的知識庫相對單一,所以只需要構建本體即可。本體的形式化表示為:本體:{抽象概念(以及對應的實例)、關系和屬性}。三元組是比較常見的做法。對于“字處理軟件的子知識點是基本操作”,就可以轉化成為{字處理軟件, 子知識點, 基本操作}這樣一個結構,其中第一項和第三項是抽象概念的實例,第二項是兩者之間的關系[20]。

(3) 知識圖譜的挖掘:包括推理,實體重要性排序和相關實體挖掘。本文主要進行推理工作,即把知識點的字符串描述轉化成結構化的語義描述之后,進行低階推理。比如A是B的父知識點,B是C的父知識點,自動推理出A是C的父知識點。常用的推理算法包括基于邏輯推理和基于分布式表示方法的推理。

(4) 知識圖譜的更新和維護:目前知識圖譜的更新和維護一般由專業團隊操作,通過自動化算法在數據源中抽取新的類型信息,若能被長期保留則由專業人員進行決策和命名為新的類型,若不能保留則被刪除。還可以依賴用戶反饋來改善圖譜[21]。 在系統實際應用過程中,隨著教學大綱和課程結構的調整,知識圖譜的更新和維護是由教師來操作的。

3.2 樸素貝葉斯在智能教學答疑系統的應用

一般系統采取在頁面搜索框檢索關鍵字的方式,簡單查找包含指定關鍵字的問題。本文將樸素貝葉斯算法應用于智能教學答疑系統,進行知識點與學生提問問題關鍵字的匹配,以及課件案例中抓取的關鍵字與問題關鍵字之間的匹配。

樸素貝葉斯算法的基本思路是計算文本屬于類別的概率,對于給出的待分類項,求解在此項出現的條件下各個類別出現的概率,將此待分類項歸類于概率最大者。該算法在智能教學答疑系統的應用分為三個階段:

第一階段為準備階段。分類器的質量主要由特征屬性、特征屬性的劃分以及訓練樣本質量決定[22],所以該階段尤為重要。首先根據一部分待分類的問題關鍵字確定其特征屬性,對每個特征屬性進行人工劃分后,形成訓練樣本集合。

第二階段為訓練階段,即生成分類器。由經過預處理與特征提取后的特征詞集合計算每個特征詞的先驗概率和條件概率,構成分類器的參數。對每個特征詞的每個屬性構造頻率表,將頻率表(以天氣對高爾夫運動的影響為例,見表1)轉換為似然表(以天氣對高爾夫運動的影響為例,見表2),最后用樸素貝葉斯公式計算相應文本的后驗概率,后驗概率最高的類別即為該文本的類別[23]。

表1 不同天氣下高爾夫運動頻率表

表2 不同天氣下高爾夫運動似然表

這一階段根據貝葉斯定理公式由程序自動計算完成:

(1)

式(1)中:Xi為待分類文本,p(Cj)為在問題數據庫中隨機抽取一個問題,它的類別是Cj的概率[24]。

第三階段為應用階段。使用分類器對待分類項進行分類,最后得到待分類項與類別的映射關系。這一階段也由程序完成。

本文用樸素貝葉斯算法對提取到的問題關鍵字進行分類匹配,匹配到問題相關知識點或相關的案例課件,使教學專有領域的問題解答和問題查看更加清晰明確。

4 智能答疑系統的運行測試

智能教學答疑系統改進前學生問題頁面只可查看問題詳情及回復,改進后可跳轉到與該條提問相關的案例課件頁面,方便學生及時復習,溫故知新;改進前查看問題頁面僅按照時間順序顯示問題,查看起來雜亂沒有條理,如圖2所示。改進后查看問題頁面為知識點樹,點擊某知識點可查看全部相關問題,如圖3所示。

圖2 系統改進前查看問題頁面局部細節

圖3 系統改進后查看問題頁面局部細節

為了驗證系統的問題表示和分類效果,文中測試了智能教學答疑系統中“數據處理與管理”這門學科全部章節的問題表示和分類情況,測試期間四個專業學生共提出287條有效問題,具體測試結果如表3所示。

表3 學生提問問題的分類結果

5 結 語

本次研究以知識圖譜的形式將學生提問問題以課程知識點分類,并與教學案例課件匹配,方便師生查詢瀏覽問題,使教學答疑系統初步具備智能性。目前小規模實驗證明,改進后的智能答疑系統,有效提高了答疑的效率。當然,由于本系統的知識圖譜數據來源還比較單一,采用的樸素貝葉斯算法在語義模糊條件下分類效率也還不是太理想,使用的學生還不是很多,系統還有待于進一步實踐和完善。但是,上述實踐,已經證明了通過知識圖譜和利用樸素貝葉斯算法來進行分類這兩項技術,可以促使答疑系統實現智能化。

[1] 郭文儉.基于課程教學網站的智能答疑系統的設計與實現[D].長春:吉林大學,2015.

[2] 馮升.聊天機器人問答系統現狀與發展[J].機器人技術與應用,2016(4):34-36.

[3] 邢超.智能問答系統的設計與實現[D].北京:北京交通大學,2015.

[4] 楊敬妹.文本分類算法分析及其在智能答疑系統中的應用研究[D].石家莊:石家莊鐵道大學,2014.

[5] 薛凌鴻.基于Flex的多媒體智能答疑系統的設計與實現[D].北京:北京郵電大學,2012.

[6] 趙紅艷.基于語義知識的動詞隱喻識別與應用[D].南京:南京師范大學,2012.

[7] 李攀飛,敖永紅,葉昭暉,等.基于大規模在線學習平臺的智能答疑系統研究與設計——以"教育技術"MOOC為例[J].工業和信息化教育,2015(11):33-37.

[8] 劉漢興,林旭東,田緒紅.基于本體的自動答疑系統的研究與實現[J].計算機應用,2010,30(2):415-418.

[9] 劉嶠,李楊,段宏,等.知識圖譜構建技術綜述[J].計算機研究與發展,2016,53(3):582-600.

[10] 秦長江,侯漢清.知識圖譜——信息管理與知識管理的新領域[J].大學圖書館學報,2009,27(1):30-37.

[11] 程學旗,靳小龍,王元卓,等.大數據系統和分析技術綜述[J].軟件學報,2014(9):1889-1908.

[12] 潘明鋼,張楚才,鐘維.知件可插拔機制的設計與實現[J].計算機技術與發展,2015(5):91-94.

[13] 鄭勇濤,劉玉樹.支持向量機解決多分類問題研究[J].計算機工程與應用,2005,41(23):190-192.

[14] 鞏固,張虹.決策樹算法中屬性缺失值的研究[J].計算機應用與軟件,2008,25(9):242-244.

[15] Jiang L,Li C,Wang S,et al.Deep feature weighting for naive Bayes and its application to text classification[J].Engineering Applications of Artificial Intelligence,2016,52:26-39.

[16] Taheri S,Yearwood J,Mammadov M,et al.Attribute weighted naive Bayes classifier using a local optimization[J].Neural Computing and Applications,2014,24(5):995-1002.

[17] 陸星兒,曾嘉靈,章夢瑤,等.知識圖譜視角下的MOOC教學優化研究[J].中國遠程教育,2016(7):5-9.

[18] 柏玉.面向網絡數據的信息抽取研究與應用[D].成都:西南交通大學,2015.

[19] 胡芳槐.基于多種數據源的中文知識圖譜構建方法研究[D].上海:華東理工大學,2015.

[20] 王秋月,覃雄派,曹巍,等.擴展知識圖譜上的實體關系檢索[J].計算機應用,2016,36(4):985-991.

[21] 趙鑫.芻議搜索引擎中知識圖譜技術[J].遼寧行政學院學報,2014,16(10):150-151.

[22] 李湘東,曹環,黃莉.文本分類中訓練集相關數量指標的影響研究[J].計算機應用研究,2014,31(11):3324-3332.

[23] 姜利群.基于樸素貝葉斯分類的Java課程網絡答疑反饋系統[J].電腦知識與技術,2016,12(23):206-208.

[24] 姚宇,董本志,陳廣勝.一種改進的樸素貝葉斯不平衡數據集分類算法[J].黑龍江大學自然科學學報,2015,32(5):681-686.

猜你喜歡
分類智能系統
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
分類算一算
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
分類討論求坐標
智能前沿
文苑(2018年23期)2018-12-14 01:06:06
智能前沿
文苑(2018年19期)2018-11-09 01:30:14
智能前沿
文苑(2018年17期)2018-11-09 01:29:26
智能前沿
文苑(2018年21期)2018-11-09 01:22:32
數據分析中的分類討論
主站蜘蛛池模板: 久久伊人色| 欧美中文字幕在线二区| 免费一级毛片| 99精品国产高清一区二区| 亚洲,国产,日韩,综合一区| 亚洲日韩在线满18点击进入| 亚洲一区黄色| 色妞永久免费视频| 久热re国产手机在线观看| 在线精品自拍| 久久人人妻人人爽人人卡片av| 在线一级毛片| 久久青草精品一区二区三区| 精品福利视频导航| 欧美日韩午夜| 一区二区影院| 成年人国产网站| 国产免费羞羞视频| 国产综合无码一区二区色蜜蜜| www.亚洲一区| 日韩麻豆小视频| 全部毛片免费看| 国产高清无码麻豆精品| 2019国产在线| 亚洲av无码久久无遮挡| 美女无遮挡免费视频网站| 香蕉精品在线| 国产成人午夜福利免费无码r| 国产精品入口麻豆| 国产成人高清精品免费5388| 久草性视频| 91精品国产无线乱码在线| 精品久久久久成人码免费动漫| 99久久精品久久久久久婷婷| 欧美日韩国产综合视频在线观看| 91欧美亚洲国产五月天| 国产欧美综合在线观看第七页 | 中文字幕在线永久在线视频2020| 一本大道香蕉中文日本不卡高清二区| 激情无码字幕综合| 一级毛片免费高清视频| 91色综合综合热五月激情| 国产成人久视频免费| 有专无码视频| 中国成人在线视频| 亚洲清纯自偷自拍另类专区| 在线观看国产精品日本不卡网| 国产在线专区| 色综合天天视频在线观看| 丝袜国产一区| 国产女人18水真多毛片18精品 | 欧美三级自拍| 依依成人精品无v国产| 国产成年女人特黄特色大片免费| 99久视频| 色屁屁一区二区三区视频国产| 亚洲成人在线网| 米奇精品一区二区三区| 久久网综合| 国产AV毛片| 亚洲成a人片77777在线播放| 成人国产免费| 亚洲中文在线看视频一区| 亚洲永久免费网站| 精品一區二區久久久久久久網站| 片在线无码观看| 第九色区aⅴ天堂久久香| 国产免费好大好硬视频| 久久综合丝袜日本网| 欧美日韩福利| 福利姬国产精品一区在线| 真人免费一级毛片一区二区| 中文字幕永久视频| 欧美成人一级| a级毛片免费看| 亚洲色欲色欲www在线观看| 亚洲午夜天堂| 国产精品欧美激情| 国产第一页第二页| 极品国产一区二区三区| 中文字幕首页系列人妻| 狠狠做深爱婷婷久久一区|