999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

在線課程評論的情感傾向識別與話題挖掘技術

2018-03-22 01:31:40楊麗
電子技術與軟件工程 2018年1期

伴隨信息技術的快速發展,為各行業領域注入新鮮的活力。以教育領域為例,較多互動學習平臺逐漸被引入其中,特別其中包含的學習者評論數據,均可為教學質量改善、用戶選課以及平臺支持提供參考,然而現有的平臺運行中并未充分利用這些反饋信息,需行之有效的完善策略。本次研究將對情感傾向識別與話題挖掘技術做簡單介紹,在此基礎上提出在線課程評論樣本處理與特征提取方法、情感傾向識別算法以及在線課程評論話題挖掘技術等。

【關鍵詞】在線課程評論 情感傾向識別 話題挖掘技術

信息化時代背景下,學習資源共享、平臺共享已成為大多學習者青睞的主要內容,也因此有較多學習行為數據生成,如何對這些數據充分利用成為當前需考慮的主要問題。值得注意的是,當前許多數據提取、教學系統設計并不能滿足數據挖掘需求,更無從談及利用所獲取的數據為教學實踐進行指導,要求引入有效的數據提取、情感傾向識別以及話題挖掘技術。因此,本本文對在線課程評論的情感傾向識別與話題挖掘技術研究,具有十分重要的意義。

1 情感傾向識別與話題挖掘技術介紹

關于情感傾向識別、話題挖掘技術的概念,首先可從教育大數據進行分析,近年來在線學習中較多學習平臺逐漸引入,使海量未結構化數據生成,這些數據區別于傳統結構化數據如考勤記錄、考試成績等,有數據動態變化、數據規模化以及類型多樣化等特點,而滿足這些特征的在線學習數據均推動教育大數據的形成。而在此基礎上提出的情感傾向識別,Web2.0時代下,大眾在瀏覽事物信息中,更注重對以往相關評論內容關注,或將自身的想法、意見與心情表達出來。大數據環境下,便強調數據挖掘中能夠對大眾的平均內容做情感分析,該過程被稱之為情感傾向識別。另外,在話題挖掘技術方面,由于很多情感傾向信息并非針對一個整體評論對象,而是對其中某一部分的傾向表現,而這些部分便可被叫做話題。實際進行海量文本瀏覽中,便要求引入話題自動提取技術,保證信息檢索與處理效率,以此達到話題挖掘的目的。

2 在線課程評論樣本處理與特征提取

2.1 在線課程評論數據樣本處理

本次研究中,主要針對在線課程學習網站中的點評區分析,具體做樣本數據出去中,相關的要求主要包括:

(1)對點評區網頁結構信息充分了解,這些存儲于后臺數據庫內的半結構化形式文本數據,向用戶展示中,將通過HTML頁面以相應的格式顯示,因網頁引入的通訊技術有一定差異,所以在采集數據中有多種方式,如利用HTML表單形式,或借助HTML結構樹抽取;

(2)為使服務器訪問壓力、系統資源減少,一般設計中也考慮引入加載方式,以JavaScript為例,通過腳本動態導入數據。實際做數據采集中,可設定相應的方案流程,整個流程強調首先對JS腳本內有無提取信息判斷,若加載過程需借助JS動態實現,取中間代理方法,對JavaScript Object Notation頁面探測,進行格式解吸,然后將評論數據相關信息提取出來并存儲。假若加載方式選擇HTML靜態加載,轉換的目標體現在文本對象模型DOM上,在此基礎上做定位解析,將其中信息提取出來并存儲在數據庫內。

2.2 特征提取

所謂文本特征,主要指被識別對象的特征,具體進行文本情感識別中,通常也需由這些特征著手。值得注意的是,在評論信息中,不同學習者在表達細致程度上有一定差異,其直接導致課程評論文本長度不同,部分評論中有豐富的文字內容,傳遞的信息較多,而部分評論僅有幾個字,其意味文本特征分布有稀疏性、不均衡性特點。對此,實際進行文本特征提取中,本次研究考慮引入細粒度特征生成法,如N-gram語言模型,所有文本內容,均以字符單元形式呈現,有長度為N的字符片段序列形成,其中各片段均被叫做gram。同時,既往研究資料中,也對稀疏文本特征提取問題提出較多優化方式,如多空間微粒群優化,這一方式側重于取訓練集,細化為不同交叉訓練子集,通過檢驗各子集,提取其中的特征信息,達到文本特征提取目標。

3 在線課程評論情感傾向識別算法研究

情感傾向識別的實現,主要強調通過對在線課程評論的分析,了解情感傾向。本次研究中,考慮引入自適應多視圖選擇方法,其亦被稱之為AMVS,識別中采用半監督情感識別方法,其區別于傳統RSS方法,更注重做情感強度的計算,能夠優先選取鑒別型高的特征。需注意該方法應用下,選擇視圖中,要求結合特征維度、訓練精度兩者關系,進行維度分布的構建,保證各視圖維度均較為合適,這樣僅需保證特征采樣覆蓋率適宜,便可進行視圖生成量的確定。盡管該算法應用下無需考慮視圖劃分、視圖維度等影響因素,且自適應性強,但在無標記樣本規模影響下,識別精度可能無法保證。

4 在線課程評論話題挖掘技術分析

情感識別的基礎上,便要求做話題挖掘。本文在研究中對于評論話題挖掘方法的選擇,主要結合既往研究成果,如話題情感模型的構建,DEI-TM,這一模型強調對情感表達尋找相應的話題,融入以往LDA模型話題挖掘機制,即通過語句間關聯信息的利用,過濾出正面、負面情感樣本,以分而治之理論為指導,實現不同情感類別話題信息的提取。實踐研究發現,DEI-TM模型運用下,提取后的話題無較高相似度,在泛化能力上較強,可充分展示話題內單詞,極大程度上提高話題挖掘效果。

5 結論

情感傾向識別及其話題挖掘是當前在線課程評論數據被充分利用的關鍵性保證。實際識別評論信息情感信息、挖掘話題內容過程中,應充分認識其基本內涵,選擇針對性的技術方式,如多視圖半監督學習文本情感識別、DEI-TM模型等,確保將這些技術具體用于評論信息數據挖掘與分析中,以此保證評論數據能夠用于實踐指導中。

參考文獻

[1]張耀之.網絡輿情語義識別的技術分析及識別流程構建[D].吉林大學,2016.

[2]劉智.課程評論的情感傾向識別與話題挖掘技術研究[D].華中師范大學,2014.

[3]鄧鐳.面向微博新媒體的公共事件及其社會輿論分析技術研究[D].國防科學技術大學,2013.

作者簡介

楊麗(1985-),女,山西省潞城市人。博士學歷。講師。研究情感分析方向,大數據、智能方法等。

作者單位

湖北大學 湖北省武漢市 430062

主站蜘蛛池模板: 亚洲欧美国产高清va在线播放| 国产啪在线91| 99精品久久精品| 亚洲成aⅴ人片在线影院八| 国模极品一区二区三区| 中文字幕欧美成人免费| 欧美中日韩在线| 国产日本一线在线观看免费| 激情六月丁香婷婷| 在线观看免费国产| 国产00高中生在线播放| 亚洲精品777| 欧美一级在线| 免费A∨中文乱码专区| 国产熟女一级毛片| 成人精品在线观看| 久久免费成人| 国产亚洲男人的天堂在线观看| 凹凸精品免费精品视频| 久久精品国产999大香线焦| 国产原创演绎剧情有字幕的| 欧美日韩va| 国产91成人| 中国毛片网| 亚洲人成在线免费观看| 在线国产你懂的| 91蜜芽尤物福利在线观看| 亚洲无码高清一区二区| 国产理论精品| 人人爱天天做夜夜爽| 永久免费无码成人网站| 亚洲综合色婷婷中文字幕| 亚洲人成人无码www| 欧美成人区| 精品国产成人三级在线观看| 午夜国产在线观看| 日韩精品免费一线在线观看| 东京热一区二区三区无码视频| 91免费观看视频| 色135综合网| 色婷婷天天综合在线| 亚洲精品福利网站| 成人中文字幕在线| 在线观看无码av免费不卡网站| 男女男免费视频网站国产| 亚洲成AV人手机在线观看网站| 国产日韩欧美一区二区三区在线| 欧美激情成人网| 专干老肥熟女视频网站| 91精品国产自产在线老师啪l| 五月丁香在线视频| 青青草久久伊人| 三区在线视频| 亚洲天堂网在线视频| 99国产在线视频| 精品国产乱码久久久久久一区二区| 毛片a级毛片免费观看免下载| 色综合天天娱乐综合网| 亚洲黄色片免费看| 午夜啪啪网| 国产91av在线| 亚洲欧美精品一中文字幕| 91精品国产一区自在线拍| 拍国产真实乱人偷精品| 国产老女人精品免费视频| 91人妻日韩人妻无码专区精品| 日韩少妇激情一区二区| 国产青青草视频| 亚洲综合色婷婷| 青青网在线国产| 亚洲综合色婷婷| 国产人人乐人人爱| 26uuu国产精品视频| 国产永久免费视频m3u8| 成年人视频一区二区| 婷婷综合亚洲| 高清亚洲欧美在线看| 色综合天天综合中文网| 老司机久久精品视频| 鲁鲁鲁爽爽爽在线视频观看 | 国产小视频在线高清播放| 精品久久久久久久久久久|