999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于多通道卷積神經網絡的非結構化數據標注

2021-11-17 08:37:16米啟超趙紅梅林麗萍
計算機仿真 2021年6期
關鍵詞:實驗方法

米啟超,趙紅梅,林麗萍

(1. 河南城建學院電氣與控制工程學院,河南 平頂 467036;2. 西安交通大學化工學院,山西 西安 710049)

1 引言

早期的數據標注工作中,所標注的數據通常由相關領域內的專家,或使用計算機進行標注。雖然可以保證標注質量,但往往效率低下,延誤研究,同時成本較高[1-2]。眾包模式下,大任務較為復雜,通過拆分成小任務的方式降低復雜度,依據互聯網接口,網絡用戶得以使用,通過零散時間即可完成小任務,獲取報酬。眾包模式可以充分體現群眾智慧,潛能巨大,具有較為重要的商業價值,利用群體智慧,解決社會資源冗余問題。

基于此原因,提出了眾包標注方法,該方法通過較高的任務開放性,提高了標注速度,并降低了成本[3-5]。但該方法標注質量較低,需要依賴算法和函數來添加眾表標注的標簽,來改善標注數據的質量,需要確定標注中的任務函數,并建立相關模型。早期研究者采用EM算法,對標注者進行混淆矩陣計算,后續又采取了RY真值推斷算法,并利用其中的敏感性參數來提高標注任務函數的準確度[6-8]。但該方法無法具體的體現出標注者的差異性,獲取的標注函數可靠性不高。而考慮到標注者的特性和差異性問題,運用多通道卷積神經網絡技術,可以對其進行深入的運算,具有較高的研究前景。

2 基于多通道卷積神經網絡的非結構化數據標注方法設計

2.1 非結構化數據查詢處理

在進行標注之前,需要對所需標注的數據進行確認查詢處理,確定與被標注數據的關聯數據,避免出現漏標或錯標[9-10]。在進行非結構化的數據查詢處理中,采用Hive分布式查詢框架進行數據查詢處理。框架結構如圖1所示。

圖1 Hive查詢框架結構示意圖

如圖1所示,圖一中Driver模塊對非結構化數據進行編譯,并優化其中的執行語句。而Compiler模塊由Driver模塊進行控制和調用,并將獲取到執行語句轉為MapReduce執行策略,轉換完成后傳輸回Driver模塊中。而Hadoop模塊作為策略的執行引擎,通過Dricver將從MapReduce策略數據導入至Hadoop中,并進行查詢。并設置Compiler將獲取到的數據轉換至一組一元操作符,并獲取到抽象語法樹,然后利用框架中的Semantic Analyzer對語法書中數據進行語法分析。同時利用相似性檢索技術進行查詢,通過給定的元素(在本文中,該元素為需要進行標注的數據),并尋找其中相似的元素,數據集設為A而查詢元素則設為s,相似性檢索即為

SS(A,s)={a|θs(a,b),a∈A}

(1)

其中,不同集合下的相似度計算則如下所示

(2)

其中SimJaccard(S,T)的結果代表集合S以及集合T的相似度,|S∩T|代表集合S與集合T之間的交集,|S∩T|則代表集合S與集合T之間的并集。通過對其中標注數據相似度的查詢,確定標注數據有關信息,利于開展進一步的標注。

2.2 眾包標注集

(3)

(4)

通過式(4)可以將標注任務形式化,但通過該方法后,標注時對標注者沒有體現出差異性,因此需要對其進行進一步的推算。

2.3 多通道卷積神經網絡差異性識別

利用多通道卷積神經網絡對其中的神經元結構帶入標注任務和標注者,并得出其中的最適應標注任務分配,同時給出不同標注者的差異性[11-12]。根據卷積神經網絡的結構,得到網絡輸出公式h,公式為

(5)

在式(5)中,xi代表神經元中的第i個輸入,wi代表在神經元中的第i個輸入權重,b代表偏置值,f代表神經元激活函數,h代表輸出公式。當其中的WTx的結果作為線性結果,同時其中的激活函數引入了WTx的結果映射。而在多通道的卷積神經元網絡中,假設其中網絡的輸入值為x,網絡中的權值矩陣為w以及偏置矩陣則為b,輸出為hw,b,在網絡進行反向傳播中,將網絡中的期望輸出值設為y(x)。所訓練的樣本個數為n,根據網絡反向傳播理論,在反向傳播中會出現損失函數,本文將損失函數設為E,則損失函數在神經網絡中的平方誤差為

(6)

而在網絡的訓練中,需要首先對其中的權重值w以及偏置值b進行初始化。而在訓練中,由于選取了反向傳播來帶入標注指示函數,并對神經網絡中的參數進行更新,而在該過程中,網絡呈梯度下降的過程,如下圖所示:

圖2 神經網絡中的梯度下降圖

根據在多通道卷積神經網絡的梯度下降理論,可以根據梯度下降方向得出的神經網絡的權重值w以及偏置值b,并更新得出的w以及b值。獲得的更新公式如下

(7)

(8)

2.4 任務標注模型

(9)

在(9)中αk系數代表標注值能力的系數,βi系數代表標注任務的難度,而當其中的βi參數為固定參數,而αk數值越大則反映標注者的標注能力越好。而當αk數值為0時,說明該任務里,標注者的正確標注概率僅為50%。而通過將雙標簽任務擴展到多標簽任務標注中時,首先假設一共存在J種標注類型,并建立標注集合C={cj|j=1,2,3,…,J}來表示,而當標注目標i的標注真值為m時,則該標注者k的標注正確率為

(10)

(11)

在式(11)中,存在的隱變量T的和對數,運用Q函數,而在累加形式下,表示出期望狀態,代表了完全數據下的標注似然函數InP(V,T|θ),而其中的觀測數據V在對估計參數θn下的為觀測數據T的后驗概率分布P(T|V,θn)的期望值

(12)

由此得出在(12)中,算法的迭代過程等價與Q(θ,θn)函數。借由此得出標注函數的解值,根據解值,確定標注模型參數,依據標注模型完成數據標注方法設計。

3 實驗論證分析

為了測試本文設計的非結構化數據標注方法的有效性,本文選取了Airfares、Music、Hotel以及Books等4個領域中的非結構化數據,共160個WDB數據集,進行標注統計分析。并與文獻[1]、文獻[2]中的標注方法進行對比實驗。

表1 硬件配置表

3.1 實驗標注數據

由于目前對非結構化數據標注方法缺乏相關的測試標注設計,因此本文數據資源通過搜索引擎下載獲得,實驗中使用的數據集情況如下表2所示。

表2 實驗測試數據集

為了減低實驗困難程度,閾值標注通過專家給定,黃金標簽個數為1000個,經過深度學習進行標簽預處理操作,標注對象個數為11270個,實驗共收集10名標注者信息,判斷修改標簽域與標簽值。

3.2 實驗評價標準

在進行數據標注中,標注的基準值是通過手工方式得出的數據標注結果,并計算其中的標注正確率、召回率以及F-measure數值來進行評價。

而標注正確率代表正確標注的數據塊個數以及經過查詢得出的數據個數比值召回率代表在標注時得到的正確標注數據個數和查詢得到數據塊個數比值。而F-measure則代表標準的數據標注能力評判值,數值越接近100%,代表性能越優秀。本文實驗將運用上述中的三種指標進行實驗結果評價。

3.3 實驗結果

在運用數據標注方法實驗中使用的數據集分別進行數據標注后,對獲得的標注結果進行評價。獲得的標注結果如表3所示。

表3 標注方法間的性能比較表

依據表3中的數據中可以發現,本文設計的數據標注方法在標注的正確率、召回率以及F-measure上均高于其它標注方法。證明本文設計的數據標注方法存在較高的可行性。

為直觀判斷標注效果,在對象標注界面中,包括了標注者當前任務完成情況,當前可選擇標注的標簽,以及待標注的圖片,標注者只需先選中標簽,就可以在圖片中快速框選對象,并為對象打上此標簽。 對象判斷任務中,用戶可以判斷此標簽是否包含有效的對象。

圖3 標注對象圖

邊框調整模塊可以對標簽范圍框進行調整,將內邊距較大的標注范圍框調整為緊貼標注對象,提高標注質量。

圖4展示了標注者的標注點分布,以及通過 原始聚類和本文卷積神經網絡的聚類效果對比。

圖4 聚類算法效果圖

由上圖可以看出,本文方法聚類效果較好,標注對象選中密度較大,傳統方法的標簽域范圍較大。主要原因在于本文方法建立Hive分布式查詢框架,對其中與標注目標相關的數據進行相似性查找,同時建立眾包標注集,確定相關標注概念。對標注集中的標注差異性,利用多通道卷積神經網絡對其差異性進行確認,提高了標注準去率。

4 結束語

在本文中,利用多通道卷積神經網絡技術,對標注者的差異性進行了深入挖掘,獲得了標注任務函數,并根據函數建立了任務標注模型,得出了非結構化的數據標注方法,該方法下標注質量較高性能較好。但本文研究中,只考慮了對標注者給出的任務標簽數據的情況,而在實際中,往往會提供額外的特征信息條件。因此后續的研究中,將會研究與額外的數據標注信息進行結合,進一步改善數據標注質量。

猜你喜歡
實驗方法
記一次有趣的實驗
微型實驗里看“燃燒”
做個怪怪長實驗
學習方法
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 国产综合另类小说色区色噜噜| 中文字幕在线观| 国产日韩欧美视频| 四虎影视无码永久免费观看| 国产69囗曝护士吞精在线视频| 在线无码九区| 亚洲天堂视频网| 国产精品亚洲一区二区三区z| 国产无码制服丝袜| 国产欧美在线观看一区| 欧美在线精品怡红院| 伊人久久久久久久| 亚洲无线一二三四区男男| 日韩在线观看网站| 波多野结衣国产精品| 69av在线| 日韩中文精品亚洲第三区| 91精品国产自产在线观看| 99精品视频播放| 亚洲大尺码专区影院| 国产99热| 欧美三级日韩三级| 久久国产精品无码hdav| 青青青视频免费一区二区| 秋霞国产在线| 亚洲无码高清免费视频亚洲 | 国产日韩欧美在线播放| a欧美在线| www.精品视频| AV片亚洲国产男人的天堂| 精品无码人妻一区二区| 亚洲乱码在线视频| 中文字幕2区| 亚洲天堂网视频| 亚洲av无码久久无遮挡| 国产一区二区人大臿蕉香蕉| 国产va在线| 91久久精品国产| 99久久国产自偷自偷免费一区| 久久人与动人物A级毛片| 在线观看视频99| 欧美一级特黄aaaaaa在线看片| 精品亚洲国产成人AV| 一本一本大道香蕉久在线播放| 亚洲日韩在线满18点击进入| 久草网视频在线| 久久免费成人| 在线日韩日本国产亚洲| 午夜少妇精品视频小电影| 福利一区在线| 久久人人妻人人爽人人卡片av| 精品视频一区在线观看| 99热这里只有精品国产99| 亚洲日韩欧美在线观看| www.91在线播放| 毛片在线区| 日韩欧美高清视频| 全裸无码专区| 亚洲黄色视频在线观看一区| 一级毛片视频免费| 夜色爽爽影院18禁妓女影院| 在线国产毛片| a亚洲天堂| 91精品啪在线观看国产60岁| 欧美精品综合视频一区二区| 午夜视频免费一区二区在线看| 国产91无码福利在线| 国产三级国产精品国产普男人 | 亚洲日本在线免费观看| 国产视频大全| 国产欧美日本在线观看| 91在线播放国产| 2020亚洲精品无码| 好吊妞欧美视频免费| 福利姬国产精品一区在线| 91在线无码精品秘九色APP| 亚洲乱伦视频| av大片在线无码免费| 欧美国产成人在线| 国产不卡在线看| 国产日韩精品一区在线不卡| 亚洲人成网站观看在线观看|