999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于多模態(tài)融合的事件分類和分撥聯(lián)合模型

2023-08-26 08:37:58佘祥榮
電腦知識與技術 2023年20期

佘祥榮

關鍵詞: 事件分類; 事件分撥; 圖卷積網絡; RoBERTa; 多模態(tài)融合

中圖分類號:TP391 文獻標識碼:A

文章編號:1009-3044(2023)20-0028-03

0 引言

政務服務熱線是指各地市人民政府設立的由電話12345、市長信箱、手機短信、手機客戶端、微博、微信等方式組成的專門受理熱線事項的公共服務平臺,是政府聯(lián)通公眾的重要渠道。通過政務服務熱線,政府可以及時了解民生問題,為民排憂解難,從而有效化解社會矛盾[1]。政務服務熱線的事件分撥過程主要還依賴于人工處理,但熱線話務員常常無法深入了解每個部門的權力與職責,同時每天數以萬計的政務熱線事件需要被分配,人工處理的方式難以快速高效地完成事件分撥。因此,研究一種能夠準確確定事件類型并對事件進行相應責任部門的自動分撥方法具有非常重要的意義。

利用自然語言處理技術理解政務熱線事件得到事件的表征信息是完成事件分類和分撥的核心,傳統(tǒng)的word2vec[2]、GloVe[3]等詞表形式的詞嵌入方法,僅能考慮文本自身的信息,難以處理文本在不同環(huán)境下存在一詞多義的情況。CNN[4]或RNN[5]等模型由于其自身結構原因對文本信息的提取存在局限性,而基于大規(guī)模文本數據訓練的語言模型(BERT[6], XLNet[7], Ro?BERTa[8]等)可以有效解決這類問題。但語言模型對文本的輸入長度有一定的限制,在處理長文本事件時會截斷事件文本,從而導致丟失文本信息的問題,而構建整個文本的圖結構并應用GCN[9]來提取文本的圖結構信息的方式可以有效解決文本過長的問題。注意力(Attention)機制[10]可以有效地對齊不同模態(tài)的事件信息,以提升事件分類的準確性。此外,將結合“三定”職責“( 三定”包含了機構規(guī)格、主要職責、內設機構及其具體職責、人員編制和領導職數等方面內容)的事件多模態(tài)信息進行融合,可以為事件分撥提供先驗知識,以提高事件分撥的準確性。基于此,本文提出了一種基于多模態(tài)融合的事件分撥和分類聯(lián)合模型方法,可以通過圖計算和語言模型有效解決事件文本長短不一、要素不清的問題,并采用多模態(tài)融合的方式完成事件文本分類和事件分撥任務。

1 模型結構

本文提出了一種針對政府熱線的事件分類與分撥的聯(lián)合學習模型,該模型包括三個部分:基于GCN 和RoBERTa的事件分類模塊、基于軟投票的“三定”融合預測模塊和重排序模塊,模型整體結構如圖1所示。

1.1 事件分類

基于圖結構特征和文本特征融合的事件分類主要包括圖構建、基于GCN 的圖特征提取、基于Ro?BERTa的上下文特征提取和基于特征融合的事件分類四個部分。

1.1.1 圖構建

由于事件文本存在長短不一的問題,并且事件文本中的某些句子與事件本身的主題不相關。因此,本文采用事件文本的命名實體和關鍵詞作為事件的主題。由于命名實體識別和關鍵詞提取不是本文的重點,所以本文采用現(xiàn)有工具包來進行命名實體識別和關鍵詞提取。具體圖構建過程如下:

1) 對于給定的事件文本D,首先進行分句處理并對事件文本進行分詞和命名實體識別,同時應用Tex?tRank等關鍵詞提取算法獲得額外的關鍵詞,以得到每個句子的節(jié)點詞集合{A};

2) 對于事件的節(jié)點詞集合{A}中的元素i 和j,如果i、j 出現(xiàn)在同一個句子中,則它們之間存在關系,在它們之間添加一條邊;反之,元素i 和j 之間則不存在關系;

3) 將節(jié)點詞集合{A}中的相同詞進行合并,以完成事件文本的關系圖構建。

1.4 重排序模塊

對于一個給定的熱線事件,將所有的“三定”均與該事件進行匹配并送入模型中,最終得到一個預測概率列表。由于一個部門包含多個“三定”職責,因此需要根據預測概率列表對分撥部門的匹配概率結果進行重新排序,以獲取最優(yōu)的分撥部門。具體過程為:

1) 對每個部門對應的“三定”職責預測概率進行累加,并計算各部門概率均值作為該部門的預測概率。

2) 根據概率結果對所有部門進行排序,選取Top-1部門作為最終分撥部門。

2 實驗

2.1 數據集

本文數據集是基于蕪湖市政務服務熱線的真實事件分配案例構建得到,包括“事件-部門”和“事件- 三定”兩部分。“事件-部門”是基于政務熱線真實事件分撥處理結果構建,包含30個市級部門對應的3萬條事件數據。“事件-三定”是由政務工作人員根據“事件-部門”數據中30 000條數據的實際處理結果標注所得,包括30 000條正樣本(匹配)和采用隨機抽取的方式構建的60 000條負樣本(不匹配)。數據集描述如表1所示。

2.2 實驗設置

本文使用版本為1.7.1的PyTorch構建網絡模型,實驗環(huán)境的操作系統(tǒng)為Ubuntu 18.04 LTS,顯卡為NVIDIA GeForce GTX 3090。本文使用RoBERTa模型作為預訓練語言模型對事件文本和“三定”文本進行語義提取,RoBERTa的嵌入維數為768,詞匯量為30000,輸入序列長度為512;GCN嵌入大小設置為768;采用學習率為10e-5的Adam優(yōu)化器作為模型的優(yōu)化方法;采用批大小為16的分批對模型進行訓練。

2.3 事件分類實驗結果

本文將所提出的模型與多種先進的文本分類基線模型進行對比,包括:HAN, TextGCN, XLNet, Bert?GCN。同時,采用傳統(tǒng)文本分類指標Micro-F1 和Weighted-F1作為本文的評價指標。

表2是不同事件文本分類方法的實驗結果。結果表明,相比于其他基線模型,本文的聯(lián)合學習模型在事件分類任務上達到了最優(yōu)性能。HAN 模型采用BiLSTM網絡結合注意力機制提取文本上下文特征信息,但是對文本的局部特征提取較差,因此模型效果較差;而使用GCN網絡的TextGCN模型可以根據文本結構圖有效提文本的圖結構信息,可以有效緩解長文本帶來的網絡記憶丟失的問題,但GCN對文本本身的上下文語義信息提取能力較差;XLNet語言模型可以有效編碼文本上下文信息,但也對輸入文本長度存在限制,因此模型效果不如采用語言模型和GCN結合的BertGCN模型;本文使用RoBERTa語言模型結合GCN 的結構,同時采用基于注意力機制的融合模型,以實現(xiàn)有效多模態(tài)特征信息的對齊,從而使模型具有最優(yōu)的分類效果。

2.4 事件分撥實驗結果

為了評估分撥任務,本文將所提出的方法與以下先進的事件分類任務基線方法進行了比較,包括:Siamese-BiLSTM-based, ABCNN-based, BERT-BiGRU-based,ELECTRA-BiGRU-based。本文采用P@5、MAP、MRR、Precision、Recall和F1指標來評價事件分撥的性能。

事件分撥對比實驗結果如表3所示,由表3可知,本文方法在每個指標的效果上,均優(yōu)于其他基線方法。相比于Siamese-BiLSTM-based 模型和ABCNNbased模型使用BiLSTM網絡以及CNN網絡作為特征提取的基礎網絡,采用語言模型作為特征提取網絡的模型可以有效地提取文本上下文語義信息,因此效果優(yōu)于Siamese-BiLSTM-based 和ABCNN-based 模型;BERT-BiGRU-based 模型和ELECTRA-BiGRU-based 模型采用不同的語言模型結合BiGRU網絡進行事件分撥,因此模型效果較為相近,主要是由于語言模型對下游任務微調上存在的差距;而本文模型使用RoBERTa 語言模型和GCN網絡分別提取事件文本的上下文語義信息和文本的圖結構信息,可以有效提取文本本身的語義信息并緩解事件文本長短不一的問題;同時,本文還使用了基于后期融合的方式對事件的圖結構特征以及事件的上下文文本特征的預測結果進行融合,從而可以有效提升模型的準確性。因此,相較于其他基線模型,本文模型取得了最優(yōu)的分撥效果。

3 結論

本文提出了一種基于多模態(tài)融合的事件分類和事件分撥聯(lián)合學習模型,該模型使用圖計算和語言模型有效解決事件文本長短不一、要素不清等問題。模型首先通過構建事件文本的文本結構圖并使用GCN 獲取圖結構特征;其次,使用RoBERTa語言模型提取事件文本的上下文語義特征;然后,使用注意力機制對融合事件文本圖結構和上下文語義的多模態(tài)信息,并采用文本分類模型進行事件分類;最后,采用后期融合的方式對事件的分撥部門進行預測,并利用重排序模塊對部門預測結果進行排序,輸出事件的最優(yōu)分配部門。事件分類和事件分撥的實驗結果表明,相較于其他基線模型,本文提出模型在兩個任務上均具有更優(yōu)的性能。

主站蜘蛛池模板: 色噜噜在线观看| 色噜噜狠狠狠综合曰曰曰| 日韩在线播放欧美字幕| 一级一级一片免费| 精品久久高清| 国产97色在线| 亚洲成a人在线播放www| 国产小视频a在线观看| 老司机精品一区在线视频| 免费看美女毛片| 国产在线专区| 91久久精品国产| 精品无码人妻一区二区| 亚洲首页国产精品丝袜| 亚洲天堂网在线播放| 99色亚洲国产精品11p| 国产中文在线亚洲精品官网| 99在线国产| 欧美亚洲欧美区| 精品一区二区三区视频免费观看| 99久久精品免费看国产免费软件| 日韩黄色大片免费看| 国产91丝袜在线播放动漫| 三上悠亚精品二区在线观看| 日韩a级毛片| 欧美自拍另类欧美综合图区| 中文字幕亚洲电影| 国产日韩欧美在线视频免费观看| 美女视频黄又黄又免费高清| 久草视频中文| 亚洲色欲色欲www网| 欧美国产菊爆免费观看| 狠狠色综合久久狠狠色综合| 成年人午夜免费视频| 伊人色婷婷| 欧美一级黄色影院| 欧美一区中文字幕| 色网在线视频| 一级爆乳无码av| 国产激情在线视频| 免费国产小视频在线观看| 一级不卡毛片| 香蕉99国内自产自拍视频| 国产乱子伦一区二区=| 亚洲AⅤ无码日韩AV无码网站| 无码精品国产dvd在线观看9久 | 亚洲AⅤ综合在线欧美一区| 成人午夜精品一级毛片 | 亚洲第一成人在线| 亚洲天堂高清| 成人在线天堂| 成人国产精品网站在线看| 亚洲欧美日韩成人在线| 一本色道久久88综合日韩精品| 亚洲第一香蕉视频| 亚洲欧洲一区二区三区| 免费无码在线观看| 欧亚日韩Av| 国产精品免费电影| 国产96在线 | 99热这里只有精品免费| 亚洲成a人在线观看| 红杏AV在线无码| 欧美性精品不卡在线观看| a级毛片一区二区免费视频| 久草热视频在线| 国产99欧美精品久久精品久久| 国产精品lululu在线观看| 91www在线观看| 91免费国产高清观看| 欧美第九页| 伊人久久青草青青综合| 亚洲男人天堂网址| 国产精品自拍露脸视频| 免费国产小视频在线观看| 激情無極限的亚洲一区免费| 伊人久久大香线蕉aⅴ色| 日a本亚洲中文在线观看| 亚洲成综合人影院在院播放| 国产精品亚欧美一区二区| av一区二区三区在线观看| 久久久久免费精品国产|