999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

BERT+CRF模型的漏洞信息結(jié)構(gòu)化抽取方法

2021-06-03 06:11:16云南電網(wǎng)有限責(zé)任公司曲靖供電局朱家山
電子世界 2021年9期
關(guān)鍵詞:關(guān)鍵文本信息

云南電網(wǎng)有限責(zé)任公司曲靖供電局 朱家山

漏洞攻擊是信息安全領(lǐng)域的典型事件,全球范圍內(nèi),每年因漏洞攻擊帶來(lái)的損失不計(jì)其數(shù),甚至產(chǎn)生顛覆性的破壞。2015年,攻擊者通過(guò)線上變電站攻擊及線下的電力客服中心進(jìn)行電話DDoS攻擊導(dǎo)致烏克蘭首都及西部地區(qū)140萬(wàn)居民遭遇了長(zhǎng)達(dá)數(shù)小時(shí)的大規(guī)模停電,造成了巨大的經(jīng)濟(jì)損失。在電網(wǎng)信息化轉(zhuǎn)型的背景下,各供電企業(yè)加大了信息化建設(shè)及改造升級(jí)的力度,隨著信息系統(tǒng)數(shù)量及種類增多,系統(tǒng)之間的信息資源共享使得各系統(tǒng)之間交互更加頻繁,系統(tǒng)的關(guān)聯(lián)關(guān)系呈現(xiàn)復(fù)雜化特征,為電力企業(yè)的信息安全管理帶來(lái)極大的挑戰(zhàn)。現(xiàn)階段,電力企業(yè)高度依賴于信息系統(tǒng),電力系統(tǒng)已經(jīng)演變成集營(yíng)銷管理系統(tǒng)、計(jì)量計(jì)費(fèi)系統(tǒng)、電力MIS系統(tǒng)、電力自動(dòng)化系統(tǒng)等的電力資源整合系統(tǒng),信息系統(tǒng)安全是保障電力系統(tǒng)安全、穩(wěn)定運(yùn)行的基礎(chǔ)。

本文針對(duì)近年來(lái)的漏洞信息抽取技術(shù)進(jìn)行了深入的研究,提出了一種基于BERT+CRF模型的漏洞信息結(jié)構(gòu)化抽取的方法,采用人工智能深度學(xué)習(xí)方法進(jìn)行建模,基于序列標(biāo)注模型實(shí)現(xiàn)漏洞關(guān)鍵信息抽取,解決了現(xiàn)有人工手段抽取漏洞信息中人力投入大、漏洞信息精確度不高等問(wèn)題。

1 設(shè)計(jì)方案

通過(guò)從全球范圍內(nèi)權(quán)威的漏洞信息共享平臺(tái)獲取漏洞數(shù)據(jù),對(duì)各平臺(tái)發(fā)布的漏洞信息構(gòu)成要素進(jìn)行分析,整合各漏洞信息共享平臺(tái)的屬性集合,去除漏洞集合中存在冗余的屬性、對(duì)相似性屬性及同類不同名屬性進(jìn)行統(tǒng)一命名,構(gòu)建漏洞信息本體模型。針對(duì)漏洞信息本體模型制定標(biāo)注方案,從漏洞數(shù)據(jù)集中劃分出部分?jǐn)?shù)據(jù)集,進(jìn)行序列標(biāo)注,生成模型訓(xùn)練語(yǔ)料。基于訓(xùn)練語(yǔ)料及序列標(biāo)注模型構(gòu)建漏洞信息結(jié)構(gòu)化抽取模型,通過(guò)漏洞信息結(jié)構(gòu)化抽取模型從漏洞數(shù)據(jù)集中抽取漏洞關(guān)鍵信息要素。基于標(biāo)注的語(yǔ)料和漏洞本體模型設(shè)計(jì)漏洞關(guān)鍵信息抽取模型的性能評(píng)估方法,對(duì)漏洞信息抽取模型進(jìn)行性能評(píng)估,并基于評(píng)估結(jié)果改進(jìn)及優(yōu)化模型。根據(jù)抽取到的漏洞關(guān)鍵信息及漏洞本體模型構(gòu)建結(jié)構(gòu)化的漏洞數(shù)據(jù)庫(kù)。

2 關(guān)鍵技術(shù)

2.1 漏洞信息本體模型構(gòu)建

構(gòu)建漏洞信息本體模型的過(guò)程中,需要從漏洞描述、網(wǎng)絡(luò)安全公告等文本信息中抽取出相關(guān)的實(shí)體、建立各實(shí)體之間的關(guān)聯(lián)關(guān)系。在進(jìn)行實(shí)體的抽取過(guò)程中,對(duì)于結(jié)構(gòu)化數(shù)據(jù),需要通過(guò)領(lǐng)域本體的抽取方式進(jìn)行本體抽取,對(duì)于非結(jié)構(gòu)化數(shù)據(jù)需要借助信息抽取技術(shù)從非結(jié)構(gòu)化文本中抽取結(jié)構(gòu)化信息。通過(guò)領(lǐng)域本體方法進(jìn)行本體的抽取過(guò)程中首先對(duì)領(lǐng)域的術(shù)語(yǔ)及術(shù)語(yǔ)之間的關(guān)系進(jìn)行整合,構(gòu)建術(shù)語(yǔ)表,將術(shù)語(yǔ)表中的術(shù)語(yǔ)作為本體的概念集合,并確定概念之間的關(guān)系,將術(shù)語(yǔ)表直接轉(zhuǎn)換為本體集合。對(duì)于非結(jié)構(gòu)化數(shù)據(jù)的信息抽取技術(shù)中,需要用到命名實(shí)體識(shí)別及實(shí)體關(guān)系抽取技術(shù),一種普遍的做法是通過(guò)人工預(yù)先標(biāo)注數(shù)據(jù),利用標(biāo)注好的數(shù)據(jù)集訓(xùn)練本體模型,利用訓(xùn)練好的本體模型從非結(jié)構(gòu)化文本中提取命名實(shí)體。

具體實(shí)施步驟如下:(1)選取權(quán)威漏洞信息共享平臺(tái),獲取漏洞信息,構(gòu)建本體漏洞概念的屬性集合,對(duì)各個(gè)漏洞庫(kù)的屬性集合進(jìn)行整合,剔除冗余屬性,對(duì)相似性屬性及同類屬性進(jìn)行合并,定義漏洞必要屬性、可選屬性、關(guān)鍵屬性、非關(guān)鍵屬性,其中必要屬性指指漏洞信息中應(yīng)包括的最少屬性;可選屬性指漏洞的屬性中除了必要屬性之外的屬性;關(guān)鍵屬性指描述和解決該漏洞所需要的關(guān)鍵要素;非關(guān)鍵屬性指漏洞屬性中除了關(guān)鍵屬性之外的屬性。必要屬性:本地編號(hào)、漏洞名稱、危害等級(jí)、發(fā)布時(shí)間、漏洞影響的實(shí)體;可選屬性:漏洞公告、參考網(wǎng)址、補(bǔ)丁、廠商、威脅類型、漏洞來(lái)源;關(guān)鍵屬性:漏洞名稱、漏洞簡(jiǎn)介、危害等級(jí)、威脅類型、發(fā)布時(shí)間、漏洞影響的實(shí)體、漏洞補(bǔ)丁;非關(guān)鍵屬性:廠商、漏洞來(lái)源、參考網(wǎng)址。(2)構(gòu)建漏洞實(shí)體詞典,基于CRF模型引入詞典特征構(gòu)建漏洞命名實(shí)體識(shí)別器,識(shí)別漏洞描述中的相關(guān)漏洞概念屬性。(3)對(duì)概念本體的完整性、正確性及可擴(kuò)展性進(jìn)行評(píng)估,保障每個(gè)概念定義清晰,不存在歧義,滿足完整性需求。

表1 漏洞描述文本對(duì)應(yīng)的序列標(biāo)注

2.2 基于BERT+CRF模型的漏洞抽取

從漏洞信息數(shù)據(jù)集中篩選部分樣本進(jìn)行序列標(biāo)注,采用BIO標(biāo)注法,將單個(gè)字符作為最小的標(biāo)注粒度,標(biāo)注每個(gè)字符對(duì)應(yīng)的具體類別,其中類別標(biāo)簽中B開(kāi)頭的表示詞的起始位置,I開(kāi)頭表示詞的所有字符中除了起始位置之外的位置,O開(kāi)頭表示無(wú)關(guān)字符。標(biāo)簽中B、I、O之后的表示字符對(duì)應(yīng)的類別,以“-”隔開(kāi),其中“entity”表示漏洞影響的實(shí)體名稱,“version-i”表示離散的實(shí)體版本號(hào),“version-b”表示連續(xù)的版本號(hào)的開(kāi)始版本號(hào),“version-n”表示連續(xù)的版本號(hào)的結(jié)束版本號(hào),“type”表示漏洞影響的類型等。例如漏洞信息短文本描述如下:“該漏洞影響了Pillow的4.0.1和5.1.2之間的版本”,漏洞描述文本對(duì)應(yīng)的序列標(biāo)注如表1所示。

圖1 BERT+CRF模型結(jié)構(gòu)圖

基于標(biāo)注的數(shù)據(jù)訓(xùn)練漏洞關(guān)鍵信息抽取模型,采用BERT+CRF模型結(jié)構(gòu),首先通過(guò)BERT模型對(duì)漏洞描述文本進(jìn)行特征提取及編碼,獲得文本對(duì)應(yīng)的字符向量,將之映射為CRF層的發(fā)射概率,經(jīng)過(guò)CRF層輸出每個(gè)字符對(duì)應(yīng)的類別概率,最后通過(guò)字符及字符的位置關(guān)系及類別得到該文本中包含的漏洞關(guān)鍵信息,BERT+CRF模型結(jié)構(gòu)如圖1所示。

如圖1所示,w表示漏洞描述文本,通過(guò)將漏洞描述文本進(jìn)行字符分割處理,分割成單個(gè)字符輸入至BERT模型中,經(jīng)過(guò)BERT模型訓(xùn)練,每個(gè)字符得到一個(gè)對(duì)應(yīng)的編碼向量,通過(guò)將向量降維到與標(biāo)簽類別數(shù)目相同的維度之后,將向量中的值壓縮至0-1之間作為CRF層的發(fā)射概率,CRF層擬合之后輸出每個(gè)字符對(duì)應(yīng)的標(biāo)簽概率P,最后根據(jù)輸出結(jié)果與定義的標(biāo)簽進(jìn)行合并,獲得漏洞關(guān)鍵信息。

漏洞關(guān)鍵信息抽取模型構(gòu)建完成后,需要從標(biāo)注的漏洞數(shù)據(jù)中隨機(jī)抽取出一部分未參與訓(xùn)練的樣本,用模型抽取出關(guān)鍵信息與標(biāo)注結(jié)果對(duì)比,設(shè)計(jì)對(duì)比的方法,計(jì)算出漏洞抽取模型的精度。

最后,將利用模型抽取到的非結(jié)構(gòu)漏洞關(guān)鍵信息與原來(lái)已經(jīng)存在的結(jié)構(gòu)化信息進(jìn)行融合,結(jié)合構(gòu)建的漏洞本體模型中定義的屬性及邏輯關(guān)系構(gòu)建電力企業(yè)內(nèi)部漏洞數(shù)據(jù)庫(kù),支撐信息安全管理工作。

結(jié)語(yǔ):本文分析了電力企業(yè)在信息安全領(lǐng)域面臨的嚴(yán)峻形勢(shì),提出了一種基于BERT+CRF的漏洞信息結(jié)構(gòu)化抽取方法,通過(guò)從全球權(quán)威的漏洞信息共享平臺(tái)獲取漏洞描述文本信息,采用基于序列標(biāo)注的方法對(duì)漏洞描述中的關(guān)鍵信息進(jìn)行抽取,并結(jié)合漏洞本體構(gòu)建電力企業(yè)內(nèi)部漏洞數(shù)據(jù)庫(kù),形成常態(tài)化的漏洞信息收集、分析及通報(bào)工作機(jī)制,提升電網(wǎng)信息系統(tǒng)的安全防范能力及信息安全水平。

猜你喜歡
關(guān)鍵文本信息
高考考好是關(guān)鍵
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識(shí)別
電子制作(2018年18期)2018-11-14 01:48:06
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
展會(huì)信息
獲勝關(guān)鍵
NBA特刊(2014年7期)2014-04-29 00:44:03
如何快速走進(jìn)文本
生意無(wú)大小,關(guān)鍵是怎么做?
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 伊人国产无码高清视频| 无码专区国产精品第一页| 人妻中文字幕无码久久一区| 亚洲天堂伊人| 9999在线视频| 国内99精品激情视频精品| 欧美成人午夜视频免看| 暴力调教一区二区三区| 亚洲电影天堂在线国语对白| 国产成人调教在线视频| 免费亚洲成人| 成人小视频网| 欧美区在线播放| 欧美性精品不卡在线观看| 亚洲国产清纯| 色欲色欲久久综合网| 国产一区在线视频观看| 久久香蕉欧美精品| 日韩AV无码一区| 国产成人高清亚洲一区久久| 欧美人在线一区二区三区| 日本欧美中文字幕精品亚洲| 久久夜色撩人精品国产| 中国国产高清免费AV片| 在线人成精品免费视频| 国产大全韩国亚洲一区二区三区| 亚洲最猛黑人xxxx黑人猛交 | 国产91熟女高潮一区二区| 亚洲av无码片一区二区三区| 亚洲国产成人无码AV在线影院L| 久久99久久无码毛片一区二区| 亚洲欧美一区在线| 国产日韩av在线播放| 久草视频精品| 国产一区免费在线观看| 成人一区在线| 欧美人人干| 亚洲成av人无码综合在线观看| 国产精品网址在线观看你懂的| 538精品在线观看| 91外围女在线观看| 亚洲AV免费一区二区三区| 毛片网站在线播放| 情侣午夜国产在线一区无码| 麻豆a级片| 欧美特级AAAAAA视频免费观看| 黄色网站不卡无码| 夜夜爽免费视频| 日韩a在线观看免费观看| 亚洲AV成人一区二区三区AV| 国产精品午夜电影| 亚洲永久精品ww47国产| 一边摸一边做爽的视频17国产| 国产成熟女人性满足视频| 成人久久精品一区二区三区| 日韩A级毛片一区二区三区| 无码专区在线观看| 99久久亚洲精品影院| 中文字幕有乳无码| 亚洲国产欧美中日韩成人综合视频| 国产成人高清精品免费| 女人18毛片水真多国产| 亚洲中文字幕在线精品一区| 波多野结衣一二三| 久久鸭综合久久国产| 亚洲成人手机在线| 四虎影视8848永久精品| 精品人妻一区二区三区蜜桃AⅤ| 香蕉eeww99国产在线观看| 久草青青在线视频| 在线综合亚洲欧美网站| 欧美日韩国产系列在线观看| 色婷婷在线影院| 日韩在线影院| 亚洲精品无码不卡在线播放| 激情综合婷婷丁香五月尤物| 欧美一区国产| 日韩在线中文| 欧美三级视频在线播放| 国产乱肥老妇精品视频| 久久久久免费看成人影片 | 中文字幕有乳无码|