999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

突發事件前Twitter用戶言語行為研究:基于機器學習的方法

2020-04-14 04:54:29曹若凡
電腦知識與技術 2020年4期
關鍵詞:特征提取

摘要:針對現代恐怖組織利用社交媒體,進行在線恐怖宣傳來策動突發事件的情況,本研究使用機器學習的方法,對Twit-ter中的相關文本內容進行了分析。首先對推文進行了多種預處理,測試了三種特征提取的優劣,并加入了有言語行為相關特征的詞典,其次比較了四種分類器在識別Twitter中用戶言語行為效果上的優劣,并進行了參數優化。最后將訓練好的模型對某爆炸事件前48小時的相關推文進行了分析,為今后找到相關突發事件發生前的言語行為變化規律提供了依據。

關鍵詞:社交媒體;突發事件;文本分類;言語行為;特征提取

中圖分類號:TP393

文獻標識碼:A

文章編號:1009-3044(2020)04-0188-04

收稿日期:2019-10-15

作者簡介:曹若凡(1995—),男,上海人,研究生在讀,管理學碩士,主要研究方向為自然語言處理,情感分歧。

Research on Speech Acts of users in Twitter before the emergency:Based on Machine Learning Methods

CAO Ruo-fan

(School of Economics and Management,Tongji University,Shanghai 200092,China)

Abstract:In response to the modern terrorist organizations which combine the online terrorist attack with offline violent attacks,this pa-per focus on the text content in social media Twitter which related to violent terror,use the speech act theory and the method of machine learning,explore the changes of speech acts of users in Twitter.First,this paper pre-process the text data in Twitter,and use several methods of feature extraction and add the speech acts dictionary to vectorize the tweets for training classifier.Then this paper test Sup-port Vector Machine,Decision Tree,Naive Bayes and Random Forest these four kinds of classifier which can best identify the user' s speech acts in Twitter,this paper adopt precision,recall and F-score these three kinds of measure to evaluate the model and optimize its parameters.At last,this paper use the trained model to analyze the tweet which contained “ISIS" within 48 hours before the Brussels terrorist attacks to automatically recognize the user ' s speech acts.This provide a basis to find the pattern about changes of speech acts be-fore the violent terrorist incidents in the future.

Key words:social media;violent terrorist incidents;text classification;speech act;feature extraction

1 概述

近年來各類突發事件呈多發趨勢,尤其是一些綁架、屠殺、襲擊等暴力恐怖事件。這些事件不僅會嚴重威脅人們的生命財產安全、阻礙著社會和經濟的發展,還會引起公眾的大范圍恐慌情緒,進一步影響著社會秩序的維護[1]。現代的恐怖組織利用社交媒體,在網絡上宣傳極端主義、蠱惑民眾、招募成員,通過在線的方式來傳遞恐怖信息、實施恐怖行為[2]。基于此,本.文針對這一類的突發事件進行了研究,以社交媒體Twitter中的相關文本為研究對象,分析了某爆炸事件前用戶的言語行為的變化,以期在未來可以找到其中的規律,使得預測暴恐事件成為可能,這也許在未來可以成為新的反恐預警方式。

2 文獻綜述

現代的恐怖組織把社交媒體作為了策劃和發動襲擊的指揮部,將網絡變成了相互溝通聯系的橋梁,這進一步地增大了傳統反恐的難度,也意味著要引入新的反恐思維和理念來進行應對[3]。但反恐情報機構同樣可以依托于社交媒體來獲取更多的相關信息,從而更有準備的應對恐怖主義的威脅[4]。一旦及時捕捉到了相關信息并且進行了應對和防范,那么就完全可以降低恐怖主義的負面效果,從而成功地阻止恐怖組織的活動。然而,現如今反恐情報機構針對涉恐信息和相關賬號的處理方法,往往還是單一的刪除或是封號處理,大多數時候并沒有對其中蘊含的內容信息進行挖掘,這也使得相關部門并沒有獲得太多的預警性的情報[5]。利用機器學習的技術對于社交媒體中的涉恐信息進行收集和分析是未來研究恐怖活動的趨勢,也為反恐預警提供了技術支持[6]。這既有助于實現對威脅人民生命財產安全的暴力恐怖事件的預警,也有助于完善國家的反恐情報分析,使得情報機構更加成熟[7],從而更有效的預防和打擊恐怖主義。

5 模型應用

本文采用Twitter官方的流API爬取到的某爆炸事件前48小時的包含恐怖組織信息的相關推文,共1697條,以12小時為一段共分為4段。對其進行六種預處理后推文數量為1209條,各階段數據如表3所示。使用前面訓練好的分類器模型來自動識別這些推文的用戶言語行為,并將言語行為分類的結果運用于暴力恐怖事件前的分析中。

5.1 分類結果

由于其他這一類別是很多不同言語行為類型的組合,即是一個不同成分的合集,且有言語行為特征的提示詞詞典也是針對其他四類所組成的詞典,并不包括其他這一類,于是在預測暴力恐怖事件時不考慮這一類別,只考慮陳述、疑問、建議、評論這四類。表4為各個時間段這四個類別的分布,圖2-圖5展示了四類數據的分布變化趨勢:

5.2 言語行為分析

對暴力恐怖事件發生前的整段分析中發現,Twitter中用戶的言語行為分布發生了明顯的變化,這可能是有恐怖分子在Twitter上正在謀劃或組織著這一次的暴力恐怖事件。若今后Twitter上再出現類似的言語行為分布,這也許就是又有恐怖分子在謀劃暴力恐怖事件的信號,這為今后發現其中的規律提供了依據,在未來一旦發現了變化規律就足以使得相關部門引起警惕和警覺,注意預防類似事件的發生,從而避免出現人員傷亡和財產損失。

如4.1中的圖表中所示的那樣,疑問和建議這兩類的推文在事件前12到24小時明顯增多,達到了自己這一類在這四個時間段中所占百分比的最大值。相應的,評論和陳述這兩類的推文明顯減少,達到了自己這一類在這四個時間段中所占百分比的最小值。這也許是因為恐怖分子在和他們的支持者進行溝通,讓他們的支持者對他們要進行的暴力恐怖襲擊提出疑問或者建議。

而在事件前12個小時內,疑問和建議這兩類的推文所占比重有所下降,而評論和陳述這兩類的推文所占比重有所上升。這也許是因為恐怖分子已經確定如果去行動,并已經進行最后的準備,在陳述告知支持者具體的行動,或向恐怖主義的支持者申請籌款,并且使這些支持者們對這次的行動進行評論。

本文通過機器學習的方法,為分析暴力恐怖事件提供了新的思路,也為發現暴力恐怖事件前的用戶言語行為變化提供了理論依據。

6 結束語

對于Twitter中用戶的言語行為的識別既有理論價值也有實際意義。它也引入了一個新的層面來研究社交媒體內容,以及提供真實生活的數據來驗證言語行為理論。而言語行為理論也為研究Twitter用戶提供了一個好的窗口,將言語行為理論和數據挖掘的方法相結合,可以更好地識別出社交媒體中用戶行為的變化。

而近年來恐怖組織不僅在線下發動著各類慘絕人寰的爆:炸和屠殺,線上還會通過社交媒體宣傳蠱惑和進行招募,這嚴重威脅了人民的生命安全和社會的穩定發展。所以在未來,自動識別出社交媒體中相關言語行為的變化規律,從而預測出將要發生的暴力恐怖事件,來進行控制和預防有著極大的實際意義,這也是本文所希望看到的。

參考文獻:

[1]瞿志凱,蘭月新,夏一雪,等.大數據背景下突發事件情報分析模型構建研究[J].現代情報,2017,37(1):45-50.

[2]李華偉.社交媒體在“伊斯蘭國”恐怖活動中的作用及監管困境[J].宗教社會學,2017(0):224-242.

[3]李本先,張薇.反恐情報2.0:互聯網時代的反恐情報體系[J].情報雜志,2017,36(10):17-21.

[4]Amble J C.Combating terrorism in the new media environment[J].Studies in Conflict & Terrorism,2012,35(5):339-353.

[5]楊增光.社交媒體在反恐情報工作中的應用研究[D].北京:中國人民公安大學,2017.

[6]倪葉舟,張鵬,扈翔,等.大數據背景下涉恐信息挖掘方法綜述[J].中國公共安全:學術版,2018(4):91-95.

[7]梅建明.論反恐數據挖掘[J].中國人民公安大學學報,2007,23(2):24-29.

[8]Contractor D,Chawda B,Mehta S,et al.Tracking political elections on social media:Applications and experience[C]/Proceedings of the Twenty-Fourth International Joint Conference on Artificial Intelligence,IJCAI.2015:25-31.

[9]胡婧.基于社交媒體信息的中國股票交易預測研究[D].武漢:武漢理工大學,2017.

[10]Austin J L.How to do things with words[M].Cambridge:Ox-ford University Press,1975.

[11]Zhang R,Gao D,Li W.What Are Tweeters Doing:Recognizing Speech Acts in Twitter[C]/In Proceedings of AAAI-11W orkshop on Analyzing Microtext.2011:86-91.

[12]Searle J R.Indirect speech Acts[M]/Speech Acts.New York::BRILL,,1975:.

[13]Kaufmann M,Kalita J.Syntactic Normalization of Twitter Messages[C//In Proceedings of International conference on natural on Natural Language Processing,Kharagpur,India.2010.

[14]Han J W,Kamber M,Pei J.Data cube technology[M]/DataMining.Amsterdam:Elsevier,2012:187-242.

[15]Sokolova M,Szpakowicz S.Machine learning in natural language processing[M]/Handbook of Research on MachineLearning Applications and Trends,ICI Global,2010:302-324.

[通聯編輯:唐一東]

猜你喜歡
特征提取
特征提取和最小二乘支持向量機的水下目標識別
基于Gazebo仿真環境的ORB特征提取與比對的研究
電子制作(2019年15期)2019-08-27 01:12:00
基于Daubechies(dbN)的飛行器音頻特征提取
電子制作(2018年19期)2018-11-14 02:37:08
基于DNN的低資源語音識別特征提取技術
自動化學報(2017年7期)2017-04-18 13:41:09
Bagging RCSP腦電特征提取算法
一種基于LBP 特征提取和稀疏表示的肝病識別算法
基于DSP的直線特征提取算法
基于改進WLD的紋理特征提取方法
計算機工程(2015年4期)2015-07-05 08:28:02
淺析零件圖像的特征提取和識別方法
機電信息(2015年3期)2015-02-27 15:54:46
基于CATIA的橡皮囊成形零件的特征提取
主站蜘蛛池模板: 日韩东京热无码人妻| 国产成人综合日韩精品无码首页| 日韩 欧美 小说 综合网 另类| 国产精品自在在线午夜| 亚洲无码熟妇人妻AV在线| 女人18毛片水真多国产| 亚洲一区网站| 亚洲精品在线观看91| 手机在线看片不卡中文字幕| 在线欧美a| 亚洲一级无毛片无码在线免费视频 | 欧美激情视频一区| 国产欧美中文字幕| 九九热精品免费视频| a毛片免费在线观看| 美女毛片在线| 欧美一级视频免费| 国产成人综合在线视频| 亚洲中文字幕av无码区| 东京热高清无码精品| 日日拍夜夜操| 国产剧情无码视频在线观看| 亚洲欧洲综合| 午夜啪啪福利| 国产aⅴ无码专区亚洲av综合网| 亚洲黄色视频在线观看一区| 国产成人亚洲精品无码电影| 欧美日韩在线国产| 无码AV高清毛片中国一级毛片| 国产高清国内精品福利| 亚洲国产精品一区二区第一页免 | 2020极品精品国产| av无码久久精品| 国产精品永久在线| 国产美女一级毛片| 亚洲欧州色色免费AV| 美女被操黄色视频网站| 丁香亚洲综合五月天婷婷| 在线观看国产精美视频| 日本高清成本人视频一区| 亚洲国产黄色| 88av在线| 2022精品国偷自产免费观看| 免费国产高清视频| 91在线无码精品秘九色APP| 久久婷婷六月| 亚洲自偷自拍另类小说| 欧美精品成人| 亚洲性网站| 日韩乱码免费一区二区三区| 国产成人精品第一区二区| 奇米影视狠狠精品7777| 一级毛片无毒不卡直接观看| 精品福利网| 国产小视频在线高清播放| 国产成人91精品免费网址在线| 成人字幕网视频在线观看| 青青操国产视频| 女同久久精品国产99国| 欧美一级在线看| 熟女视频91| 国产成人夜色91| 亚洲精品免费网站| 三上悠亚在线精品二区| 97视频免费在线观看| 国产黄色片在线看| 午夜视频日本| 国产极品粉嫩小泬免费看| 日韩亚洲综合在线| 欧美日韩国产在线观看一区二区三区 | 狼友av永久网站免费观看| 一级毛片免费观看久| 她的性爱视频| 2019年国产精品自拍不卡| 91国内在线视频| 精品人妻系列无码专区久久| 波多野结衣AV无码久久一区| 亚洲精品视频网| 波多野结衣的av一区二区三区| 国产黄在线免费观看| 亚洲人人视频| 啪啪免费视频一区二区|