丁子羿,湯文蘊,馬健霄
(南京林業大學汽車與交通工程學院,江蘇 南京 210037)
新冠病毒是一種高傳染性的病毒,在人流量巨大的交通樞紐有廣泛傳播的可能性。自2021 年7 月20 日起,南京市政府為了有效控制病毒擴散,果斷做出了對交通進行管控的決定。交通管控會影響人們的正常生活,因此有必要分析網民對交通管控措施的態度。
新浪微博作為現在最受中國網民青睞的社交媒體之一,每天更新、發布大量熱點新聞,網民在微博平臺下也可以暢所欲言,把個人觀點傳到網絡空間。近些年,國內外學者在新浪微博、推特等平臺上抓取數據并進行處理、分析,以便從文字中獲得網民的真實想法。LI以“南京地鐵”為關鍵詞,抓取了2014 年1 月至2018 年4 月的微博數據,根據構建的LDA(Latent Dirichlet allocation)主題模型,分析出潛在的正面和負面話題,得到了乘客對南京市地鐵系統的改善建議;為了更準確地分析突發公共事件中的輿情情感變化,李長榮構建了面向此類事件的領域情感詞典;劉江月構建了融入中英文雙語的細粒度情感規范詞典C-ANEW,情感分析的結果相較于傳統詞典更加準確。
交通輿情反映了市民對城市交通問題的態度。其中既包含了交通信息,也反映了市民對交通出行環境以及城市交通建設的期待。LU通過多渠道社交信息,構建了基于Word2Vec 的輿情融合模型,用于感知、檢測城市交通事故,可視化展現交通違章事件全貌;Cao提出基于中文微博用戶情感分析的半監督學習方法,可用于預測交通擁道路和時間;Ali將本體論和LDA 模型方法用于分析交通輿情,研究成果可用于改善城市交通擁堵問題。目前國內外有關輿情的研究中,針對交通輿情的挖掘研究涉及較少,主要研究是從社交平臺中分離出特定事件的輿情信息,文本挖掘技術尚未系統地應用到交通輿情研究中。本文擬通過分析新浪微博中南京疫情事件下的交通輿情信息,準確地把握普通群眾對公共衛生事件下交通管控的態度,有助于提高交通管控的有效性和滿意度。
本文選取了2021 年7 月“南京市新冠肺炎”事件作為研究對象,據相關報道,7月20日即日起南京發布嚴格落實交通出行疫情防控措施、積極主動配合核酸檢測等防控工作的公告。兩周內,本土確診病例數直線上升,防疫指揮部發布了“非必要不離寧”的公告。8 月15 日后,疫情逐步得到控制,新增病例數降低至0 人。因此本文數據爬取時段為7月20日至9月30日,從疫情爆發初期至疫情得到控制后一個月。
數據采集是一種利用搜索引擎或數據源定向獲取結構化數據的技術,它擁有十分廣泛的應用領域。此次研究選取了全球最大的中文社交網絡平臺——微博。我們以“南京”、“疫情”、“交通管制”為關鍵詞在新浪微博進行爬取,時間跨度為7月20日~9月30日。每條微博抓取的內容包括時間、博文、用戶ID、評論數等信息,共抓取數據23475條。
微博平臺的文本信息中包含了大量廣告和無意義的文字信息,獲取文本后,要對冗長的文本進行預處理。本文采用的預處理方式有文本刪除、去停用詞和中文分詞。在刪除與所研究內容無關的文本后,最終得到14622條博文。
情感分析技術可針對文本自動地抽取主觀情感傾向,常用于判斷用戶的情緒分布并統計其情感變化趨勢。本文采用Python 的第三方庫SnowNLP 進行情感分析,分別引入積極情感詞庫和消極情感詞庫,以樸素貝葉斯分類算法作為理論基礎,如公式⑴所示:

式中,(類別)表示已經標注好的訓練數據先驗概率,(詞|類別)表示不同分類詞的出現概率,兩個指標的乘積與每個詞出現概率(詞)相比,得到最終情感值的輸出結果。
主題挖掘技術是文本挖掘領域中新興的一種對具有代表性的詞、短語或句子進行自動標注和抽取的技術,能快速有效地從海量數據中識別出人們感興趣和有價值的信息,其在處理大規模文本時具備獨特的優勢。LDA 模型是一種具有優秀降維能力的三層貝葉斯模型。可以將原本高維的詞空間縮減成由一組主題詞組成的小主題空間。其模型概率如圖1 所示。其中,D 為文檔集合,α、β 分別為模型分布的先驗參數,θ、φ 為多重分布參數,變量ω 可由給定文檔數據集直接獲得,Z為最終生成的主題詞。

圖1 LDA模型概率圖
本文的技術流程分為三個部分,如圖2所示。

圖2 技術流程圖
⑴通過Python 抓取微博數據,對存儲的文本進行數據預處理和詞頻統計;
⑵ 采用Python 的第三方庫SnowNLP 進行情感分析,得到網民們的正負面情感值并以地理可視化的形式展現;
⑶通過困惑度分析得出最優主題詞個數,構建LDA 模型分析得到積極和消極熱點主題詞,并引入時間節點分析主題演化趨勢。
對博文進行預處理后進行高頻詞統計,統計得到23688 個不重復的原始關鍵詞及其出現頻次。將這些原始關鍵詞按照出現的頻次排序并取出現頻次最高的前100個關鍵詞進行清理和分析。首先刪除和研究主題無關的詞匯,然后合并語義相同或相似的關鍵詞。最后得到60 個語義不重復且與研究主題相關的高頻詞,將這些關鍵詞及其出現頻次作為詞云圖分析的基礎數據。
通過Python 中的WordCloud 包進行詞云圖繪制,出現頻次越高,字符越大,繪制的詞云圖如圖3 所示。由圖3可知,祿口機場、防控、核酸等詞出現頻率的最高,高風險地區核酸情況以及疫情期間的管控最受網友重視;其次,公安、警察一類的詞出現次數較高。作為疫情期間的執法人員,警察是一線人員,要維護交通秩序并排查外來人員是否發燒,市民對他們的期望值也比較高。

圖3 高頻詞詞云圖
SnowNLP 情感分析輸出的每條博文的情感值區間為0 到1,大于0.5 時為積極情感,越接近1,情感越正面;小于0.5 時為消極情感,越接近0,情感越負面。情感分析的地理可視化結果如圖4 所示。由圖可知,全國人民對于此次突發公共衛生事件基本持積極態度。江蘇其他城市與其相鄰省份,因距疫情爆發城市較近,部分當地市民產生了不安情緒。此外,湖南省受南京疫情傳播影響較大,因此反映出的負面情緒較多。

圖4 情緒狀態分布圖
本研究對每日的情感分析結果做了取平均值處理,如圖5所示。由圖可知,網民們的情緒總體上是趨于積極的。8 月15 日以后,負面情緒出現頻次明顯減少了。但是,7月26日~7月31日、8月9日~8月13日,這兩個時段有明顯的情緒下滑的現象。結合抓取的微博文本及疫情新聞,分析了產生消極情緒的原因:

圖5 情感值分布圖
2021 年7 月20 日后,新冠肺炎在南京市爆發,網民們陷入了恐慌,各種消極言論在網絡上傳播。7 月26 日起,微博中大量涌現“南京市政府疫情管控以及城市交通管控不當,當地客運樞紐并未實施嚴格的管控措施,導致疫情全國大范圍擴散”的言論。
8 月初期,多處收費站、高速出站口雙向關閉;南京部分工地因防疫措施不嚴,導致市內16個工程項目停工整改;同時惡劣的天氣也影響著交通管制的效率,這些消息造成了部分網民較大的情緒波動。
8月22日,江蘇省自南京疫情以來,首次無新增本土確診病例。疫情得到有效控制,網民對于南京市的疫情治理和交通管制的注意力逐漸轉移到正常生活和交通出行上。疫情初期的消極情感,在經過合理的疫情防控和交通管控后逐漸轉變為積極,最后趨于平和。
對南京市疫情期間交通管制的正面與負面評論進行了LDA 主題分析。首先,通過LibSVM 法對所有的微博評論文本進行文本分類,在預處理后的14622條數據中,與交通密切相關的文本有13803條。對分類后的文本數據進行困惑度分析,事件的主題個數隨困惑度變化的折線圖如圖6所示。在南京疫情交通管控事件中,主題個數為5時對應的困惑度值最小,困惑度值最小時設置的主題個數最佳。因此在構建LDA模型時,將積極和消極主題數都設置為5。

圖6 南京疫情交通管控事件主題詞的評論困惑度
模型構建完后,分別選取消極與積極占比最高的主題詞進行可視化分析,如圖7(a)、圖7(b)所示。

圖7 南京疫情交通管控事件積極與消極熱點主題詞
從負面評論的潛在話題來看,“機場”、“防控”、“封鎖”體現了網民們對疫情早期祿口機場封鎖的迫切期望以及對當地工作人員的不滿;“封城”、“出入口”、“雙向”、“措施”等主題詞反映出多處收費站、高速出站口雙向關閉后對市民的出行產生了影響。此外,市民的出行安全與市公安局交警大隊對城區道路實行交通管制等話題的討論熱度也很高。網友普遍認為,即使是在特殊時期,常規的交通規則和市公安局發布的管制措施仍應當嚴格遵守。
積極主題詞反映出網民對于市交通局發布的公告和管控措施的實施力度比較滿意。“檢測”、“核酸”、“街道”體現了市民積極配合當地社區完成好多輪核酸檢測。同時,城管及道路執勤人員對于各小區、路口的有序管理很重要,交管部門對于小區的合理管控也得到了網友們的認可。8 月末疫情得到控制,部分關閉的客運站解封后,市內公共交通恢復正常運營。
綜上所述,在消極主題詞中,多數網友對疫情期間,市內交通管控力度、人口流動以及高速路口封鎖的問題十分重視。限制了人員和車輛的流動,才能降低病情傳播的風險。同時,對于身處一線的醫生和交警等工作人員的生命安危感到擔憂。在積極主題詞中,網民們對于市內警務人員對市民的管理、引導比較滿意。封鎖的客運樞紐重新開通也解決了市民的出行困難。
結合LDA 主題分析結果,本文選取了事件下正負面占比最高的熱點主題詞作為研究對象。其在微博中出現的次數與時間序列的關系見圖8。

圖8 熱點主題詞隨時間變化趨勢
由圖8 可知,南京疫情下交通管控的正負面熱點話題討論熱度總體趨勢相似,疫情初期網民的注意力大多放在大型樞紐的管控、人員遷徙情況上,隨著疫情逐步好轉及部分違規事件的產生,群眾的目光才轉向市內的交通問題上。在8月中旬,隨著疫情的好轉,開放各大交通樞紐、恢復公交班線等話題達到了峰值。恢復正常工作、出行的市民情緒趨向積極,相關話題討論熱度也逐漸下降。
本文通過數據采集與預處理、情感分析與地理可視化、主題挖掘及演化技術,分析了網民對突發公共衛生事件下交通管制的看法、建議。由分析的結果可知,網民對此類事件情緒總體上是積極的。疫情期間,警務人員對交通合理的管控以及疫情逐漸得到控制等信息都讓網民們充滿了度過疫情的信心。從主題挖掘的結果來看,安全出行、客運樞紐管控等主題詞是網民關注的重點。現在新冠疫情已成為了常態化的突發公共衛生事件。根據本文輿情分析得到的結果,對今后突發公共衛生事件的管制措施提出了相應的改善建議:
⑴嚴格落實市交通局發布的交通管制措施。為了防止因車輛同行和人員流動導致的疫情擴散,無論是在疫情爆發期間或是疫情得到控制后,都需減少扎堆出行和不必要的外出,對于市內各個小區間實施封鎖,避免不必要的人員流動或群聚行為,嚴懲違規的出行者。
⑵嚴格管控各個高速路口、車站及機場出入口。仔細排查每一位進出的本地市民和外地市民的行程以及健康情況。如有發燒或身體狀況異樣的市民要及時隔離觀察。
⑶維護好市內正常的交通秩序。疫情期間違規行駛等情況依然存在。在特殊時期對于違規的交通行為更加不能忽視。
以上是基于研究結果總結出的突發公共衛生事件下交通管制的建議。在進行合理的交通管制的同時,也要對于微博等平臺的輿情信息進行正確的引導,避免虛假輿論的傳播。從輿論控制和交通管制兩方面考慮,可以更有效地輔助并控制疫情的傳播。