999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

疫情背景下圖書館輿情感知與監(jiān)控策略探析

2022-02-08 10:24:33王海川
內(nèi)蒙古科技與經(jīng)濟 2022年1期
關鍵詞:圖書館文本疫情

王海川

(河北工程大學,河北 邯鄲 056038)

在信息化的時代,社交網(wǎng)絡的飛速發(fā)展給人們的生活與學習帶來了深刻影響,人們在身處現(xiàn)實世界的同時,普遍熱衷于在虛擬世界尋求“身體在場”與“精神在場”的空間秩序的體驗,虛擬的社交網(wǎng)絡是對現(xiàn)實世界的投射,又不可避免地對現(xiàn)實世界產(chǎn)生影響。因此,各行業(yè)特別是服務行業(yè)非常重視用戶在社交網(wǎng)絡中的相關評價。圖書館從本質(zhì)上來說也是一類服務行業(yè),其服務品質(zhì)的優(yōu)劣直接影響到讀者對于知識的獲取、內(nèi)化的水平。2020年,一場席卷全世界范圍的新型冠狀病毒肺炎疫情至今沒有停息,該種病毒極具傳染性,這一特性甚至重塑了人們在線下公共場所活動的規(guī)則與秩序,產(chǎn)生了深遠的現(xiàn)實影響。在這一背景下,圖書館應當給予線上用戶評價同樣的重視,即應當對網(wǎng)絡用戶相關評價進行監(jiān)測。

1 概念及研究現(xiàn)狀

圖書館的網(wǎng)絡監(jiān)測分為兩個部分,即公眾形象感知和突發(fā)事件監(jiān)測。前者代表用戶的日常評價所形成的圖書館認知體系,后者代表了圖書館在突發(fā)事件時在網(wǎng)絡中的檢測、預警和化解的能力。這是圖書館輿情監(jiān)控系統(tǒng)的兩個重要組成部分。

對于前者,陽玉堃在社交文本海量采集的基礎上,從基礎設施、館員服務、機構(gòu)管理、館藏文獻等方面對文本進行剖析,并結(jié)合了關鍵詞、高頻詞、語義網(wǎng)絡等技術,將對于圖書館不同方面的印象進行了可視化的展示,這為讀者感知研究提供了新的途徑[1]。

對于圖書館的突發(fā)事件,張偉認為應當建立輿情信息預警平臺,要主動收集,分析涉及圖書館公共安全方面的信息,對于危機事件要能夠及時了解,分析和預警,以保證館舍的安全[2]。但是該文對于系統(tǒng)架構(gòu)技術論述較少。馬益勇則認為應當設立圖書館輿情崗位,建立圖書館館外合作機制,并且做好輿情監(jiān)測的統(tǒng)籌角色,集思廣益,提高圖書館在各個領域的角色價值。

總體來看,對于圖書館輿情監(jiān)測方面的研究還較少,且未結(jié)合疫情這一新的背景形勢。因此,筆者的選題具有一定的現(xiàn)實與研究價值。

2 疫情給圖書館輿情監(jiān)測工作帶來的挑戰(zhàn)

首先是圖書館在決策層面上需要給予足夠的重視,要充分認識到疫情情況下,任何公共事件的發(fā)生都具有更大的危險性,不僅會影響到正常的工作秩序,更會在網(wǎng)絡上引發(fā)較大的事件漲落,因此如何處理、如何防范、如何善后,這是新問題帶來的新挑戰(zhàn)。

疫情的流行改變了人們在圖書館等公共場所的活動規(guī)則,即在正常情況下可以開展的閱讀推廣、講座、會議等必須改為在線上進行,這意味著會后更多的圖書館用戶也會傾向于在網(wǎng)絡中針對圖書館的服務、管理、館藏文獻水平以及館舍硬件好壞發(fā)表感想,進行討論,同時對圖書館在線服務水平進行評價,這會使得相關的關鍵詞大幅增加。

在疫情期間,由于人們的心理狀態(tài)處于相對敏感時期,各項線下防疫措施較為嚴格,各項活動安排會受防疫工作影響,因此相應的,在圖書館這類公共區(qū)域,突發(fā)事件的發(fā)生概率也會較高。那么就意味著,在社交網(wǎng)絡中,相關事件漲落發(fā)生的概率也較大。事實上,即使在平時,圖書館相關的網(wǎng)絡熱點事件也是存在的。例如在2018年12月份,安徽某學院的一位學生在圖書館大廳背書,因為聲音較大而與管理員發(fā)生口角,并進而發(fā)展為摔杯子事件。這一事件在社交網(wǎng)絡上被持續(xù)關注,評論數(shù)為6 193,轉(zhuǎn)發(fā)數(shù)為2 300,點贊數(shù)為7 600。這在圖書館的相關事件中的關注度是較高的。又如2019年山東某大學的兩名同學在圖書館因爭搶座位而打架,最終被學校處以警告處分,并被圖書館列入讀者黑名單。這一事件在微博上引起軒然大波,至今閱讀量已達206萬,評論及轉(zhuǎn)發(fā)也達5 000余次。這是圖書館輿情分析的重要資源。那么在疫情期間,可以推知的是,在社交網(wǎng)絡中,這類圖書館公共事件勢必會與疫情因素相互疊加,產(chǎn)生更大的影響力和傳播力。這是圖書館工作需要特別關注的。

在技術的應用上,疫情背景下的輿情監(jiān)測,需要圖書館加強對包含特定關鍵詞數(shù)據(jù)的探測,及時掌握用戶情緒動向,特別是要警惕謠言的產(chǎn)生與辨別,平臺要具有發(fā)現(xiàn),分析研判,上報甚至報警功能,這也是疫情背景下對輿情工作提出的挑戰(zhàn)。

在疫情背景下,社交網(wǎng)絡中的相關數(shù)據(jù)量激增,而且在相當長的一段時間內(nèi)必將持續(xù)產(chǎn)生大量相關文本,這對系統(tǒng)可靠度提出了更高的要求。事實上,在疫情常態(tài)化的實際情況下,如何增強冗余性,保證疫情監(jiān)控平臺的長期,不間斷的運行,這是對圖書館輿情監(jiān)測提出的又一項挑戰(zhàn)。

3 輿情監(jiān)測平臺的技術架構(gòu)

輿情平臺的基本架構(gòu)涉及數(shù)據(jù)采集、模型訓練、數(shù)據(jù)處理、結(jié)果輸出等多個環(huán)節(jié),需要利用爬蟲、分類器、模型訓練等多種技術。

3.1 數(shù)據(jù)爬蟲

爬蟲是輿情檢測系統(tǒng)的前端模塊,它的主要作用是模擬瀏覽器向特定的網(wǎng)站HTTP發(fā)送網(wǎng)絡請求Request,接受請求響應,按照一定的規(guī)則,自動的抓去網(wǎng)站信息上并獲取數(shù)據(jù)到本地。這是一種代替人工的自動化模塊。按照不同的類型,爬蟲可以分為通用爬蟲、聚焦爬蟲、功能性爬蟲、數(shù)據(jù)增量爬蟲等。一個完善的爬蟲模塊應當是框架結(jié)構(gòu)合理,獲取技術優(yōu)良,高度優(yōu)化的代碼,容易管理和維護。在通常的輿情檢測系統(tǒng)中,爬蟲的運行是以周、月來計算的,數(shù)據(jù)量非常大,優(yōu)秀的爬蟲設計能夠保證系統(tǒng)在這一過程中少犯錯誤。同時,爬蟲在實現(xiàn)數(shù)據(jù)采全的基礎上,要做到較少的占用資源。對于爬蟲來說,主要的判斷標準有:獲取時間、請求解析時間、腳本支持、CPU占用等。此外,長時間運行的爬蟲還應當保證不會出現(xiàn)內(nèi)存泄漏。目前一些網(wǎng)站安裝有反扒策略,例如,網(wǎng)站后臺會監(jiān)控來自同一IP地址的大量訪問,或者要求必須要有訪問賬號,或者是不定時彈出驗證碼識別等。而爬蟲要能夠模仿人類操作,采取聯(lián)合爬取,自動注冊賬號,模擬User-Agent,訪問時帶cookie等。

3.2 數(shù)據(jù)預處理模塊

數(shù)據(jù)分析模塊集中了一系列數(shù)據(jù)預處理、數(shù)據(jù)分類、主題抽取等技術。在預處理功能中,包括分詞,移除微博文本中的網(wǎng)絡符號、超鏈接、亂碼、停用詞、重復數(shù)據(jù)清除、非漢語清除、大小寫轉(zhuǎn)化等,總之就是清除所有的不規(guī)范數(shù)據(jù),將主要文本的微博數(shù)據(jù)轉(zhuǎn)換為規(guī)范數(shù)據(jù),減少數(shù)據(jù)噪聲,得到質(zhì)量更好的數(shù)據(jù)。目前Python語言的一些庫,如Jieba、Numpy等被用來實現(xiàn)上述功能。

接下來是文本特征提取,這是監(jiān)測系統(tǒng)中對文本重點詞匯進行分析的環(huán)節(jié),是用來區(qū)分。最常用的有TF-IDF,其基本思想是在一段文本中出現(xiàn)多次的單詞,再另一個同類文本中也會出現(xiàn)多次,反之,一個單詞很少在一個文本中出現(xiàn),那么其在同類文本中也很少會出現(xiàn),這就能夠衡量出該詞的特征區(qū)別度,即字詞的重要性隨著它在文本中出現(xiàn)的次數(shù)呈正比增加,但隨著該詞在語料庫中出現(xiàn)的頻率成反比下降。這一算法被廣泛地應用在了各類檢索模型。

另一個常用算法是信息增益(IG),其基本思想是衡量該詞能夠為系統(tǒng)帶來多少信息,帶來的信息越多,該特征就越重要。即信息熵的改變程度。此外,還有獨熱編碼,互信息等算法可供選擇。

3.3 分類模型構(gòu)建

分類模型的構(gòu)建是輿情監(jiān)測系統(tǒng)的核心。也是學者研究較多的方面,在機器學習的時代,貝葉斯、向量積、決策樹、集成學習、邏輯回歸等都能完成這一任務,其中,貝葉斯算法較為簡單和經(jīng)典。它認為,在文本中,兩個詞之間的關系是相互的,一個對象的特征向量中每個維度都是相互獨立的。在訓練階段,貝葉斯程序能夠從詞袋中收集信息,學習每一種兩兩詞組合的后驗概率,通過比較概率的大小來得到文本所屬的類別。一般來說,對于社交文本的文本分類來說,上述算法是能夠完成任務的,但是目前,神經(jīng)網(wǎng)絡算法正被得到廣泛的應用,這類算法模擬人腦工作的原理,構(gòu)建出很多個神經(jīng)元,其本身具有輸入層、隱藏層和輸出層,之間的計算辦法就是加權求和激活,即Sigmoid函數(shù)。以TextCNN為例,這些算法能夠?qū)⑽谋窘馕鰹榫仃嚕褪菍⒂柧毤奈谋咎卣飨蛄炕斎耄诮?jīng)過連接點權重傳入下一層,這一層的輸出是下一層的輸入。自然語言是一維數(shù)據(jù),向量化進入卷積層后與卷積核做一個point wise的乘法后求和,然后是卷積。接下來,算法掃描向下滑動,持續(xù)輸入,持續(xù)做point wise乘法后求和,然后是池化層,以降低參數(shù)的數(shù)目。最后由softmax函數(shù)做分類。這是一個基本的流程。神經(jīng)網(wǎng)絡算法的優(yōu)點在于是具有較強的非線性映射能力,實現(xiàn)了從輸入到輸出的映射功能。此外,神經(jīng)網(wǎng)絡還具有一定的泛化能力,對于新的或者帶有噪聲的數(shù)據(jù)也能有較好的分類能力。

目前,神經(jīng)網(wǎng)絡算法發(fā)展出了遞歸神經(jīng)網(wǎng)絡、卷積神經(jīng)網(wǎng)絡等,并且自注意力機制等也逐漸被加入進來,算法機制逐步成熟。因此,神經(jīng)網(wǎng)絡算法模塊是數(shù)據(jù)解析模塊的首選算法。

3.4 分析結(jié)果管理模塊

在一個成熟的監(jiān)控系統(tǒng)中,目標文本應當能夠被按照各種口徑進行劃分,比如某個事件段的情感比例、情感數(shù)量、高頻詞匯、關鍵詞語義網(wǎng)絡、文本主題分類、用戶行為分析等,并且能夠可視化的輸出時序圖、分類圖等,以供使用者參考和決策輔助之用。

3.5 數(shù)據(jù)庫

數(shù)據(jù)庫的作用是用來存儲爬蟲所收集的數(shù)據(jù)字段內(nèi)容,對于社交網(wǎng)絡文本,往往包括了發(fā)布者、文本內(nèi)容、發(fā)布時間、點贊數(shù)、轉(zhuǎn)發(fā)數(shù),評論數(shù)和評論文本、發(fā)布用戶等字段,以被調(diào)用和存儲分類結(jié)果。

4 疫情背景下輿情系統(tǒng)的改進策略

新冠肺炎疫情是圖書館在發(fā)展中面臨的新課題,綜合以上所述,圖書館輿情監(jiān)測工作應當從管理和技術兩個方面進行改進。

4.1 管理方面的改進

圖書館是社會、學校中理所當然的公共場所,并且閱讀活動具有一定的私人性質(zhì),小規(guī)模聚集,討論是應有之義。那么在此時的輿情監(jiān)測方面,①應當成立專門的管理小組,專人負責,集中利用系統(tǒng)定制收集讀者對于圖書館文獻服務、館舍布局、疫情防控措施等方面的意見建議。②要注意疫情期間輿情信息的公開透明,對內(nèi)部應當充分共享,以利于合作防控,對于外部要及時生成輿情期間的輿情監(jiān)測報告,下情上達。要特別關注開學、學期末期、學生畢業(yè)等關鍵節(jié)點的輿情監(jiān)測工作,發(fā)揮系統(tǒng)的技術優(yōu)勢。同時要做好基于疫情報告的引導工作,及時發(fā)現(xiàn)問題,制定措施,解決問題。注意信息的對外及時公布,避免引起恐慌。

4.2 技術方面的改進

目前,基于神經(jīng)網(wǎng)絡算法的分類器技術發(fā)展迅速,BERT,Transformer,self-attention等技術的加入使得分類的準確度更高,運行速度更快,系統(tǒng)學習率更高,因此應當采用最新技術來提高系統(tǒng)性能。

在疫情背景下,輿情分析系統(tǒng)應當能夠有重點的實施日常和突發(fā)事件中的監(jiān)控行為。①語義分析,即需要分析“疫情”“新冠”等特定關鍵詞所聯(lián)系較多的詞匯有哪些,這些詞匯那些與圖書館由關聯(lián),那些直接指向圖書館的服務,應當被明確。②情感分析。文本的情感分析是輿情分析中重要的一個方面,如前所述,疫情期間用戶的情緒與平時相比較為敏感,因此輿情系統(tǒng)應當感知到日常閱讀活動中讀者的情緒有哪些是消極的,那些是積極的,而這些積極與消極的情緒所指向的圖書館服務的那些方面也應當明確。③目前,國內(nèi)的疫情已經(jīng)持續(xù)一段時間了,在這期間,關于疫情的關鍵詞在不斷地變化,死亡率、感染率、無癥狀、環(huán)境等詞匯,系統(tǒng)應當增加基于這些關鍵詞的疫情態(tài)勢圖,同時應當注意與圖書館、閱讀等詞匯共線的文本都是哪些,并展開深入研究。

猜你喜歡
圖書館文本疫情
戰(zhàn)疫情
抗疫情 顯擔當
人大建設(2020年5期)2020-09-25 08:56:22
疫情中的我
37°女人(2020年5期)2020-05-11 05:58:52
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
飛躍圖書館
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
圖書館里的是是非非
主站蜘蛛池模板: 日日噜噜夜夜狠狠视频| 天堂亚洲网| 国产香蕉一区二区在线网站| 亚洲日韩久久综合中文字幕| 在线不卡免费视频| 欧美成人亚洲综合精品欧美激情| 国产尤物视频在线| 极品私人尤物在线精品首页| 看国产毛片| 日本精品一在线观看视频| 在线播放91| 亚洲成综合人影院在院播放| 九色视频一区| 青草免费在线观看| 国产精品久久自在自线观看| 色噜噜综合网| a级毛片免费在线观看| 自拍中文字幕| 久久精品人妻中文视频| 国产精品七七在线播放| 国产精品理论片| 国产网友愉拍精品| 中文字幕亚洲精品2页| 91 九色视频丝袜| 毛片三级在线观看| 午夜福利视频一区| 亚洲日产2021三区在线| 中文字幕啪啪| 国产尤物视频在线| 欧美三级视频在线播放| yy6080理论大片一级久久| 亚洲女同一区二区| 国产成本人片免费a∨短片| 精品视频在线观看你懂的一区| 少妇极品熟妇人妻专区视频| av尤物免费在线观看| 天天色综合4| 国产成人精品一区二区不卡| 中文字幕亚洲另类天堂| 亚洲欧美一区在线| 日本午夜视频在线观看| 亚洲精品综合一二三区在线| 亚洲av日韩av制服丝袜| 91视频免费观看网站| 第一页亚洲| 亚洲,国产,日韩,综合一区 | 激情视频综合网| 久久综合伊人77777| 国产国拍精品视频免费看| 日本亚洲欧美在线| 天堂在线视频精品| 国产xxxxx免费视频| 国产精品成人一区二区不卡| 成人在线亚洲| 免费网站成人亚洲| 91久久偷偷做嫩草影院免费看| 精品国产网| 亚洲欧洲免费视频| 日本一区高清| 欧美视频免费一区二区三区| 成人一区在线| 日韩无码真实干出血视频| 九九视频免费看| 色九九视频| 黄片一区二区三区| 欧美一区二区三区不卡免费| 天天色天天操综合网| 国产精品成人第一区| 亚洲91精品视频| aⅴ免费在线观看| 全午夜免费一级毛片| 国产成人狂喷潮在线观看2345| 美女一区二区在线观看| 欧美人在线一区二区三区| 日韩国产亚洲一区二区在线观看| 91成人免费观看| 草逼视频国产| 亚洲第一黄色网| 丰满的熟女一区二区三区l| 永久免费av网站可以直接看的| 国禁国产you女视频网站| 亚洲va视频|