李瑩 楊士 唐靜 蔡繼永





關(guān)鍵詞:社會力量;災(zāi)后救援;自合作;文本聚類;主題模型
中圖分類號:TP321 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2023)08-0019-03
0 引言
自然災(zāi)害事件的發(fā)生往往會對社會造成巨大的損失[1]。如何在自然災(zāi)害發(fā)生時,快速、有序、高效地組織救援是當(dāng)今社會迫切需要解決的問題。
民間力量參與社會救助事業(yè)在我國古代就有記載[2],社會救援力量在災(zāi)后救援中承擔(dān)著重要的角色。在2008年2月,中國南方大部分地區(qū)遭遇了五十年不遇的冰凍災(zāi)害[3],為了讓救援活動順利開展,四面八方的社會組織成員積極地參與到此次抗凍救災(zāi)活動中。除此之外,社會組織在汶川地震、蘆山地震等災(zāi)后救援中也起到了重要的作用,這說明我國社會組織正在不斷發(fā)展和進(jìn)步。但是,社會組織在參與災(zāi)后救援過程中,也存在著職責(zé)不清、缺乏統(tǒng)一指揮調(diào)度、相互之間無協(xié)作等問題,因此明確救災(zāi)類社會組織的構(gòu)成,對其進(jìn)行統(tǒng)一的管理是目前亟待解決的問題。
本文根據(jù)關(guān)鍵詞“志愿”“應(yīng)急救援”“慈善”來收集社會組織信息以及其業(yè)務(wù)范圍,并結(jié)合TF-IDF與LSA主題模型對各類社會組織細(xì)化標(biāo)簽,通過主題聚類分析明確各社會組織在救援行動中的職責(zé)和任務(wù),以此來明確社會組織間災(zāi)后救援時的職責(zé)定位。文本主題聚類是將相似度較高的同種類型的文本聚合在一起,因為它不需要先驗知識,因此,是一種無監(jiān)督的機器學(xué)習(xí)方法。近年來,國內(nèi)外學(xué)者在文本聚類方面做了很多的研究。評價一個文本聚類的標(biāo)準(zhǔn)包括三個方面:聚類的質(zhì)量是否滿足應(yīng)用需求、聚類的效率是否高以及聚類的可視化是否清晰明了。本文采用TF-IDF與LSA主題聚類模型,對社會組織進(jìn)行細(xì)化標(biāo)簽,并根據(jù)困惑度選擇最佳主題數(shù)量,確定各類社會組織的救災(zāi)類型。
1 災(zāi)后救援中社會組織間自合作現(xiàn)狀分析
自2008年以來,我國的社會力量逐漸壯大,并積極投身于災(zāi)后救援工作。社會組織在參與救援時,具備很多社會優(yōu)勢,如能夠及時了解各種受災(zāi)群體的需求,并為其提供更專業(yè)化的救助等[4]。社會組織在參與救援的過程中也存在著一系列問題,如信息獲取渠道不暢通、信息內(nèi)容不對稱等。針對這些問題,國內(nèi)外學(xué)者也提出了一系列的解決方案,如張雷等人[5]在全方位分析災(zāi)后的需求后,采用基于優(yōu)化模型的分組算法,對地震災(zāi)害應(yīng)急救援隊伍的分組問題進(jìn)行求解,王薇等人[6]為了解決社會支援組織在突發(fā)事件中能力不足等問題,設(shè)置了5個一級指標(biāo)和18個二級指標(biāo)構(gòu)建能力評價體系,以此加強社會救援組織能力的建設(shè)。
目前,參與災(zāi)后救援的社會組織力量逐漸壯大,他們在參與災(zāi)后救援的工作時,并不是單打獨斗,而是共同協(xié)作的方式。
總體來說,不同救援類型的社會組織在災(zāi)后救援中擔(dān)當(dāng)著不同的角色,不僅包括資源收集者、行動倡導(dǎo)者、信息整合者,還包括專業(yè)服務(wù)者、組織連接者等,其供給鏈條如圖1所示。
當(dāng)自然災(zāi)害發(fā)生時,組織協(xié)調(diào)者負(fù)責(zé)對整個救援活動的流程進(jìn)行調(diào)度與策劃[7],并將信息收集組織收集上來的信息進(jìn)行整合,整合的信息通過網(wǎng)絡(luò)等方式傳遞出去。當(dāng)災(zāi)區(qū)外的社會組織成員接收到救災(zāi)信息后,開始向各方籌集物資,并派送專業(yè)的救援人員前往災(zāi)區(qū)展開救援。可以看出,災(zāi)區(qū)中的各類組織在其中發(fā)揮著不同的作用,單一類型組織難以應(yīng)對復(fù)雜多變的災(zāi)區(qū)情況,因此,需要組織間進(jìn)行橫向合作和資源共享,以此提高救援效率。
2 基于TF-IDF與LSA模型的社會組織聚類分析
2.1 TF-IDF模型
在此公式中,f表示單詞j在文檔i 中出現(xiàn)的頻率,N 表示總文檔數(shù),n表示文檔中出現(xiàn)單詞j 的文檔數(shù)量。該公式所計算的是某一文本的高詞語頻率,以及該詞語在文本集合中的低文本頻率,以此計算出高權(quán)重的TF-IDF,得出文本中的重要詞語。
2.2 LSA 模型
LSA(Latent Semantic Analysis) 是自然語言中基于潛在語義分析的文本主題獲取模型[9],LSA通過奇異值分解方法得到語句中的主題。該模型首先需要將文本轉(zhuǎn)化為單詞矩陣,然后設(shè)定特定數(shù)量的主題,對單詞文本矩陣進(jìn)行奇異值分解,以此來得到主題向量空間,其公式如式(3) 所示:
在該公式中,m 表示單詞的維度,n 表示樣本的個數(shù),k 表示主題數(shù)量,其中,m、n、k 滿足不等式,如式(4) :
LSA主題模型是將由文字轉(zhuǎn)化成的高維數(shù)據(jù)映射為具有較低維度的矩陣,減少了問題的大小,并給出了文字和文字的上下語義關(guān)系。
2.3 TF-IDF 與LSA 模型的主題分析
在該主題分析模型中,首先使用TF-IDF模型對文本進(jìn)行重要詞頻統(tǒng)計,得出TF-IDF矩陣,然后利用LSA模型分析,首先分析文本集合,根據(jù)文本信息建立Term-Document矩陣;建立后,對該集合進(jìn)行奇異值SVD分解,并對分解后的矩陣進(jìn)行降維,保留前n個主題詞;降維后,根據(jù)特定的主題數(shù)量,對文本中的主體進(jìn)行提??;最后,將社會組織救災(zāi)類服務(wù)主題提取出來。
2.4 數(shù)據(jù)采集
本文通過查詢中國社會組織公共服務(wù)平臺,以“志愿”“應(yīng)急救援”“慈善”三個詞為關(guān)鍵詞,搜索相關(guān)類型的社會組織信息,通過查找,獲取12 042個社會組織的業(yè)務(wù)范圍介紹(見表1) 。
在救災(zāi)工作范疇內(nèi),各個社會組織都有自己的職能。例如,一個公益類型的社會組織,其工作范疇主要包括:從事志愿者注冊管理、培訓(xùn)等工作,為志愿者發(fā)展創(chuàng)造機遇;承擔(dān)政府和相關(guān)單位所委派的各種社工服務(wù);組織社會工作者的專題研討、推廣及學(xué)術(shù)交流;推進(jìn)精神文明建設(shè)、社區(qū)建設(shè)、扶貧開發(fā)工作;協(xié)助老年人、助殘、關(guān)愛未成年兒童、救災(zāi)和大型社會性事件等;向有特別困難和需求的人士提供服務(wù)等。
2.5 數(shù)據(jù)預(yù)處理
數(shù)據(jù)采集結(jié)束時,為了防止因重復(fù)信息造成研究結(jié)論不正確,須進(jìn)行去重處理,確保各個文本的獨立性。為獲得大量有價信息,節(jié)約空間和提升統(tǒng)計質(zhì)量,對大量中文文本信息進(jìn)行去除停用詞的操作,本文將使用jieba分詞對大量中文文本信息進(jìn)行處理,部分詞頻的統(tǒng)計成果見表2所示。
2.6 主題挖掘
利用TF-IDF與LSA主題模型對社會組織業(yè)務(wù)范圍進(jìn)行主題挖掘。首先對預(yù)處理后的數(shù)據(jù)進(jìn)行關(guān)鍵詞提取和向量轉(zhuǎn)換,主題數(shù)目以圖1中社會組織供給鏈為基礎(chǔ),設(shè)置主題數(shù)范圍為[1,6]。
本文實驗的參數(shù)設(shè)置為a=1/K, β=0.01,高斯采樣的迭代次數(shù)設(shè)置為1 500次,LSA主題數(shù)根據(jù)模型困惑度計算結(jié)果見圖2所示。
從圖2中可以看出,當(dāng)主題數(shù)增加時,模型困惑度也逐漸減小,并逐漸趨向穩(wěn)定狀態(tài)。因此,本實驗的主題數(shù)設(shè)置為6。
3 實驗結(jié)果分析
根據(jù)LSA主題模型聚類結(jié)果,總結(jié)出七個社會組織服務(wù)類型,見表3。
從分析結(jié)果可以看出,我國的救援類社會組織呈現(xiàn)多元化發(fā)展,如專業(yè)救援組織,其主要從事的是有關(guān)于自然災(zāi)害的救援工作,其占比數(shù)達(dá)到15.2%;以救助區(qū)兒童為主要救援工作的社會組織占比數(shù)為8.4%;公益類型的社會組織,占比數(shù)達(dá)到21.1%。從表3中的七個主題來看,我國的社會救援組織是災(zāi)后救援的重要力量,不同救援的社會組織發(fā)揮著不同的作用。
4 結(jié)論
本文采用TF-IDF和LSA算法對國內(nèi)災(zāi)害救助中的各類社會力量組織進(jìn)行了聚類分析,以此加強其自我協(xié)作能力。因為社會組織在救災(zāi)工作的特殊性,其在救災(zāi)工作中所扮演的角色不盡相同,而其各自的特點也有所區(qū)別。因此,有效橫向協(xié)作與垂直協(xié)作可以大大提高救援效率。并且高效的協(xié)作方式對拯救受災(zāi)群眾的生命和財產(chǎn)具有重要意義。研究表明,在災(zāi)害發(fā)生后,隨著社會組織的規(guī)模越來越大,其提供的服務(wù)類型也越來越多,這些社會組織之間的協(xié)作是提高救援效率的有效途徑。因此,明確社會救援組織類型,提前做好災(zāi)前部署是極其重要的。