劉艷茹,郭海彧
(1.東北財經大學公共管理學院,遼寧 大連 116025;2.武漢大學社會學系,湖北 武漢 430072)
改革開放40年,中國社會階層結構發生了巨大變化,階層再生產已成為社會流動的顯著特征。20世紀90年代以來,隨著高等教育由精英教育向大眾教育的普及,就業場域成為個體向上流動的角逐場,大學生初次就業市場機制的穩定性和獨立性表現出更為固定的階層分野[1],加大大學生初次就業的風險。涂爾干[2]曾提出,從階層的視角研究社會資本,是社會學區別于其他學科的一個根本尺度。社會資本這一概念可以解釋微觀個體的互動,并通過階層位序對社會群體進行區分,從而與大學生初次就業產生緊密關聯。在中國社會,以家族為中心、以血緣和婚姻關系為紐帶的傳統社會文化決定了社會資本對大學生初次就業的重要意義[3]。強弱關系是社會資本的重要衡量尺度,在尋找工作中,是強關系還是弱關系重要,國內外社會學家各持一說。
國外學者關于強弱關系對職業地位獲得的研究多始于20世紀六七十年代,他們更關注弱關系對就業的影響。Granovetter[4]的弱關系力量假設成為重要的理論基礎,更小的親密度、強度、交往頻度的弱關系連接著較多的異質性資源,從而與更加廣闊的勞動力市場相連接。20世紀80年代,林南[5]從階層的視角提出位置強度命題,即越靠近網絡中的橋梁,個體在工具性行動中越可能獲取更好的社會資本。初始位置越好,行動者越有可能獲取和使用更好的社會資本。近年來,學者從強弱關系的雙重視角對就業問題進行量化研究,一方面,Arza和Carattoli[6]驗證弱關系效用,即弱關系可以成為促進就業的因素,如可以拓寬就業選擇領域,Menon等[7]認為,廣泛的弱關系可以提高就業滿意度;另一方面,也有學者強調,當個人就業依靠的弱關系效用欠佳時,強關系可以作為一種信任程度的補充進而促進就業。國內學者費孝通[8]提出,社會關系結構的差序格局,即根據社會關系的親疏遠近結成 “近強遠弱”的社會關系網絡,差序格局下社會關系網絡的構建為個體的生存發展提供重要的資源。鑒于此,強弱關系的二元對立成為大學生初次就業研究的重要前提。一方面,有學者強調強關系介入的重要性[9-10],強關系擁有的決策權對于就業職位的獲取產生更大的效用[11-12];另一方面,喬志宏等[13]認為,當社會存在就業信息獲取不平等、發布不完全時,弱關系更主要體現在體制外勞動力市場就業信息的獲取。
綜上所述,在相關社會資本理論的基礎上,國內外學者更傾向于利用傳統定量分析模型進行強弱關系效用的驗證性研究。但是由于社會文化背景差異、數據來源和構建模型的不同,強弱關系效用對大學生初次就業的影響尚未達成共識。近年來,文本挖掘技術作為數據挖掘的一個新主題,打破了傳統的定量分析與定性分析的局限性,以文本信息為分析對象,通過識別和檢索有價值的信息和知識,來探尋文本內在結構所隱含的內容。這一方法為文本信息的整理、分析和挖掘提供了有效手段。鑒于此,筆者在搜集和整理大量文本信息后,運用文本挖掘技術探尋大學生初次就業研究的新思路。通過文本清洗、關聯規則模型的建立,探尋不同強度的社會關系在大學生初次就業中的作用機制與實際效用;研究在特定文化與家庭背景下強弱關系在大學生初次就業中的作用及其效用;思考強弱關系最終效用的發揮是否被打上階層的烙印,以期為教育公平議題的展開賦予新的研究思路。
鑒于問卷調查本身的局限性,本文以2014屆、2015屆和2016屆應屆畢業大學生為調查對象,以其初次就業情況、動用強弱社會關系狀況為主要調查內容,利用半結構式訪談搜集定性資料,最終得到550份有效樣本。
邊燕杰和張文宏[14]將社會關系分為親屬關系、朋友關系和相識關系。胡永遠等[15]提出,可以從互動頻率、感情強弱、親密程度和互惠交換四個維度衡量社會資本的效用狀況。Tan等[16]從交流頻率和親密性兩個維度界定關系的強弱程度,并進一步分析強弱關系對信任、互惠規范和認同的影響。鑒于此,筆者在訪談過程中,在界定關系人與受訪者的關系強度時,根據血緣關系、交往頻率和置信度因素,由訪談員界定其關系強度。本文從網絡結構觀的視角研究強弱關系與大學生初次就業之間的關聯性,并據此建立研究假設,驗證強弱關系在大學生初次就業中是否表現出情感性工具性特征,為下一步文本信息的預處理提供參考依據。根據訪談提綱,現建立以下三個研究假設:
假設1:社會關系越弱,獲取的社會資本越可能通過就業信息的形式對就業產生正向影響。
假設2:社會關系越強,獲取的社會資本越可能正向地影響表達性行動的成功。
假設3:初始位置與強弱關系的發揮具有一定的關聯性。
1.LDA主題模型
LDA主題模型是由Blei等[17]提出的文檔主題生成模型,該模型認為每一篇訪談文檔的每一個詞語都是通過一定的概率選擇了某個主題,并從這個主題中以一定的概率選擇了某個詞語,相關概率依據訪談文檔、主題詞語和主題三層結構的貝葉斯概率進行計算。通過LDA主題模型,能夠清晰地挖掘文本數據中的潛在主題,并以特征詞語的方式將潛在主題呈現出來。
LDA模型主要思想是將每一篇訪談文檔轉化為一個詞語頻向量,并且每個訪談文檔對應的詞語表由一個L維向量構成;每一個主題由N個主題詞語構成,并記為d=(w1,w2,…,wN),則每個主題集D記為D=(d1,d2,…,dN);假設M個訪談文檔分布著K個主題,表示為zi(i=1,2,…,K)。LDA主題模型假定每個訪談文檔由不同主題按一定比例隨機混合而成,相應的混合比例服從多項分布。由此,在主題di條件下出現主題詞語wi的概率可以表示為:
(1)
其中,P(wi|z=s)表示主題詞語wi屬于第s個主題的概率;P(z=s|di)表示第s個主題在主題di中的概率。
LDA主題模型對參數的近似估計通常使用馬爾科夫鏈蒙特卡洛(Markov Chain Monte Carlo, MCMC)算法中的一個特例Gibbs抽樣。利用Gibbs抽樣對LDA模型進行參數估計,其估計方程表達式如下:
(2)
其中,zi=s表示主題詞語wi屬于第s個主題;z-i表示其他所有詞語;ns,-i表示不包含當前主題詞語wi的被分配到當前訪談文檔zs下的訪談文檔個數。通過對主題模型參數估計方程的推導,可以得到主題詞語wi在訪談文檔zs中的分布參數估計值φs,i和訪談文檔zs在主題di中的多項分布參數估計值θi,s,兩個估計值的表達式如下:
(3)
其中,ns,i、ni,s和wi表示主題詞語wi在訪談文檔zs中出現的次數。
2. LDA主題模型的構建
在大量的非格式化訪談文檔數據集中,蘊藏著大量的主題不相關和主題偏離詞語,對后續就業質量與社會資本的關聯性分析產生偏離主題的干擾影響,很難發現訪談文檔中各種關聯的主要關聯關系。本文在進行關聯性分析前,引入基于LDA的主題模型,對各訪談文檔中的主題詞語進行提取,使各訪談文檔的主題鮮明,通過LDA主題模型重構就業質量與社會資本關聯分析的訪談文檔購物籃。
首先,家庭年收入、父母受教育狀況和職業狀況都是家庭社會經濟地位的重要衡量指標,能綜合地反映一個家庭的社會經濟狀況。鑒于此,本文將家庭地位按照父母工作性質、職位和工資等分為三個主題,偏上、中等和偏下分別代表受訪者的初始位置,所占比重分別為20%、50%和30%。
其次,通過四個訪談問題,分析強弱關系在大學生初次就業中的效用。為使關聯性分析的訪談文檔購物籃更為清晰,本文用提取的主題詞語對原始訪談文檔進行規范化處理。通過主題模型分析,當主題個數為3時,困惑度值為68.6949,此時主題模型效用最為明顯。具體如表1所示。

表1 LDA主題模型分析結果統計
在對訪談文檔進行預處理的基礎上,關聯規則挖掘構成文本挖掘的重要內容。作為數據挖掘的核心技術之一,通過在給定的數據集中尋找項目之間聯系的過程,可以從大量數據中發現項集之間的關聯或相互關系,以期解讀個體的家庭社會關系與大學生初次就業的關聯性或制約性。關聯規則的形式一般記為:X→Y,其中,關聯規則左側項集X為先決條件,右側項集Y為相應的關聯結果,用于表示數據內隱含的關聯性。關聯規則強度的控制和評價由三個重要概念構成,即支持度、置信度和提升度。在下文的關聯性分析中,將在一定的評價標準基礎上構建文本內以及文本間的關聯圖。
值得說明的是,本文采用Apriori算法進行關聯規則挖掘,該算法利用逐層搜索的迭代方法找出數據庫中項集的關系,以形成規則,其過程由連接(類矩陣運算)與剪枝(去掉那些沒必要的中間結果)組成,目的是從數據庫中挖掘出那些支持度和置信度都不低于給定的最小支持度閾值和最小置信度閾值的關聯規則。
在中國,能夠賦予大學生個人能力提升的資源相對有限,在就業這一節點上,家庭社會資本的作用逐漸凸顯,松散的弱關系或熟人構成的緊密網絡均構成其成員的社會資本[18],即社會資本以家庭為中心實現增大與自我強化。不管是強關系還是弱關系,均是個體與個體之間在互動過程中實際存在的一種紐帶關系。利用靈活的社會關系網絡進行社會交換,以實現前期投入的實質性回報,增加已有資本的積累。本文首先將大學生初次就業中動用社會關系的個體篩選出來,結果顯示,在550份有效樣本中,動用社會關系的有300份,其中,動用弱關系的占32%,動用強關系的占68%。在此信息基礎上,通過文本技術挖掘強弱關系與大學生初次就業的關聯性,闡釋社會關系網絡在大學生初次就業中的作用機制,驗證強弱關系在大學生初次就業中的效用是否凸顯。
值得說明的是,在本文中并未使用量化的指標體系來判斷個體間的強弱關系。盡管個體間的關系強調血緣性、地緣性、業緣性,但是個體間關系的形成和發展機理均有其特殊性。例如,日常交往頻率不高、情感主導下的親密朋友關系也是常存在的,且這種特殊性可以通過心理暗示在群體內選擇加以強化。鑒于此,在訪談過程中,訪談員主要是基于情感、熟悉度和交往頻率等方面來解釋強弱關系的內涵,社會關系網絡之間關系強度由受訪者根據自我感覺來判斷。
社會交往的頻率和緊密性較弱的關系即為弱關系,弱關系所構成的群體是一個相對開放且寬松的群體,群體規模相對也比較龐大。林南[5]在對社會資本進行測度時,提出社會資本具有異質性,關系越弱,行動者越有可能獲取異質性的社會資源,即資源的非相似性與互動和情感的缺乏有關。格蘭諾維特[19]也強調弱關系的重要性,認為有關工作的信息是敏感和微妙的,行動者也許不相信非個人來源的信息,反而依賴于所認識的那個人。處于社會關系網絡中的理性行動者,其社會交往往往具有功利性目的,嵌入社會關系中的資源可以增強行動的效用[20]。

圖1 弱關系與大學生初次就業的關聯性
利用主題模型提取的詞語頻建立關聯規則,模型的支持度、置信度和提升度分別設置為0.2500、2.0000和0.8000,關聯規則結果如圖1所示。由圖1可知,弱關系的兩種效用凸顯出來,即弱關系可能通過提供信息或推薦,成為實現大學生初次就業的有效途徑。
個人網絡關系鏈條的延伸擴展了就業信息的獲取渠道,利用就業信息進而改善就業機會,提高就業效率,為提高就業質量提供更多可能,確實發揮良好就業的有效配置功能。綜上分析,社會關系越弱,獲取的社會資本通過就業信息的形式對就業產生正向影響,上述分析結果驗證了假設1。
社會資本本身是一個中性概念,作為家庭資本的最直觀體現,在經濟發展過程中具有非均勻分布的特征,基于血緣關系的家庭社會資本作為先賦性資本的內核[21],通過家庭內部的親密合作使得強關系得以維系,體現其延展性、繼承性、排他性。強關系構建的社會關系網絡相對封閉,在群體內部共享資源的可能性被大大提高,這就在一定程度上限制了資源向群體外成員的滲透。相對應地,外界信息的傳入機制也相對閉塞,通過設置嚴格的規則,社會關系網絡阻斷群體外成員獲得利益,具有信息不對稱性。波茨[22]利用“排斥圈外人”來解釋社會資本的這一消極后果。
通過數據分析可知,動用社會關系找工作的群體中,動用強關系的受訪者占68%。結合LDA主題模型建立關聯規則,模型的支持度、置信度和提升度分別設置為0.3500、2.0000和0.8000,模型的擬合效用良好。分析結果如圖2所示。由圖2可知,動用一次及以上強關系的群體被凸顯出來,從強關系的作用形式來看,主要表現為直接提供就業崗位。值得說明的是,這并非表明強關系不具有其他效用,僅表明在關聯規則建立中,由于支持度和置信度較低,其他效用難以凸顯。

圖2 強關系與大學生初次就業的關聯性
社會整合取決于廣泛的群際交往,取決于不同階層的個體面對面的交往。在尋找工作過程中,求職者所處的社會階層以及與網絡人的關系強度在很大程度上決定了社會資本是否具備優勢。鑒于此,根據前文提取的主題模型(結合表1),將大學生初始位置與初次就業中使用的強弱關系建立關聯規則,進一步驗證社會階層與強弱關系之間是否顯著相關。值得說明的是,為便于統計分析,本部分所涉及的強弱關系也是在初次就業中實際發生作用的社會關系。
通過對大學生“如何動用社會關系尋找工作的過程”進行關聯規則挖掘,家庭處于偏上階層、動用一次社會關系與強關系能夠建立特征明顯的關聯圖,即社會關系在較高階層具有更為靈活的運作空間。模型通過置信度和支持度檢驗,即家庭處于偏上階層的大學生,通過強關系進行資源轉讓,實現了互惠預期。具體結果如圖3所示。 由圖3可知,強關系效用的發揮依賴于群體內成員的認同,在社會流動中發揮著重要作用。家庭處于偏上階層的大學生,強關系往往在受教育程度、職業層次和收入狀況等社會經濟地位較為相似的階層內部構成,在社會交往過程中利用強關系基于較強的動機發生顯著效用,可以獲得更為有效的社會資源,將個人階層地位優勢轉化為社會網絡和社會資本優勢。
值得說明的是,家庭處于偏上階層的大學生,在工具性行動中更可能跨越階層障礙擴展自己的社會交往圈,這在一定程度上可以減弱信息的同質性弊端。
通過對大學生初次就業中實際動用社會關系狀況的訪談文檔進行預處理,構建主題模型,提取出中等階層、“動用一次關系”“弱關系”等高詞語頻,弱關系作用的發揮往往混雜在正式與非正式手段之中,通過建立關聯規則(如圖4所示),弱關系在中等階層卻發揮了顯著的效用,通過動用一次弱關系可以實現就業,模型最終通過置信度和支持度檢驗,擬合效用良好。由圖4可知,相對于強關系,弱關系比較松散,盡管并不能保證將就業信息直接傳遞給很多人,但是,由于可以在不同社會經濟地位特征的個體間發生,使得潛在信息接受者的數量可能會更多,因而弱關系表現出更強的延展性,甚至在有些情況下,弱關系在社會資源上超越強關系可以接近的領域。

圖3 家庭處于偏上階層的分析

圖4 家庭處于中等階層的分析

圖5 家庭處于偏下階層的分析
人口的結構性限制對社會關系起到決定性作用,地位的差異性使得社會交往的差異性逐漸凸顯。在非正式渠道初次就業中,社會關系對最終就業結果并非一定表現出顯性效用。對家庭處于偏下階層的個體動用社會關系信息進行預處理可知,家庭處于偏下階層的受訪者未動用社會關系的比例相對大一些,關聯規則結果顯示,實際動用社會關系未表現明顯的強或弱的特性。具體結果如圖5所示。
由圖5可知,家庭處于偏下階層的大學生,以血緣關系為基礎形成社會支持網絡相對較窄,社會關系的親疏程度顯得尤為重要。另外,網絡關系人的社會階層地位也在很大程度上決定了其在初次就業中的實際效用狀況,即家庭處于偏下階層的大學生其網絡關系人在關系強度與社會階層之間具有較強的不確定性。
本文利用訪談記錄中的信息資料,通過預處理提取簡潔、精煉的信息,利用關系表等存儲結構,發現就業與社會資本的關系模式,為大學生初次就業中社會資本效用的解讀提供新的研究視角。
1.強弱關系與大學生初次就業具有一定的關聯性
本文通過構建LDA主題模型對文本數據進行預處理,在此基礎上通過建立關聯規則,研究在大學生初次就業中發揮效用的強弱關系作用形式,分析結果驗證了假設1和假設2。
首先,社會關系越弱,獲取的社會資本越可能以就業信息的形式對就業產生正向影響。相對于強關系,弱關系根據自我中心網絡結構表現出一定的延展性,關系鏈條越長,獲取信息的群體規模就越大,而傳遞信息的網絡關系人反而變得模糊起來,弱關系通過信息或推薦等形式發揮效用,而網絡的廣泛普及也為勞動力市場信息的傳播提供了更為廣闊的空間,弱關系表現出一定的工具性特征,有效地緩解了初次就業中的信息不對稱等問題,假設1得以驗證。其次,社會關系越強,獲取的社會資本越可能正向地影響表達性行動的成功。處于社會結構中的社會資源是分層的,處于不同階層的群體,其內部成員可以將自身資源轉移給群體內成員。在大學生初次就業中,強關系通過互動以維系群體內部的緊密性,表現出更強烈的行為動機。關聯規則結果顯示,在動用社會關系實現初次就業的大學生中,“直接推薦崗位”這一作用形式凸顯出來,假設2得以驗證。
2.初次就業中實際動用強弱關系與社會階層具有一定的關聯性
自20世紀90年代以來,隨著高等教育的普及,教育從個體顯著性向集體顯著性轉變,家庭背景成為大學生初次就業門檻不斷升高的因素之一。鑒于多數受訪者不愿詳盡闡釋家庭背景狀況,在不考慮人力資本的情況下,本文利用LDA主題模型識別受訪大學生的家庭階層,最終分為偏上、中等和偏下三類。在此基礎上,通過對社會階層與實際動用強弱關系建立關聯規則,驗證社會階層與強弱關系之間的聯系具有特定的情景意義。結果表明,初始位置與強弱關系表現出一定的關聯性,假設3得以驗證。
首先,家庭處于偏上階層的大學生,強關系在初次就業中發揮顯著效用。強關系在中國具有較為強烈的文化意蘊,多基于信任基礎建立與強化,在家庭處于偏上階層的大學生表現出顯著意義,即家庭處于偏上階層的大學生初次就業與強關系具有較強的關聯性。從另一角度來看,也顯現出強關系的弊端,即其作用范圍受到群體階層的限制,凸顯結構的相對封閉性。其次,家庭處于中等階層的大學生,弱關系在初次就業中發揮顯著效用。社會階層與強弱關系之間的聯系具有特定的情景意義,對家庭處于中等階層的大學生,其所占比重最大,由于原始的社會資本相對稀缺,通過對社會關系的多次動用,弱關系被凸顯出來。最后,家庭處于偏下階層的大學生,社會關系未在初次就業中表現強或弱 的特性。對家庭處于偏下階層的大學生,動用社會關系的比重最低,其社會階層與強弱關系未建立明顯的關聯性,即家庭處于偏下階層的大學生未表現出具有的社會關系特征。值得說明的是,強弱關系在不同社會階層發揮效用的表現形式不同,盡管兩者之間凸顯一定的關聯性,但并未表現出一一對應的關系。
1.強弱關系在大學生初次就業中是一把“雙刃劍”
社會資本與大學生初次就業的互動往往介于理性與非理性之間,盡管如此,界定關系時也難免賦予較濃厚的工具性色彩。不管是強關系還是弱關系,都是大學生在做出重大職業地位變動過程中可能會動用的社會關系。“雙刃劍”主要體現在以下三方面:
首先,強弱關系可以促進大學生初次就業,為用人單位與大學生之間建立有效的溝通渠道,產生積極的影響。其次,宏觀背景下的信息不對稱可能會將更為優秀的大學生排擠出去,為具備關系資源的大學生提供就業場域中“搶跑”的動機和條件,加劇就業市場的機會不平等,對社會發展產生消極影響。最后,不管是在文化論者或結構論者眼中,關系文化都具備工具性發展趨勢。關系的過度使用,可能會導致“殺熟”現象[23],影響大學生的實際就業質量,并進一步給文化帶來嚴重影響。建議大學生初次就業時,對自身未來的發展有所規劃,避免社會關系的盲目動用。
2.理性審視階層差異對大學生初次就業的影響
在社會層面,我們應理性審視階層差異,為大學生初次就業提供一個正確的價值觀。在大學生初次就業這一節點,社會資本充沛的大學生確實擁有更為廣闊的選擇空間,家庭背景成為大學生初次就業門檻不斷升高的重要因素。雖然原生家庭背景對大學生初次就業產生一定的影響,但并不能據此推論家庭背景與就業之間的因果關系成立。優秀的大學生更希望利用自身的人力資本體現自身價值;動用社會關系找工作的大學生,仍有部分最終選擇憑借人力資本尋找質量更高的工作。這一現象表明,階層差異與就業質量之間的關聯性仍未得到驗證。
3.營造公平的就業市場競爭環境,削弱社會資本的消極影響
首先,政府應通過完善對高校畢業生的就業政策,營造良好的就業基礎。在中國高校中樹立公平競爭的培育機制,鼓勵大學生參與競爭并提升就業能力。針對政府對高校的投資、撥款、資助方面,同樣也要建設體制完整的競爭機制,以公平競爭為導向營造良好的制度基礎和社會基礎,并且調動民辦高校與私立高校也參與其中。其次,政府應健全就業保障的法律法規,鼓勵相關部門對大學生進行初次就業技能培訓,提高就業效率。最后,政府應出臺相關政策鼓勵校企聯合共建機制,鼓勵掌握就業主動權的用人單位與高校之間構建通暢的信息交流,提供更有針對性的培養需求以及就業指導。高校在人才培養方面的教學培養應更加完善,通過建立考核與管理制度保證大學生初次就業理論知識的合理應用。
4.合理開發人力資本,提高大學生自身競爭力
盡管大學生在就業場域中受到人力資本與社會資本的雙重制約,但是在實踐中合理開發人力資本是對自身競爭力的提升。普拉斯認為,在青年時期通過正規的學校教育實現的人力資本投資與積累是十分重要的。對于大學生來說,就業公平是實現高質量就業的重要保障,但是由于現實社會中的社會資本會給就業市場帶來不公平因素,從而限制了人力資本在大學生初次就業中的發揮[24]。因此,大學生要注重人力資本的開發與積累,提高自身的競爭力。實踐能力一直以來都是大學生人力資本衡量的重要尺度,而提高實踐能力的關鍵在于參與社會實踐的“質”而不是“量”。對于仍在校園的大學生而言,應有規劃地利用課余時間參與校園活動,提升自身的隱形人力資本。