曠 敏
(湖南科技大學瀟湘學院,湖南湘潭411201)
在當代中國,改革開放帶給社會諸多方面的變化,當代中國人的幸福觀也發生了根本性的改變,開始具有多樣性和差異性。這些改變對當代中國人特別是青少年幸福觀的形成產生了非常重要的影響。伴隨著價值觀的多元化發展,一些消極和負面的思想也紛至沓來,人們的幸福感不但沒有與物質生活水平同步提升,反而有不斷下降的趨勢,也暴露出一些由此引發的社會問題。探討當代中國人的幸福觀,能為國民幸福體系的建設、實現真正的社會和諧提供有益的參考意見。
學界對幸福觀的研究主要從兩個視角展開:歷時的視角和共時的視角。例如,孫春晨(2008)從歷時視角考察了古代儒家幸福觀的特征、現代政治掛帥主導下的幸福和當代改革以來中國人的幸福觀。孫春晨(2011)從共時視角研究了改革開放以來中國人幸福觀,其總體特征為:(1)幸福觀與實現個人價值緊密結合;(2)幸福觀趨向世俗化;(3)幸福觀具有明顯的差異性。研究的方法主要基于社會學的分析方法,但由于沒有進行大規模的社會調查,欠缺真實的統計數據,且研究的結論局限于內省式的綜合分析,因而缺乏確鑿的、令人信服的證據。
本研究試圖探索和尋求當代中國人的幸福源頭,與以往研究不同的是,本研究采用經驗主義的方法,借助自然語言處理技術對一定規模的真實文本語料進行自動化的統計,再經人工分析得出結果;同時,為了驗證上述方法的有效性,進行了一項主題為“幸福在哪里”的小規模問卷調查,統計和分析了調查結果,并對兩種結果進行了對比考察。
關于“幸福在哪里”,我們認為有如下觀點:
1.語言既是人們溝通交流的最重要的工具,又是人們用以表達自我思想和內在情感的最重要的手段,文字則記錄了人類的這些思想和情感。追求幸福一直是全人類矢志不渝的目標,也是全人類長久以來思考和探究的命題,自有文字記載的歷史以來,一定存在有關幸福的書寫片段。因此,總可以從文本中挖掘出與幸福有關的信息。
2.隨著互聯網的高速發展,人類進入了一個全新的信息時代。信息時代改變著人們的生活方式,互聯網為人們提供了一個表達和分享自我思想、觀點、見解等思維活動結果的場所,博客、微博等網絡書寫和共享平臺更使得人人成為“自媒體”。很多人習慣在互聯網上寫作,用文字記錄個人生活,抒發情感,表達意見。因此,可以通過大規模自動化的方法,采集特定類別的網絡文本資源,并將其建設成語料庫,用以替代傳統意義上的紙質文本資料。
3.幸福是一種心理感受,是人們對于外部世界的人、物、事的積極、正面的反應,屬于情感的正極方。因此,可以采用情感分析(自然語言處理的一個研究領域)的一些方法對它進行研究。人們對情感的表達,體現在語言形式上,表現出與對非情感活動的表達的一些差異性,這些差異性可以通過歸納和總結得出不同的句式和表達方式,因而總結出這些固定的表達模式,也就相當于獲得了挖掘幸福源泉的具體的形式化規則。
4.個體對于幸福在語言形式上的表達,具有差異性。因此,需要對固定的表達模式進行必要的調整和擴充,使其具有更強的概括力和普適性,以獲得更高的召回率。為此,可以采用“同義替換”和“同類替換”的方式,對形式化規則進行擴充。
5.要檢驗基于語料庫方法探尋幸福源泉的實驗結果是否有效,需要有一個可供參考的“標準答案”。顯然,要想知曉人們的幸福到底在哪里,最可靠的方法莫過于直接采訪。限于時間精力,可以將其“簡化”為對特定人群進行問卷調查,以其結果作為“標準答案”。
基于上述觀點,制定本研究的思路如下:
1.問卷調查。設定調查主題為“幸福在哪里”,依據一般的問卷調查方法和流程進行操作,問卷回收后進行統計、分析,獲得調查結果。
2.語料收集。首先規劃待收集語料的范圍、類別和規模;其次根據各類語料的性質和特點,制定采集方案,編制相應的采集軟件;其次利用采集軟件,從互聯網上自動獲取語料,語料文本經過清洗、校對等必要的預處理后,形成生語料庫;最后對生語料進行自動詞語切分和標注后,形成熟語料庫。熟語料庫按類存儲,并將其按2∶8的規模比例形成兩個子語料庫,其中占規模2/10的小語料庫稱為規則提取語料庫,用于人工歸納幸福源泉的表達模式,占規模8/10的大語料庫稱為測試語料庫,用于挖掘幸福源泉。
3.模式歸納。利用規則提取語料庫,人工歸納幸福源泉的表達模式,并將其形式化。
4.模式擴充。利用同義詞詞典、義類詞典和情感詞典,對已形式化的模式進行擴充。
5.實驗和結果分析。編制相應的文本分析和模式匹配軟件,從測試語料中提取結果。將實驗結果和問卷調查結果進行對比分析,得出結論。
因為80后和90后逐漸成為社會的中堅力量,所以我們主要考察的對象為80后和90后。“幸福在哪里”問卷的對象以這兩個群體居多,采樣的范圍在湖南省湘潭市,調查共發出問卷500份,回收有效問卷489份。調查的主要結果如下:
1.職業(專業)幸福指數偏低
80后、90后群體對其專業或職業的滿意度為29.42%。對于90后群體(主要是學生)而言,現在最重要的是學習以及為將來的工作做好充足的準備,但他們對現就讀專業的滿意度僅為39.93%。專業是學生自己當初的選擇,可現在的滿意度卻不高,可能學生對自己沒有充分的認識,或是當初是因為某種原因而選擇現在就讀的專業。人們都希望自己的工作就是自己的愛好,那樣工作會開心點。可剛步入社會的80后群體對職業的滿意度僅為24.7%,可能對他們而言工作只是賺錢的一種手段和途徑,但好在他們都覺得就業壓力不是很大。在所調查的對象中,有69.7%的人認為有就業壓力。目前整個就業形勢不太樂觀,用人單位的要求也越來越高,只有將我們自己的能力提升,才能更好的就業,從而也可提升幸福感。
2.收入幸福指數較高
82.85%的調查對象認為經濟收入在幸福概念中占據較為重要的比重。剛步入社會的80后和一小部份90后群體的月收入多數為3000元左右,其整體滿意度為76.8%。
3.住房幸福指數偏低
房價也是影響幸福的一個關鍵因素。80后和90后群體對商品房價格的滿意度為18.15%,其中90后群體對商品房價格的滿意度為27.3%,步入社會的80后對商品房現在價格的滿意度為19.8%,可見住房會在相當長的一段時期內影響80后和90后群體的幸福感。
4.社會生活幸福指數尚佳,但個別問題突出
人們常說80后和90后群體是“垮掉的一代”,因為他們常抱怨社會的種種問題,對各方面感到種種不滿。然而,據我們的調查,80后和90后也是理性的人群,他們看得到社會的不足,同時也看得到社會美好的一面。表1列出了他們在社會生活方面的一些幸福指數情況。

表1 社會幸福指數情況
80后和90后群體對社會總體環境的滿意度較高,其中環境衛生和社會道德風氣的滿意度最高,但對于交通狀況、物價水平等方面則相對較低,這反映了當今社會在這些方面存在的問題。
為了探尋當代中國人的幸福源頭,我們構建了一個中等規模的語料庫。該語料庫共含詞語約100萬條,由5個類別組成:電視劇本、流行歌曲歌詞、日志和博客文章、微博文本、當代文學作品。選材的依據是其中是否含有與幸福有關的語言表達,以下列舉每類的典型作品或文本。
1.電視劇本:《北京青年》、《男人幫》、《蝸居》、《我的青春誰做主》、《媳婦的美好時代》
2.流行歌曲歌詞:《還是要幸福》、《幸福一輩子》、《滿滿的都是愛》、《那些年》、《有你的快樂》
3.日志和博客:《給我點小幸福吧》、《另一種幸福》、《愜意生活》、《兩元錢的溫暖》、《媽媽的幸福》
4.微博文本:陳默、謝娜、姚晨、蔣方舟、劉同、楊石頭、何炅、李茜、趙婕、周思成、六六、韓寒、李響、劉猛、楊紫、袁弘、劉雨晨
5.當代文學作品:《最好的幸福》、《收藏幸福》、《娜是一陣瘋》、《幸福是什么》、《女人的幸福與什么有關》《幸福書》、《幸福是什么》
將這些語料同樣按類別和規模分成兩份,一份為20萬詞的規則提取語料庫,一份為80萬詞的測試語料庫。使用ICTCLAS漢語詞法分析器分別對其進行詞語切分和詞性標注后,由研究人員手工從規則提取語料庫中總結幸福的語言表達模式。同時為了驗證這些模式的典型性和有效性,利用Google搜索引擎對這些模式進行了在線檢索,參考了檢索結果。此外,我們依據《同義詞詞林》和《HNUST情感詞典》,分別對模式中的非關鍵詞(除關鍵詞以外的詞)進行了同義替換以及對關鍵詞(“幸福”)進行了義類替換。目前共計歸納了24條表達模式,擇要舉例說明如下:
【模式1】因為……,所以幸福。
【例句】因為有愛,所以幸福。
因為快樂,所以幸福。
因為住大房子,所以幸福。
【Google檢索結果】219,000,000條
【模式2】其實(也許,或許,原來)幸福就是……。
【例句】其實幸福就是學生尊敬你。
原來幸福就是做一件喜歡的事。
也許幸福就是快快樂樂地生活著。
【Google檢索結果】275,000,000條
【模式3】……好幸福啊!
【例句】懷孕好幸福啊!
安慰短信讓我好幸福啊!
收到戰友的信好幸福啊!
【Google檢索結果】914,000,000條
【模式4】越……越幸福。
【例句】越單純越幸福。
事業越成功越幸福。
越有錢越幸福。
【Google檢索結果】238,000,000條
【模式5】有……很幸福。
【例句】有你陪著很幸福。
有事做很幸福。
有大房子很幸福。
【Google檢索結果】40,700,000 條
【模式6】……是幸福。
【例句】睡到自然醒是幸福。
勞動是幸福。
身體健康是幸福。
【Google檢索結果】179,000,000條
【模式7】幸福源于……
【例句】幸福源于關愛。
幸福源于遵從內心的聲音。
幸福源于愛。
【Google檢索結果】18,000,000 條
【模式8】……讓我很幸福。
【例句】你的寬容與理解讓我很幸福。
有小寶貝讓我很幸福。
住上大房子讓我很幸福。
【Google檢索結果】15,600,000 條
將上述表達模式形式化以后,編制出相應的檢索軟件,把形式化規則作為輸入,在測試語料庫中提取到共計478條檢索結果,這些結果就是預期獲得的幸福源泉。我們對檢索結果進行了細致地歸類和分析,排除了重復的內容,以下是對各類別語料的分析結果:
1.日志和博客的內容非常接近日常生活,它們代表一個較為理想的數據來源傳遞著個人的幸福情感。從日志和博客的語料中得出構成幸福的最重要的三個要素:愛、樂趣、成功。同時微博、博客的使用人群主要集中為80、90后,大多數人為工薪族,他們心里較為焦慮,大多數人幸福感不高的原因是過早變成孩奴、車奴、房奴。
2.流行歌曲歌詞來源于最真實的生活,一般都是抒發或記錄生活的體現,沒有過多的加工與琢磨。這樣,語料便是人們的真實情感的流露。我們可以從歌詞中得出影響幸福的要素主要是:愛情、工作、孩子。
3.當代文學作品材料是對80后生活的集中體現與反應。我們可以從文學作品中得出主要的幸福要素有:心態、態度、生活。
4.我們所選取的電視劇語料是最能體現我們生活特點的典型代表,集中反應了80后生活。從電視劇語料中我們得到影響幸福的主要因素是:房價、物價、愛情。
5.微博語料具有很強的草根性,最大的特點是普遍性和透明化,微博上記錄著大多數人每天的喜怒哀樂的變化,同時因為微博使用門檻低、有字數限制,使得大量信息未經加工就進入傳播過程,很可能導致信息泛濫,但從另一方面這也是最能體現微博的高度可靠性、真實性。來自微博語料的幸福源頭主要有:工資、旅游、孩子。
從檢索結果中,我們還統計了出現頻次最多的幸福詞語或者短語為:購物、睡懶覺、旅行、看書、美食、寶貝(孩子)、運動。
調查問卷與語料庫的結合可以更好地研究問題,提出解決對策。調查問卷的形式具有直接性,可以直接獲取到大概信息。但同時存在的缺陷是由于精力、時間有限,我們只能對特定地域進行調查采樣,可能無法獲得更為全面、廣泛的資料。語料庫恰好彌補了這一局限,語料庫中的語料覆蓋面廣,同時具有高度真實性、可靠性。我們從文學作品、微博、博客、日志、歌詞、電視劇本中收集語料。但語料庫也存在一點局限,有些日志、博文上了鎖,我們無法獲得此類的語料。
從調查問卷中,我們可以得到影響80、90后幸福因素排名前三的是:物價、房價、交通。從語料庫中我們可以得到制約80、90后的幸福因素分別是:孩奴、房奴、愛情。
總之,語料庫與調查問卷兩種方法的結合,補足相互的缺陷之處,此來,才得到了一個更為全面、準確、可信的結果。
人人都有幸福的需要和權利,幸福不是只供少數人享用的專利。追求幸福感受是千百年來人們奮斗不息的動力源泉,找到幸福其實并不難。通過語料庫中的挖掘和幸福問卷的調查結果,我們從實際可行的角度給出一些建議。
如果你感到不幸福,或許你可以嘗試一下這樣一個“治療方案”:(1)接觸一些新事物;(2)吃一些喜愛的美食;(3)去一個有趣的地方;(4)看一本好書,曬曬太陽;(5)陪孩子一起做游戲。對于大多數人而言,如果想保持一種幸福的狀態,我們建議:去購置一些新東西,一些你非常喜歡的物品;或者可以準備一頓豐富的晚餐,或者和心愛的人去一個有趣的地方或是一次遠行;可以看一場電影,聽一場音樂會,睡一個懶覺,參加一個晚會或者是去其他的地方,盡情享受;要盡可能多地接觸自然,多呼吸室外的新鮮空氣,盡情享受;多陪陪孩子,愛人,傾聽他們的心聲,與愛人孩子在一起通常是很多人感到最快樂的。
在尋求幸福的問題上,可以說“條條大道通幸福”,但是,這條條大路之中卻有遠近之別和正歧之分。如果不慎走上一條遠路或歧路,那樣不但會多走許多冤枉路,甚至于會南轅北轍,背離原來的目標,明明要尋求幸福,結果卻陷入苦惱與痛苦之中。尋找幸福的源泉就從那些被忽略的事開始行動,幸福之門也會為你打開。
[1]孫春晨.中國人幸福觀的演變[J].政工研究動態,2008(23):7-8.
[2]孫春晨.改革開放以來中國人幸福觀分析[J].思想政治工作研究,2011(1):21-23.