曾振華,齊亞萍,畢貴紅,張壽明,蔡子龍
1.昆明理工大學 信息工程與自動化學院,昆明 650500
2.昆明理工大學 電力工程學院,昆明 650500
實數詞匯結構語言競爭社會仿真與計算實驗*
曾振華1,齊亞萍1,畢貴紅2+,張壽明1,蔡子龍2
1.昆明理工大學 信息工程與自動化學院,昆明 650500
2.昆明理工大學 電力工程學院,昆明 650500
ZENG Zhenhua,QI Yaping,BI Guihong,et al.Social simulation and computational experiment model with integer vocabulary structure for language competition.Journal of Frontiers of Computer Science and Technology,2017,11(1):46-60.
語言競爭傳播演化現象是典型的不能假設、無法進行“真實性實驗”的社會科學問題,而建立在社會仿真模型基礎上的計算實驗是可行的方案。基于agent社會圈子網絡理論構建語言競爭網絡,采用兩個長度為F的整數字符串來表達個體掌握語言的詞匯量及熟練程度,在此基礎上給出了一種新的動態微觀語言競爭社會仿真模型。利用計算實驗的方法驗證了給出的新模型具有與前面研究者模型相同的動力學特性,分析了新模型的語言政策調控效果,比較了二進制詞匯結構和整數字串詞匯結構系統的動力學差異。計算實驗表明:無調控情況下,語言共存參數空間很小,難以達到穩定共存狀態,動態調控能讓語言共存參數空間顯著擴大,并穩定在共存狀態,整數字串詞匯結構模型具有更豐富的表達能力。
社會圈子;復雜網絡;語言競爭;社會仿真;計算實驗
語言是人類文化的載體,在文化傳承中扮演著重要的角色,語言的消亡將使潛在的與之有聯系的人類文化消失。因此,有必要對語言傳播、競爭和調控的機理和動力學特性進行深入研究,以揭示語言衰退、消亡和共存的原因,進而尋求瀕危語言的保護和干預措施。
目前很多語言保護手段都有明顯的滯后特性,多為語言瀕危、消亡問題發生后的消極保護,而且對于各種“語言保護方案”無法進行有效的效果評估。產生這種情況的主要原因是:語言消亡、語言共存等語言競爭傳播演化現象是典型的不能假設、無法進行“真實性實驗”的社會科學問題,而建立在社會仿真模型基礎上的計算實驗是可行的方案。社會仿真就是通過對社會系統中大量相互作用的微觀主體關系及行為進行建模仿真,來考察社會系統宏觀層面的運行規律[1]。社會仿真方法已經在文化版圖空間演化和語言競爭傳播等領域得到關注[2]。語言交流傳播系統是個復雜的社會系統網絡,可以用復雜適應性系統理論和復雜網絡建模兩者結合的方法來研究語言競爭模型及其動力學性質,其包括:基于微分方程的動力學模型[3-9]、基于微觀仿真方法的復雜系統仿真模型[10-19]。基于微分方程模型屬于宏觀模型,基于微觀仿真方法模型屬于微觀模型,其是當前社會仿真建模的主要方法。
復雜系統網絡建模方法近年來得到越來越多的重視。Stauffer等人[12]給出了AS(Abrams-Strogatz)模型[3]的微觀仿真模型,考慮了相互隔離的社會連接網絡和一個d維網絡上的系統演化特征。Castelló等人[13-14]擴展了Stauffer的模型,引入了雙語者和社會網絡結構。Minett和Wang[4]為了研究具體政策干預機制和初始條件下語言競爭系統的一系列可能行為結果,在他們給出的微分方程基礎上建立了微觀agent仿真模型,分析了全連接網絡和局域世界網絡[10]上的語言競爭動態特性。Kosmidis等人[11]使用兩個二進制位串來描述語言的內部特征及個體間學習和遺忘。An等人[16]進一步假設兩種語言都由F個獨立的特征組成,且用兩個長為F的個性水平實數串來定義個體。Zhang等人[9]在演化生物學競爭模型的基礎上給出了新的語言競爭模型。王超等人[19]基于agent社會圈子網絡建模,分析了社會交往半徑和社會流動性對語言競爭的影響。
目前基于復雜網絡的語言競爭模型考慮了語言的社會結構、人口密度、語言地位以及雙語因素對語言共存的影響,但還存在如下問題:
(1)網絡以靜態網絡為主,未考慮社會網絡的動態特性。開始時,人們采用計算機生成在某些方面符合真實社會接觸網絡特征的理想網絡,通過研究這些理想網絡中的語言交流傳播過程來間接了解語言交流傳播與真實社會接觸網絡結構特征之間的關系。進一步,研究者們考慮了具有社群結構的更為實際的社會網絡結構,如局域世界模型和具有社區結構的網絡模型等。現有的復雜網絡語言交流模型主要關注的是網絡的拓撲結構特征,如小世界特征、無標度特性、高聚類特征和網絡的社群結構等對語言交流傳播的影響,而對網絡結構隨時間的變化關注甚少。而真實的社會接觸網絡由于人員在區域內或區域間的流動,使得網絡拓撲結構特征發生變化,從而影響到其上的語言交流傳播過程。
(2)語言競爭傳播網絡中某個節點語言使用類型的遷移概率由該節點鄰域的某種語言人數比例、語言地位等來確定,語言沒有內部結構,也沒有考慮語言學習和掌握程度的動態變化過程,不能反映出現實語言系統中使用機會和頻次對語言使用類型及能力變化的影響。
(3)語言保護政策調控作用只考慮了不同靜態網絡的影響,沒有研究在更接近現實的動態復雜社會網絡中政策調控的效果問題,無法全面多維度地展現語言保護過程中的影響因素。
本文利用基于agent的社會圈子網絡理論構建動態語言競爭網絡,采用兩個長度為F的整數字符串來表達agent的語言內部詞匯結構,構建一種新的更接近現實社會網絡的語言競爭社會仿真模型。本文模型能很好地體現現實語言網絡中的這些特點:
(1)個體網絡參數和整體網絡參數都更接近實際。個體網絡參數具有異質性、度胖尾分布、高聚類系數,且隨時間變化;整體網絡參數具有低密度、度度相關性、社群結構以及短路徑等特點。
(2)個體不同的社會半徑可以改變社會圈子的大小,而社會半徑大的個體有可能連接到其他小團體,形成圈子之間的弱連接,并且社會半徑大的個體傾向于互相連接,可以表達人們社會交往圈子和社會網絡復雜的社群和層次結構的異質性。
(3)個體可以斷開原來的社會關系,移動到不同的位置構建新的社會網絡,可以描述具有流動性的社會網絡。
(4)個體的整數值位串表示其可能掌握的雙語內部結構,可體現個體所掌握語言類型、詞匯熟練程度和詞匯量的變化過程,以此反映語言內部結構演化的微觀現象。
(5)網絡上的個體間通過交流實現詞匯的學習和遺忘,推動語言在網絡上的傳播。
Hamill和Gilbert[20]提出一種基于agent的社會圈子網絡理論來構建具有多種實際社會網絡統計特征的社會網絡生成方法。網絡中,個體擁有長度不等的社會交流半徑,以個體自身為中心,以社會半徑長度為半徑作圓,形成個體的社會圈子,社會圈子大小的不同使得個體交流范圍產生差異。當兩個體中心點連線的長度Q小于等于連線兩端個體較小的社會半徑r時,個體建立連接產生聯系。圖1(a)中Q>r,兩者不產生聯系,圖1(b)中Q<r,兩者建立連接,產生聯系。模型設置了3種社會半徑長度,如圖1(c)所示,隨著社會半徑的增加,所能接觸到的個體數目不斷增加。

Fig.1 Contact information in social circles圖1 社會圈子中的聯系情況
依據上述理論建立社會圈子網絡如圖2(a)所示,“●”節點代表X語言個體,“▲”節點代表Y語言個體,“■”節點代表XY雙語個體,“—”連線代表個體間有聯系。圖2(b)中,不同社會半徑的個體和全部個體的整體度分布均呈泊松分布,而且社會半徑小的個體人數最多,半徑越大人數越少,這與現實社會中大多數人的聯系范圍較窄而少部分人聯系范圍廣泛相一致。另外該網絡還具有高聚類系數,具有度度正相關性和低密度等特點。通過引入隨機移動來模擬人口的流動,人口流動會引起個體及社會網絡結構的變化。

Fig.2 Social circle network and its degree distributions圖2 社會圈子網絡及其度分布
在近十多年的研究中,最具有影響力的語言競爭模型當屬于由Abrams和Strogatz于2003年提出的AS模型[3]。Minett和Wang[4]為了研究具有干預機制的語言競爭系統的可能行為,在AS模型的基礎上引入雙語者和垂直傳播因素建立了如下的系統動力學推廣模型:

式中,SX、SY表示X、Y的語言地位,且SX+SY=1;x、y表示單語X、Y說話者的人口比例;α描述該語言的吸引力隨該語言說話者比例變化的尺度;CXZ、CYZ代表單位時間內語言X、Y說話者轉為雙語言Z說話者的最高比例;CZX、CZY代表單位時間內雙語言Z說話者轉為單語X、Y說話者的最高比例;μ代表成年說話者被幼年說話者替代比例。
進一步在推廣模型的基礎上通過引入局域世界網絡建立了微觀agent仿真模型。模型包括兩種單語者和一種雙語者agent類型,agent的語言可代間垂直傳承,也可代內水平傳播。研究結果認為:(1)構建的宏觀系統動力學模型和微觀agent模型都具有相同的動力學特性;(2)在沒有政策干預情況下,系統不能穩定在語言共存狀態,通過政策調控可以讓系統處于語言共存狀態。
本文結合Minett和Wang[4]的微觀agent網絡模型和Kosmidis[11]及An[16]的詞匯結構模型設計新的具有實數詞匯結構的動態agent網絡語言競爭模型。利用計算實驗對模型進行分析,并驗證新模型具有與前研究者模型相同的動力學特性,同時尋找語言共存的參數空間及能達到語言共存的調控策略。
4.1 agent語言內部結構
語言接觸競爭會影響語言結構的各個方面,語言結構包括語音、詞匯和語法等方面。語言學家經常使用核心詞匯表對被測試人員進行語言能力測試和熟練度分級。因此語言接觸競爭傳播模型應該以接觸網絡中語言個體間的詞匯獲得及熟練度的變化過程為核心。
借鑒文獻[11,16]中用整數值及位串表達語言的方法,假設兩種語言都由F個獨立的詞匯組成,分別用X1,X2,…,XF和Y1,Y2,…YF來代表,指定X語言中詞匯Xv和Y語言中詞匯Yv是一對平行詞匯(v∈[1,F]),它們是在不同的語言中表達同一個意思的不同方式。用兩個長為F的整數位串來定義語言個體agent(ii∈[1,n]),每一個串位都是描述agenti對相應詞匯的掌握熟練度,其值是[-Rmax+1,Rmax]中的一個整數。當熟練度值是正整數時,表示agenti掌握該詞匯,且值越大表示agenti越熟練。當這個值是0及負整數時,表示agenti沒有掌握該詞匯,且值越小表示agenti越難理解。設定社會語言網絡中存在3類語言者:(1)母語為X的單語者agenti(X);(2)母語為Y的單語者agenti(Y);(3)通過語言接觸相互學習而變為雙語者(會X、Y兩種語言)agenti(Z),網絡中每個agent都是潛在的雙語者。如圖3所示(設F=10,Rmax=5)。

Fig.3 Internal structure of agents’language圖3 agent的語言內部結構
圖3中,LX(v)表示X語言由F個詞匯構成(LX(10)表示X語言是由10個詞匯構成),LY(v)表示Y語言由F個詞匯構成,位串中的整數代表agenti對相應詞匯的掌握熟練度。
整數位串中詞匯的掌握情況反映個體的語言類型。語言類型規定:(1)LX(v)中至少有一位為正整數而LY(v)中全為負整數或0時,規定為單語者X;(2)LX(v)中全為負整數或0而LY(v)中至少有一位為正整數時,規定為單語者Y;(3)LX(v)和LY(v)中都至少有一位為正整數時,規定為雙語者Z。對應公式(3)~(5)。

4.2 agent詞匯的交流傳播規則
4.2.1 水平傳播
社會語言網絡中,不同語言者通過接觸交流來學習語言,以增大自己的詞匯量及熟練度,同時在交流過程中,也會伴隨著詞匯的遺忘及生疏。現實中,語言的地位相異,個體進行詞匯學習與遺忘的可能性也會隨著語言地位的不同呈現不同的態勢。
人與人通過交流來表達個體思考的過程,語言的水平傳播可以反映這一過程。模型中,個體進行詞匯學習和遺忘需滿足條件:(1)個體之間具有圖2(a)中的邊連接關系;(2)在上述前提下滿足交流率(u),選擇對應個體進行詞匯的學習和遺忘。對于每一對平行語匯,把它分成下列3類。
(1)雙語:agent同時掌握這一對平行詞匯,即LX(v)>0且LY(v)>0。
(2)單語:agent僅僅掌握這一對平行詞匯中的一個,即LX(v)×LY(v)≤0且。
(3)無語:agent沒有掌握這一對平行詞匯,即
LX(v)≤0且LY(v)≤0。
每一個仿真時間步agent會在自己的社會圈子里交流,假設個體i和j有語言交流,他們的語言狀態在下一個時間步被定義為:

交流中發生的相互作用包括如下6種情況(以只有一對平行詞匯為例),在An等人[15]元胞自動機個體間語言交流模型的基礎上,考慮了語言地位的影響,給出了網絡上連接的節點agenti和agentj之間的交流模型。
(1)當相互作用在兩雙語者間發生,他們以熟練度值總和與其中一種語言熟練度值的比例來選擇相應的語言進行交流。交流后,被使用語言的熟練度值以熟練度增長系數(a)與其語言地位(SX為X語言地位,SY為Y語言地位)的乘積為概率(P+)增加1,而另一語言的熟練度值以熟練度降低系數(b)與被使用語言地位的乘積為概率(P-)減小1。假設他們以概率選擇X語言進行交流:

否則他們用語言Y交流。
模型中,當熟練度值增大到Rmax時,將不再增大,減小到-Rmax+1時,將不再減小,下同。

(2)當相互作用在單語者和雙語者間發生,他們用共同掌握的語言交流,假設是語言X,語言X的熟練度值以P+=a×SX的概率增加1,而語言Y的熟練度值以P-=b×SX的概率減小1,即:

(3)當相互作用在雙語者和無語者間發生,雙語者教熟練度值高的語言給無語者(若雙語者兩語言的熟練度值一樣,則隨機教一種),無語者的被教語言熟練度值增加1,而雙語者的語言熟練度值保持不變。假設個體i是一個雙語者,他的X語言的熟練度值大于Y,個體j是一個無語者:

(4)當相互作用在兩單語者間發生
①如果兩單語者掌握同一語言,他們使用它交流。被使用語言的熟練度值以P+=a×S(XP+=a×SY)的概率增加1,而另一語言的熟練度值以P-=b×S(XP-=b×SY)的概率減小1。假設他們都只掌握了語言X:

②如果兩單語者掌握不同的語言,則他們不能用各自掌握的語言交流,這將導致語言的學習和遺忘過程。學習過程,兩個體中沒掌握語言的熟練度值以學習率(e)與語言地位的乘積為概率增加1。遺忘過程,兩個體中掌握語言的熟練度值以遺忘率(f)與語言地位的乘積為概率減小1。學習過程和遺忘過程均獨立發生,兩種語言的過程也均是相互獨立的。假設個體i掌握語言X,個體j掌握語言Y,以語言X為例:

(5)當相互作用在單語者和無語者間發生,單語者教他所掌握的單語給無語者。無語者的被教語言的熟練度值增加1,單語者的語言熟練度值保持不變。假設個體i是單語者,其掌握語言X,個體j是無語者:

(6)當相互作用在兩無語者間發生,他們保持前面的狀態不變,因為他們不能進行交流。

4.2.2 垂直傳播
人口的出生或死亡能夠反映人口數量的動態變化,而個體的繁殖又需要考慮語言的遺傳和繼承。模型設置個體更新率來反映這一特征,網絡中的個體以概率D更新個體。同輩單語者通過學習可以變成雙語者,設定當個體滿足概率D后,父輩單語者遺傳單語,父輩雙語者以一定的幾率(雙語遺傳概率S)將雙語遺傳給子代個體,個體的詞匯遺傳流程圖如圖4所示。圖中,父輩雙語者滿足雙語遺傳概率,將雙語遺傳給子代,子代為雙語者Z;否則,如果滿足單語X的遺傳概率,子代為單語者X,不滿足則為單語者Y。

Fig.4 Flow chart of lexical genetics圖4 詞匯遺傳流程圖
(1)創建agents:創建n個agents并隨機分布在300×300的二維空間內,配置單語者X和單語者Y的人口比例,設置X/Y語言地位(SX+SY=1);設置小、中和大3種社會半徑的人口比例,并為其分配相應社會半徑。
(2)agents詞匯設置:設置個體整數位串LX(v)和LY(v)。
(3)生成社會網絡:agents根據自身擁有的社會半徑屬性,利用社會圈子原理建立社會網絡,如圖1所示。
(4)agents語言交流:首先個體彼此在其社交范圍內,其次滿足交流率(u),當滿足上述條件后,個體進行語言的詞匯交流,規則如公式(7)~(14)。
(5)人口流動與網絡更新:agent滿足移動率(M),實現距離為H的移動。agent移動后當個體間連接的長度大于鏈兩端社會半徑小的個體的社會半徑時,連接斷開,否則保持連接。
(6)人口更新:遍歷網絡中的個體,當滿足更新率(D)時繁殖后代,人口出生及死亡后,利用社會圈子原理重新更新語言社會網絡。
(7)單語/雙語者的判定與統計:根據公式(3)~(5)判斷和統計單語者X、單語者Y和雙語者Z的人數。
(8)網絡的動態更新:隨著時間更新,重復執行步驟(4)~(8)。
本模型在語言競爭網絡中利用個體內部詞匯交流的微觀過程反映宏觀語言變化情況:將社會圈子網絡作為語言傳播網絡,通過設定個體間詞匯交流的機會實現詞匯的學習和遺忘,體現詞匯熟練度的變化,進而反映語言種類的變化。模型以NetLogo[21]為平臺,模型中部分參數及初始值借鑒了文獻[11,16, 19-20]模型中的設置,主要可調參數及初始值如表1所示(下文如未說明,參數值均為此設置)。

Table 1 Main control parameters and initial values of model表1 模型主要參數和初始值
6.1 模型收斂性分析
由于社會圈子網絡目前還沒有數學模型,目前不能從理論上給出新的語言競爭模型的解析解,進而給出理論上的收斂性證明。但是可通過一組計算實驗來分析及說明模型系統的收斂性。初始狀態兩單語人口比例均設為50%,其他參數均保持初始值不變,僅使語言地位變化,且每種語言地位條件下,都重復進行50次計算實驗來統計系統收斂狀態分布,結果如圖5所示。
在上述條件下,由圖5(a)可知50次實驗中,X語言地位小于0.5時,系統均穩定收斂于Y單語狀態;X語言地位大于0.5時,系統均穩定收斂于X單語狀態;當X語言地位為0.5,即X、Y語言地位相同時,系統收斂于X單語狀態為27次,Y單語狀態23次,X、Y兩語共存狀態為0次。進一步由圖5(b)、(c)可知,語言地位相同時系統并不能一直穩定在X、Y兩語共存狀態,而是持續較長時間后系統狀態開始分化,系統或很快地收斂于一個穩定的Y單語狀態(如圖5(b)),或收斂于一個穩定的X單語狀態(如圖5(c)),進而呈現出X/Y單語狀態隨機交替出現情形,即此時語言競爭演化結果出現不確定的兩種狀態,是一個不穩定的收斂態。這是因為在初始人口比例相同而語言地位不同時,語言競爭傳播過程中地位較高的強勢語言被大部分人認同并使用,而地位較低的弱勢語言由于語言競爭力相對較弱,使用人口越來越少,最終消亡。而在語言地位與初始人口比例均相同的情況下,由于系統的隨機性和仿真數據的有限性,在語言演化過程中會隨機地有某種語言取得微弱的競爭優勢,使語言不能達到長期的共存狀態,盡管語言共存的時間明顯延長了,但是最終參與競爭的兩種語言之一會得到全部支持,而另一種消亡。由此說明,無干預調控,即使語言地位與初始語言人口相同的情況下,系統也無法維持在穩定的共存狀態。因此,該模型具有與前研究者模型相同的動力學特性:系統有穩定和不穩定兩種均衡點,不穩定點會隨機滑向穩定點。兩個系統穩定點分別為X語言比例為1和Y語言比例為1,系統不穩定均衡點為X、Y兩語共存,系統的均衡點與系統的初始參數有關。

Fig.5 Analysis on convergence of unstable coexistence state圖5 不穩定共存點可能的收斂性演化分析
6.2 無調控語言共存參數空間的計算實驗
6.2.1 模型語言共存時間的設定
通過以上的計算實驗及對本模型在各種參數組合下的大量實驗過程進行觀察和結果統計,得到經驗結論:無干預調控情況時,任何參數組合條件下,隨著模型仿真時間的推移,在時間步達到一定數目時,系統最終只會有一種語言得到全部人的支持。這種現象與AS等[3-6,11-14,17]模型中所預測的一樣,兩種語言競爭,一種語言的消亡是不可避免的。考慮計算實驗的可行性,根據前面觀察到的實驗數據,來確定模型仿真的最長時間長度。系統的狀態空間網格數為300×300,人口為1 000個agent,在初始人口比例和語言地位相同的情況下,兩競爭語言共存的時間相對語言地位有差值時,時長是最長的。綜合圖5的實驗結果,選定500步時間長度作為本模型語言共存的時長。在沒有作特殊說明的情況下,后文都以此時長來判定模型語言共存的時限。在此期限內弱勢語言消亡說明語言不能實現共存,但模型經過語言政策調控可能在超過這個時限也能達到語言共存。
6.2.2 模型參數變化對語言共存可能性影響
(1)語言初始人口比例變化對語言共存可能性的影響
語言初始人口比例影響區域內掌握某種語言個體數量的空間分布。改變語言人口比例可模擬不同區域中不同語言人口占優勢的情況下語言人口結構對語言競爭傳播的影響。設置語言人口初始比例為單一可改變的參數,其他參數保持初始值不變,通過計算實驗來研究語言共存的人口初始比例參數區間。同時,觀察比較實數詞匯結構與二進制詞匯結構模型中語言共存的人口初始比例區間的異同。下文無特殊說明,實驗曲線下各個點均為重復進行50次實驗得到的結果。
圖6(b)中初始單語X人口比例x0≤0.50時,Y語言地位高,初始人口比例大,必然會最終得到全部人的支持。0.50<x0≤0.55時,盡管單語X初始人口比例比單語Y大,但由于語言地位對語言競爭傳播走向的影響權重較大,最終強勢語言Y人口還是會占據全部人口。x0>0.55時,初始語言人口比例開始對語言競爭傳播的最終狀態產生影響,Y單語狀態出現比例開始下降,XY兩語共存狀態比例開始上升。當x0=0.65時,系統達到XY兩語共存狀態的比例為1,即在研究時間范圍內僅此點一定能達到語言共存。當x0>0.65時,單語X初始人口基數很大,個體周圍都為X語,不容易接觸到Y語,Y語很難傳入,同時Y語很少,也不會被認同,盡管Y語言地位高,但講Y語的人會越來越少,因此隨著初始單語X人口比例的逐漸增大,X單語狀態出現比例會逐漸增加直到1。由此可知,競爭語言只有一個確定共存點為x0=0.65,可能共存區間為0.55<x0<0.75。同理,圖6(a)中x0=0.80是語言的一個確定共存點,可能共存區間為0.75<x0<0.85。橫向對比,圖6(b)—(a)中總體趨勢不變,確定共存點右移,語言共存參數區間變窄。這是因為Rmax=1時,一個詞語僅有兩種狀態(0代表掌握該詞語,1代表不掌握該詞語),本來熟練度值需要多次增/減才能產生詞語是否被掌握的轉換,現在只要熟練度值增/減一次就會產生轉換,轉換速率加快,致使語言地位作用加強影響權重變大,語言狀態轉換更敏感,因此需要更大的初始人口比例才能維持雙語的共存,一定共存點前后參數范圍更窄。

Fig.6 Impact of initial proportion ofXmonolingual on range of parameter values of language coexistence圖6 語言初始人口比例變化對語言共存參數空間的影響
(2)語言地位變化對語言共存可能性的影響
語言地位反映某種語言在社會政治、經濟和文化等方面的影響力及作用大小,也直接或間接影響著人們學習某種語言的主動性和積極性。現代社會中,隨著社會開放性的提升,不同地區語言的同一化現象明顯,通過改變語言地位可模擬混居社會下不同語言地位對語言競爭傳播的影響。本文設置語言地位為單一可改變參數,其他參數保持初始值不變,通過計算實驗研究語言共存的語言地位參數區間。同樣,也進行了實數詞匯結構與二進制詞匯結構兩種情形下的對比實驗。
圖7(b)中SX=0.25前,X語言地位很低,得不到人們的認同,X語言者會很快轉用強勢Y語言,即使X語言初始人口比例較大,但語言地位對語言傳播的影響顯著,人口比例大不足以扭轉X消亡的趨勢,Y單語會得到全部人支持。當0.25<SX<0.35時,隨著X語言地位得到提高,其初始人口比例大的優勢得到發揮的同時Y語言地位高優勢逐漸下降,因此Y單語狀態比例下降,兩語共存狀態比例開始上升。當0.35<SX<0.50時,Y語言地位繼續降低,X語言地位持續增強且初始人口比例大,其語言競爭優勢得到進一步加強,使得雙語共存的概率越來越小,直到X語言以概率1占據整個人口。當SX>0.50后,X語言為強勢語言且初始人口比例大,其在短時間內取得全部人口的支持是必然的,因此X單語狀態比例一定會為1。由此可知,競爭語言只有一個確定共存點為SX=0.35,可能共存區間為0.25<SX<0.45。圖7(a)中在SX=0.40前,因為只有兩種狀態,語言地位起決定性作用,所以Y單語狀態比例為1,又因為X初始人口比例大于Y,所以在0.40<SX<0.45很窄的區間內X單語狀態比例就提升到1。在SX>0.45后,X語言地位持續增大,保持了X語言的絕對統治地位。由此可知,競爭語言一定共存的概率幾乎可以忽略,可能共存區間0.40<SX<0.45。橫向對比,圖7(b)—(a)總的趨勢都是隨著X語言地位的上升,X單語狀態比例增加到1,Y單語狀態比例減少到0;語言共存區間右移,范圍收窄。這是因為二進制詞匯結構削弱了語言初始人口比例大的優勢,增強了語言地位的影響。

Fig.7 Impact of language status on range of parameter values of language coexistence圖7 語言地位變化對語言共存參數空間的影響
(3)語言交流率變化對語言共存可能性的影響
語言交流率是在彼此社交范圍內個體間進行語言信息交換的概率,表征著個體間的交流機會。在混合居住的人群中交流率間接反應社會和諧和社會開放程度。通過改變語言交流率可模擬混居社會下不同社會開放度中人們之間平均交流次數對語言競爭傳播的影響。本文設置語言交流率為單一可改變參數,其他參數保持初始值不變,通過計算實驗來研究語言共存的語言交流率參數共存區間。同樣,也進行了實數詞匯結構與二進制詞匯結構兩種情形下的對比實驗。

Fig.8 Impact of language exchange on range of parameter values of language coexistence圖8 語言交流率變化對語言共存參數空間的影響
圖8(b)中語言交流率u<0.35時,由于交流率較低,個體之間的語言交流機會較小,弱勢語言X初始人口基數大的優勢得到保持,而強勢語言Y由于語言地位高,Y語言個體會堅持使用該語言,或兼用弱勢語言X成為雙語者,雙語共同存在的時間會較長,在研究時間范圍內XY兩語共存概率為1。當0.35<u<0.50時,由于交流率繼續增加,系統對各參數的響應更敏感,語言狀態開始出現分化現象,容易出現語言支持一邊倒的情況,打破了語言地位與人口比例大相互制約的平衡。因此隨著交流率的增加,兩語共存狀態出現概率會逐漸減小,X、Y單語狀態比例逐漸增加,而初始人口比例優勢還是稍大于語言地位,因此X單語狀態比例高于Y單語狀態比例。當0.50<u<0.65時,交流率變得很大,個體之間的交流就會越多,語言的競爭傳播可能性就會越大,語言地位優勢稍大于初始人口比例,因此Y單語狀態比例會高于X單語狀態比例。u>0.65時,隨著兩種競爭語言之間交流的繼續增加,語言地位占明顯優勢,語言地位較低的語言在頻繁交流過程中很快地走向消亡。由此可知,語言一定共存區間為0<u<0.35,可能共存區間為0.35<u<0.65。圖8(a)因為只有兩種狀態,語言狀態轉換會很敏感,由弱勢語言轉用強勢語言更容易,所以語言地位高的Y語言會加速傳播,共存時間縮短,即使交流率很小,語言初始人口比例大的優勢也無法抑制語言地位的作用,會一邊倒地轉向強勢語言,所以競爭語言一定共存的概率幾乎可以忽略,可能共存區間為0<u<0.05。橫向對比,圖8(b)—(a)總的趨勢都是隨著語言交流率的增加,雙語共存概率逐漸減小直到0,Y單語狀態概率逐漸增加直到1;語言共存區間左移,范圍收窄。這是因為二進制詞匯結構系統敏感性增強,放大了語言交流率的影響。
總的來看,語言初始人口比例參數共存區間范圍較窄,達到語言共存可能性較小,只在很小的范圍內對語言最終狀態有影響,并不是決定性因素;模型對語言地位較敏感,語言地位起決定性作用。語言交流率會加強語言競爭的激烈程度,增大語言地位的作用,促進強勢語言的傳播,能通過降低交流率在一定程度上維持競爭語言的共存,延長弱勢語言的存在時間。比較來看,二進制詞匯結構不能表示出語言掌握的熟練程度,在語言交流學習過程中也無法體現語言詞匯學習的一個漸變過程,即量變到質變的過程,當語言初始人口比例與語言地位優勢相當時,放大了網絡中隨機重要節點的演化對語言競爭走向的影響,致使語言共存空間縮小,弱化了語言共存的可能性。實數詞匯結構則能較細膩地表達各參數的影響,較好地反映和模擬這些現象及過程。人類文化語言系統經過長期的歷史演化,在系統環境相對穩定的情況下,系統應該是穩定的。因此從二進制詞匯和實數詞匯結構的系統動力學特性看,實數詞匯結構應該更接近實際情況,而且實數詞匯結構還可以表達出詞匯量和詞匯熟練度的變化過程,模型表達能力更豐富。
6.3 政策調控語言共存參數空間計算實驗
6.3.1 干預調控機制
在自然條件下系統很難穩定在共存狀態,本文希望找一些控制某(幾)種參數能使競爭的兩種語言都共存的干預機制。借鑒文獻[4]的干預機制,本文模擬采取下面這樣的干預機制來調整相關參數:假設一個任意模型參數值θ,它是瀕危語言人口比例的函數θ(x)。為了建立一個可控分析模型,假設一個社區能夠在某單語人口比例低于某一域值時調控一些參數值,x≤T,具體可表示如下:

式(15)中θ和θ′是兩個常數,θ代表干預前參數的值,θ′代表干預后參數的值,x代表某單語人口比例,T代表調控域值,如圖9所示。實際上,一個社區能調整參數的程度是有限的,θ(x)的改變也是漸變的過程(圖9中用虛線表示),但在理論上通常能描述成如式(15)的定性行為。本文假定不同的參數值集合情況下,模型在干預前后都是有效的。

Fig.9 Function of intervention圖9 干預函數
圖9 中實線描述的是一種語言競爭模型干預機制的定性行為。當某單語人口比例低于某一域值T時,將導致模型某一參數的值立刻從θ增長到θ′,經過調控,當系統中的人口比例恢復到高于域值T時,則調控參數從θ′恢復到θ。虛線描述的是一種更實際的參數值逐漸變化的過程。
6.3.2 干預措施對語言共存可能性的影響
在探究干預措施對語言共存可能性的影響時,主要關心的不是決定采取什么樣的干預措施來維持瀕危語言的保存,而是考慮能否通過政策調控達到較佳的效果。為了說明及體現政策調控在整個參數空間的作用,以語言初始人口比例參數為例,進行調控與不調控的對比實驗,干預原理如式(15)所示,不調控實驗如圖6所示,調控實驗如圖10所示。

Fig.10 Impact of Intervention on range of parameter values of language coexistence圖10 干預措施對語言共存參數空間的影響
圖10計算實驗中設置調控域值T=0.3,調控參數為語言地位(SX=0.35,SX′=0.55)。實數詞匯結構(Rmax=5)中調控與無調控計算實驗對比表明:因X語言初始人口比例x0小且語言地位低,故x0低于0.45情況下,干預調控(語言地位)不能挽回弱勢語言消亡的局面,最終僅有語言Y能夠保存下來;在x0大于0.65后,因其人口基數很大,競爭傳播過程中其人口比例根本不會低于調控域值0.3,所以系統的語言狀態不會改變;由于動態調控的作用,語言共存區間增大且在[0.55,0.65]區間內能穩定地處于語言共存狀態。同理,二進制詞匯結構(Rmax=1)中調控與無調控計算實驗對比表明:在x0<0.35情況下,干預調控不能改變語言狀態,x0>0.85后,系統的語言狀態不會改變;調控后,語言共存區間增大明顯,而由于二進制詞匯結構的系統對參數很敏感,增強了系統隨機性的影響,語言共存區間呈振蕩起伏狀態,但曲線總體趨勢保持不變。圖10(b)—(a)橫向對比,調控政策作用范圍增大,語言共存區間變寬,二進制詞匯結構調控作用幅度更大更不穩定。這是因為其對語言詞匯掌握情況只進行了簡單的會和不會的劃分,放大了政策調控的作用和不確定性。
綜上,圖10表明調控政策的實施能夠明顯提高語言共存的區間范圍,改善弱勢語言瀕危消亡的趨勢;二進制詞結構模型系統跳躍性大,易受系統隨機干擾,理想化嚴重,而實數詞匯結構模型對現實語言情況特征抽象提取的比較適中,較適合用于語言瀕危、競爭和保護等方面的研究,因此下文的參數調控實驗采用的是實數詞匯結構模型。
6.3.3 政策調控參數計算實驗
現實社會中,由于經濟、文化、政治及地理等環境的不同,語言地位必然會有差異,優勢語言的語言地位普遍較高且人口基數較大,弱勢語言地位較低且人口基數少,在此情況下研究如何保護弱勢語言避免其瀕危消亡,且保持各語言的共同發展顯得尤為重要。本文以社會中的某一局部區域為例:人口總數為1 000,X語言地位0.4,為弱勢語言,Y語言地位0.6,為強勢語言,初始X、Y語言人口比例分別為40%、60%,其他參數均設為初始值。根據上述對模型系統及政策調控機理和作用的分析,利用語言地位作為政策調控的參數來研究上述模型初始條件下的政策調控效果,及驗證給出的新模型中實現語言共存的政策可能性。調控前后模型參數值對比如表2所示(未列出的表示沒有被調整)。

Table 2 Comparison of parameter values of model before and after intervention表2 調控前后模型參數值對比
從圖11中可以看出,未實施政策調控前Y語言作為強勢語言最終贏得區域所有人的使用,而弱勢語言X盡管通過雙語形式得到了一定時間的保持,但最終還是消亡,系統收斂于穩定的Y單語狀態。實施政策調控后系統的演化狀態發生了改變,Y單語者未出現快速增長的趨勢,X單語者也未出現快速下降的趨勢,初始出現少量下降后,均一直穩定在一定水平,雙語者則經過一段時間的穩定增長后,逐漸穩定在一定水平。最終系統收斂于穩定的X、Y兩語共存狀態且有一定比例人口能夠熟練地使用弱勢語言X,語言人口比例結構較理想,能夠有效地保護弱勢語言,避免其瀕危消亡。

Fig.11 Change of population proportion in language before and after intervention圖11 參數調控前后語言人口比例變化
圖12反映了網絡中不同母語類型人員的不同語言詞匯量的演化狀況。圖12(a),在系統未實施調控前,母語Y強勢語言使用者的Y詞匯量一直處于最大詞匯量,未受系統演化影響,同時也不兼用弱勢語言X的詞匯。相反,母語X弱勢語言使用者的X詞匯量則呈不斷下降趨勢,同時其兼用強勢語言Y的詞匯量則呈不斷上升趨勢,最終母語X使用者不再使用母語詞匯,而全部轉用了Y詞匯,成為了Y單語者,X詞匯在全部網絡人員中出現了消亡。圖12(b),在系統實施調控政策后,母語Y使用者的Y詞匯量和母語X使用者X的詞匯量則經過一定時間的下降后穩定在一定的水平,而母語X使用者兼用Y的詞匯量和母語Y使用者兼用X的詞匯量均呈上升趨勢,并逐漸穩定在一定水平,經過政策調控后,實現了兩種語言詞匯共同兼用的共存狀態。
以新西蘭毛利人的語言政策調控為例[22]。語言地位的提升及語言覺悟的提高有利于弱勢語言的保存和傳承。歐洲殖民者長期的同化、融合政策使新西蘭毛利語言文化面臨滅亡的險境。毛利人民在強烈的民族意識、積極的語言態度以及強大的本民族文化認同驅動下,為了保護自己的語言文化采取了一系列的措施,如通過爭取獲得了母語的官方語言地位、毛利人從幼兒園至大學教育的主導權及自主創設本民族母語環境等措施以復興母語并取得成功。毛利人還向政府爭取更多在公共服務部門、行政、官方傳媒等場合推廣、使用毛利語的權利。這些調控措施都為毛利人的語言地位的持續提升起到了積極的作用,同時毛利人積極主動建立家庭、社區母語環境,保證了語言的活力、真實。

Fig.12 Change of average vocabulary size before and after intervention圖12 參數調控前后平均詞匯量變化
本文利用基于agent的社會圈子網絡理論構建結構上更接近實際社會網絡的動態語言競爭網絡,網絡中的agent被賦予實數詞匯結構,同時給出agent間微觀語言交流傳播規則,提出了一種新的動態微觀語言競爭社會仿真模型。本文模型能對語言競爭演化、語言瀕危的內外部因素及相互作用機理進行較確切的解釋,通過構建語言競爭與政策調控社會仿真系統,再現語言競爭動態社會網絡系統的復雜性與演化規律,為有效地研究語言瀕危與調控機制提供解釋和計算實驗平臺。重點分析對比了實數詞匯結構與二進制詞匯結構模型中的語言共存參數空間及政策調控的作用,最后通過調控實例,用語言人口比例、詞匯量及熟練度的變化等數據共同說明模型政策調控的效果。計算實驗表明,在缺乏干預的情況下,語言共存的參數空間范圍很小,系統演化很難達到共存狀態,最終一種語言的消亡是不可避免的,但在合適的時間窗口實施動態的調控政策可以讓語言共存的參數空間顯著擴大。實數詞匯結構模型具有更加豐富的表達能力,能更好地模擬仿真語言競爭傳播演化過程,更能體現人類文化系統的穩定性和韌性。模型的許多方面能夠被改善,模型中語言交流傳播規則較簡單,只考慮了兩種語言競爭,沒有明確構建語言人口的地理分布等。
現實中,在一個地區,初始語言人口比例幾乎不能調整,高交流率是社會和諧和社會開放的標志,因此目前條件下,需要出臺一些提高弱勢語言地位,增強語言保護意識和促進雙語教學等政策配合來達到弱勢語言保護的目的。
[1]Wang Feiyue.Artificial societies,computational expermients, and parallel systems:a discussion on computational theory of complex social-economic systems[J].Complex Systems and Complexity Science,2004,1(4):25-35.
[2]Yun Jian,Liu Xiangdong,Liu Yongkui.Computational modeling of a social phenomenon:evolution of cultural identity and cultural territory[J].Journal of Computer Research and Development,2013,50(12):2590-2602.
[3]Abrams D M,Strogatz S H.Linguistics:modelling the dynamics of language death[J].Nature,2003,424(6951):900.
[4]Minett J W,Wang W S Y.Modeling endangered languages: the effects of bilingualism and social structure[J].Lingua, 2008,118(1):19-45.
[5]Solé R V,Corominasmurtra B,Fortuny J.Diversity,competition,extinction:the ecophysics of language change[J]. Journal of the Royal Society Interface,2010,7(53):1647-1664.
[6]Mira J,Seoane L F,Nieto J J.Importance of interlinguistic similarity and stable bilingualism when two languages compete[J].New Journal of Physics,2011,13(3):1162-1165.
[7]Neus I,Joaquim F.Language extinction and linguistic fronts [J].Journal of the Royal Society Interface,2014,11(94): 3073-3077.
[8]Otero-Espinar M V,Seoane L F,Nieto J J,et al.Analytic solution of a model of language competition with bilingualism and interlinguistic similarity[J].Physica D Nonlinear Phenomena,2013(264):17-26.
[9]Zhang Menghan,Gong Tao.Principles of parametric estimation in modeling language competition[J].Proceedings of the National Academy of Sciences of the United States ofAmerica,2013,110(24):9698-9703.
[10]Li Xiang,Chen Guanrong.A local-world evolving network model[J].Physica A:Statistical Mechanics and Its Applications,2003,328(1/2):274-286.
[11]Kosmidis K,Halley J M,Argyrakis P.Language evolution and population dynamics in a system of two interacting species[J].Physica A:Statistical Mechanics and Its Applications,2005,353(2):595-612.
[12]Stauffer D,Castelló X,Eguíluz V M,et al.Microscopic Abrams-Strogatz model of language competition[J].Physica A:Statistical Mechanics and Its Applications,2007,374(2): 835-842.
[13]Castelló X,Eguíluz V M,Miguel M S.Ordering dynamics with two non-excluding options:bilingualism in language competition[J].New Journal of Physics,2006,8(12):308-322.
[14]Castelló X,Toivonen R,Eguiluz V M,et al.Anomalous lifetime distributions and topological traps in ordering dynamics[J]. Europhysics Letters,2007,79(6):417-429.
[15]Toivonen R,Castelló X,Eguíluz V M,et al.Broad lifetime distributions for ordering dynamics in complex networks[J]. Physical Review E:Statistical,Nonlinear,and Soft Matter Physics,2009,79(1):100-115.
[16]Zhecheng An,Qiuhui Pan,Guangying Yu,et al.The spatial distribution of clusters and the formation of mixed languages in bilingual competition[J].Physica A:Statistical Mechanics&ItsApplications,2012,391(20):4943–4952.
[17]Castelló X,Loureiro P L,Miguel M S.Agent-based models of language competition[J].International Journal of the Sociology of Language,2013(221):21-51.
[18]Heinsalu E,Patriarca M,Leonard J L.The role of bilingualsin language competition[J].Advances in Complex Systems. 2014,17(1):1450003.
[19]Wang Chao,Bi Guihong,Zhang Shouming,et al.Agentbased language competition model with social circle network[J].Journal of Computer Applications,2014,34(8): 2202-2208.
[20]Hamill L,Gilbert N.Social circles:a simple structure for Agent-Based social network models[J].Journal of Artificial Societies and Social Simulation,2009,12(2):3.
[21]Wilensky U.NetLogo 4.1.3[CP/OL].Center for Connected Learning and Computer-Based Modeling,Northwestern University,Evanston,USA(2012)[2015-10-25].http://ccl. northwestern.edu/netlogo/.
[22]Gao Xia.New Zealand Maori language revival:the practice of fighting for minority languages'official status and native language maintenance and inheritance[J].Academy,2010 (5):60-66.
附中文參考文獻:
[1]王飛躍.人工社會、計算實驗、平行系統——關于復雜社會經濟系統計算研究的討論[J].復雜系統與復雜性科學, 2004,1(4):25-35.
[2]云健,劉向東,劉勇奎.文化認同及文化版圖演化現象的社會計算模型[J].計算機研究與發展,2013,50(12):2590-2602.
[19]王超,畢貴紅,張壽明,等.基于agent社會圈子網絡的語言競爭模型[J].計算機應用,2014,34(8):2202-2208.
[22]高霞.弱勢語言官方地位爭取及母語保護傳承實踐——以新西蘭毛利語言復興運動為例[J].學園,2010(5):60-66.

ZENG Zhenhua was born in 1987.He is an M.S.candidate at Kunming University of Science and Technology.His research interests include process control,complex systems and complex networks,etc.
曾振華(1987—),男,湖南衡陽人,昆明理工大學碩士研究生,主要研究領域為過程控制,復雜系統與復雜網絡等。

QI Yaping was born in 1987.She is an M.S.candidate at Kunming University of Science and Technology.Her research interests include complex systems and complex networks,etc.
齊亞萍(1987—),女,山西朔州人,昆明理工大學碩士研究生,主要研究領域為復雜系統與復雜網絡等。

BI Guihong was born in 1968.He is a professor and M.S.supervisor at Kunming University of Science and Technology.His research interests include social and economic system simulation,signal processing and pattern recognition,etc.
畢貴紅(1968—),男,云南石林人,昆明理工大學教授、碩士生導師,主要研究領域為社會和經濟系統仿真,信號處理,模式識別等。

ZHANG Shouming was born in 1966.He is a professor and M.S.supervisor at Kunming University of Science and Technology.His research interests include multi-dimensional information fusion and modeling of complex systems,etc.
張壽明(1966—),男,云南大理人,昆明理工大學教授、碩士生導師,主要研究領域為復雜系統的多維信息融合與建模等。

CAI Zilong was born in 1976.He is a lecturer at Kunming University of Science and Technology.His research interests include system analysis and integration,etc.
蔡子龍(1976—),男,云南宣威人,昆明理工大學講師,主要研究領域為系統分析與集成等。
Social Simulation and Computational Experiment Model with Integer Vocabulary Structure for Language Competition*
ZENG Zhenhua1,QI Yaping1,BI Guihong2+,ZHANG Shouming1,CAI Zilong2
1.Faculty of Information Engineering and Automation,Kunming University of Science and Technology,Kunming 650500,China
2.Faculty of Electric Power Engineering,Kunming University of Science and Technology,Kunming 650500,China
+Corresponding author:E-mail:km_bgh@163.com
Language evolution is one of the important problems in social science field.Before the social simulation methods are introduced in,this problem is a typical social science problem which can’t be applied to computing experiments.It is feasible to apply social simulation methods to this problem.This paper proposes a new dynamic social network model to study the competition between two languages.This model is based on agent modeling method and social circles theory.In order to reflect the vocabulary of the language and its proficiency,a language structure with twoF-length integer-strings is introduced into the agent which is a node of the network.It proves that the new model has the same dynamic characteristics as the previous model and analyzes the effect of language policy by computational experiments.The dynamic characteristics are compared between bit-strings vocabulary structure and integer-strings vocabulary structure system.The experimental results show that the range of parameter values of language coexistence is very small and it is difficult to achieve the state of language coexistence without intervention,but the range is significantly broadened to achieve the coexistence state when the intervention is undertaken.Furthermore,it is obvious that the integer-strings vocabulary structure system is more expressive.
social circle;complex network;language competition;social simulation;computational experiment
A
:TP391.9
10.3778/j.issn.1673-9418.1511059
*The National Natural Science Foundation of China under Grant No.61364022(國家自然科學基金).
Received 2015-11,Accepted 2016-03.
CNKI網絡優先出版:2016-03-11,http://www.cnki.net/kcms/detail/11.5602.TP.20160311.1632.002.html