蘇德照 岑 嵐 黃 艷 楊承濤 鐘春堅
1.百色學院數學與統計學院 廣西百色 533000;2.百色學院教育科學學院 廣西百色 533000
貝爾數是用在組合數學中的一組整數數列構成,是以埃里克坦普爾貝爾而命名的[1]。楊勝彬等[2]2015年為建筑工程總公司對基站建設方案進行研究,采用隨機窮舉算法探索出了最優化的污水處理站建設方法,將貝爾集合劃分運用到實際問題中去。付秋菊[3]2019年以代數的視角來研究并探索集分類的問題,具體來說,就是在有限域上成立了一個能夠把所有集合都劃分在零維仿射代數上的映射,并且對這些映射的代數性質進行深入研究。王爽[1]2012年系統研究Stirling變換公式在Bell多項式與錯排多項式、調和數中的運用。我們基于貝爾數各類的函數關系式和遞推公式,對貝爾數理論進行推導和貝爾數與集合劃分的進行實際應用問題研究,結合三種度量進行研究。
在組合數學里,將一個n元集合劃分的組合總個數稱為貝爾數,記作為Bn;設n元集合的所有貝爾劃分集合為B(n)。集合S的另一個重要劃分概念是將集合S劃分成非空子集且兩兩互不相交的并集[3],B0是1。
由它的集合劃分可以總結出一些結論:
當n=1時,第一列第一項的貝爾數為a(1,1)=1;
當n>1時,第n行第一項的貝爾數為a(n,1)=a(n-1,n-1);
當n>1,m>1時,則有第n行第m項的數值為a(n,m)=a(n-1,m-1)+a(n,m-1)。
由上述結論得出的結果,將所得到的數值繪制成數表(結果見表1),稱為L型貝爾數運算表,由于此運算方式與L類似將其定義為L型運算,該數表每行的首項為貝爾數[4]。

表1 L型貝爾數運算表
證明:由于Bn+1是含有n+1個元素的集合劃分個數,設Dn的集合為{b1,b2,...,bn},Dn+1的集合為{b1,b2,…,bn,bn+1},那么可以認為集合Dn+1是在集合Dn的基礎上添加一個元素bn+1產生的,接下來可以單獨考慮第bn+1個元素。
(1)可以假設當bn+1元素被單獨分配到一類時,剩下有n個元素,所以在這種情形下有(nn)Bn劃分個數;
(2)可以假設當bn+1元素和剩余的n個元素中的一個元素劃分為一類時,那么還剩下n-1個元素,這種情形下有(nn-1)Bn-1劃分個數;
(3)可以假設當bn+1元素和剩余的n個元素中的兩個元素劃分為一類時,那么還剩下n-2個元素,這種情形下有(nn-2)Bn-2劃分個數;
任意的貝爾數都是對應“第二類Stirling數[1,3]”的和。
豪斯多夫距離是匹配二點特征的一個距離方式,它并不要求建立點和點間的一一對應關系,僅要求算出這兩個點集間的相似度(或最大距離),從而能夠更高效地處理一般特征點的情況[5]。
把距離函數定義成兩個空間的距離推測,目的是描述兩個有限封閉的集合之間的相似度的一種度量。以下是對豪斯多夫距離的定義:
定義2.1 假設該空間上存在有兩個點集A和B,那么H(A,B)表示集合A與集合B之間的豪斯多夫距離,則其數學定義為H(A,B)=max(h(A,B),h(B,A))。為A集合與B集合間的雙向豪斯多夫距離[5-6]。

范數是對函數、向量和矩陣定義的一種度量形式,同時也是數學中的一種基本概念。其在泛函分析中,它定義在賦范線性空間中,并需要滿足一定的條件,即①非負性:||x||≥0且||x||=0?x=0;②齊次性:||cx||=|c|||x||;③次可加性:||x+y||≤||x||+||y||。范數經常被用來度量某一個向量空間(或矩陣)中的每一個向量的長度或者大小。上述的||·||稱為x上的一個范數。
在論文中用N來代表每個自然數的集合,用R表示每個實數值的集合,用R+代表每個正實數值的集合。對所有集合,用|A|表示該集合的基數,P(A)表示該集合的冪集[7],冪集是原集合中所有的子集(其中也包括全集和空集)所構成的集合族。



度量很好地繼承了數學中的公理化性質和測量點或結構距離的直觀性質。在這里介紹各種度量,以進一步設計統計機制。
秩度量的應用相對是比較容易,但由于它過于簡單,而且主要取決于對分區組進行排序的要求,在某些數據類型中,有可能無法滿足這一要求。為了克服這一缺點,可以通過豪斯多夫度量和改進后的豪斯多夫度量來實現。現在來介紹這兩個度量。
設α:S×S→R為距離函數,其中S?N為有限集。設GOα(或α:S×S)表示α的距離矩陣。設B(S)是S的所有貝爾劃分的集合。設?P,Q∈D(S),?p∈P,?q∈Q,其中P表示劃分矩陣行,Q表示劃分矩陣列。定義距離矩陣行式最小值查找函數為Cn(p,Q)=min{α(p,q),qQ},即為了尋找出每個集合劃分的距離矩陣的每一行最小值;定義距離矩陣列式最小值查找函數為Cm(P,q)=min{α(p,q),pP},即為了尋找出每個集合劃分的距離矩陣的每一列最小值。定義行式最小值中的最大值查找函數FCn(P,Q)=max{Cn(p,Q),pP},即是尋找出所有行中最小值中的最大值。定義列式最小值中的最大值查找函數FCm(P,Q)=max{Cm(P,q),qQ},即是尋找出所有列中最小值中的最大值。定義行式最小值中的平均值查找函數即是尋找出所有行中最小值中的平均值。定義列式最小值中的平均值查找函數即是尋找出所有列的最小值中的平均值。
基于定義2.1和定義2.2有如下定義。
定義3.2(豪斯多夫度量[5-6])由dF:P(S)×P(S)→N,有dF(P,Q)=max{FCn(P,Q),FCm(P,Q)},用GOF來表示其相關的距離矩陣。
定義3.3(改進后的豪斯多夫度量[5-6])由dA:P(S)×P(S)→R,有dA(P,Q)=max{ACn(P,Q),ACm(P,Q),用GOA表示其相關的距離矩陣。

根據上述定義的度量,下面將設計能夠反映出客觀性轉換程度的相應度量標準和范數。
定義3.5(秩度量標準)由定義3.1(秩度量)得到:
當且僅當|P∪Q|=1且drm(P,Q)=0時,分母等于0,默認它是忠實地轉換的,因此該定義是合理的。以下定義同理。
定義3.6(秩度量范數)對于Hr*:D(S)→R+,有Hr*(I)=∑PI∑QIHr(P,Q)。
如果對分母進行分析,就會發現它代表了客觀性心理過程之前的結構距離,分子表示處理后的主觀性,這個比率揭示了主觀性相對于客觀性的相對程度。以下定義同理。
定義3.7(豪斯多夫度量標準)由定義3.2(豪斯多夫度量)得到:
定義3.8(豪斯多夫度量范數)對于HF*:D(S)→R+,有HF*(I)=∑PI∑QIHF(P,Q)。
定義3.9(改進后的豪斯多夫度量標準)由定義3.3(改進后的豪斯多夫度量)得到
定義3.10(改進后的豪斯多夫度量范數)對于HA*:D(S)→R+,有HA*(I)=∑PI∑QIHA(P,Q)。
設?E,F∈B(S),基于上述定義,設計了以下分區度量。
定義3.11(秩度量分區)有Tr:B(S)×B(S)→R,得到Tr(E,F)=|Hr*(E)-Hr*(F)|。
定義3.12(豪斯多夫度量分區)有TF:B(S)×B(S)→R,得到TF(E,F)=|HF*(E)-HF*(F)|。
定義3.13(改進后的豪斯多夫度量分區)有TA:B(S)×B(S)→R,得到TA(E,F)=|HA*(E)-HA*(F)|。
以上分區(劃分)均基于絕對值度量。
論文主要利用三種度量進行客觀性和主觀性機理轉換,該論文旨在客觀性到主觀性的轉換機制,主要利用集合劃分的概念進行引入,可以模擬得到客觀性到主觀性的轉換中應用該劃分。下面對于高中學生考試成績的客觀性預測評估,在此已知該次考試的分數區間為[0,150],根據新課改政策的要求,可以將各個學科考試成績分為5個等級,即為A等[127.5,150]、B等[105,127.5)、C等[90,105)、D等[60,90)、E等[0,60)。
現假如八名學生是通過正常排序行為感知客觀性,即根據正態分布進行排序,評估結果是由該名學生平時表現客觀性評價得出,那么八名學生對另一名學生的某一次考試成績進行分數評估結果,具體結果詳見表2。

表2 八名學生對另一名學生的某一次考試成績分數評估



表3 客觀性相關距離相關矩陣

表4 由度量產生的相關距離矩陣
1.三種度量標準的應用

表5 由度量標準產生的相關距離矩陣
2.三種度量范數的應用
由秩度量范數求得結果為6.32;由豪斯多夫度量范數求得結果為8.56;由改進后的豪斯多夫度量范數求得結果為8.04。
1.W檢驗
由相關距離矩陣GOr、MORMS數據檢驗得到p-value=0.0255、0.0135<0.05,說明數據正態性比較差;由相關距離矩陣GOF、GOA數據檢驗得到p-value=0.0957、0.0614>0.05,說明數據服從正態分布的特征,數據正態性較好。
2.卡方檢驗
通過對三個度量產生的相關距離矩陣(GOr、GOF、GOA)的數據進行雙尾檢驗,選擇通過顯著性水平為5%,卡方檢驗結果詳見表6。由檢驗結果得出以下結論,如果采用秩度量,則會拒接原假設;如果采用豪斯多夫度量和改進后的豪斯多夫度量,則會接受零假設。說明了采用豪斯多夫度量和改進后的豪斯多夫度量得到的結果與主觀性具有一致性,并同時說明方法具有可行性。

表6 雙尾檢驗95%置信區間、方差、p-value
(1)首先假設受試者具有隨機性,由受試者得到的數據具有可用性。
(2)假設客觀狀態到主觀狀態的心理轉換是基于給定數據的正態分布,在后續產生的相關距離矩陣進行正態分布檢驗(W檢驗),在一定程度上保證了數據的正態性。
(4)當從客觀性到主觀性的轉換用整數來近似時,如果一個人的自身能力能夠處理更精細的結果,那么得到的數據將更加符合受試者的意愿,可以采用更細的標度,從而客觀性轉換也可以提高精確度。
(5)在進行非參數測試時,通過參數限制樣本空間。考慮的貝爾分區只是一部分,并限制在帶有固定類別(組)的貝爾分區的子類別。
由于學生每次考試成績是受多方面因素影響,在學生考試成績的預估中,由檢驗結果可以得出以下結論。如果采用秩度量,則會拒接原假設;如果采用豪斯多夫度量和改進后的豪斯多夫度量,則會接受零假設。說明在客觀性和主觀性進行機理轉換中,采用豪斯多夫度量和改進后的豪斯多夫度量可以很好地將客觀性轉換到主觀性,可以預估出學生主觀性的猜測。該方法還可以將應用于其他領域進行研究,比如經濟領域、投資領域等。
致謝:感謝百色學院數學與統計學院陳瑞明老師對本文的指導!