葉瑞松
(汕頭大學 數學系, 廣東 汕頭515063)
在概率論與數理統計的教學中,兩個一維連續型隨機變量的函數的分布及其相關的概率計算均比較復雜.很多大學生對這部分內容的學習常常理不清頭緒,普遍不能夠很好地掌握這部分內容,學習費力,效率不佳,可以說是事倍功半,從而導致失去進一步學習的興趣;對數學專業的學生來說,也將影響其繼續學習后續隨機數學的相關課程.這其中的原因主要有兩個:① 兩個一維連續型變量的函數的分布及其概率的計算過程涉及較為復雜的二重積分計算, 包括積分區域的不規則,二次積分上下限的確定,累次積分的準確計算等問題.②傳統教材上的例子多數脫離實際,是純粹理想的數學構造,學生在學習過程未能切身體會其實實在在的應用背景,學習上提不起興趣[1-4].
筆者根據多年在信號、圖像信息領域中經常碰到兩幅圖像信息或兩個信號之間的求和模運算的實際問題,發現研究兩個一維隨機變量X,Y之和的模函數Z=mod(X+Y,L)的分布及其概率計算,無論在理論上還是應用中均很有意義[5].這個函數在教材中是未作介紹的,但實際上這個函數在圖像信息加密和編碼中均發揮了很重要的作用,對這個函數的分布的研究很有必要,所得的結果可以用來指導圖像信息加密和編碼的應用研究.這是對概率論教材中例子的很好補充.由于該函數具有很強的應用背景,對工科學生來講,能讓他們明白該函數應用的領域,了解該函數的應用價值,這對提高他們進一步學習概率統計的興趣,有很好的激勵作用.
目前大多書概率統計的教科書對兩個隨機變量的和函數的分布問題均有介紹,但是這個和函數的分布在應用中需要改造才能加以應用[6-8].本文針對圖像加密領域中兩個一維隨機變量和的模函數,分別對連續型和離散型的情況進行討論.雖然在工程應用中碰到的隨機變量問題均是離散型的,但是也有必要對其連續型的情況做理論上的探討,進一步提升學生的數學理論素養.論文從理論上證明了兩種情況下的分布函數的相關結果,介紹了該函數在圖像信息安全領域的一個應用,并用數值例子驗證了相關的理論結果.
首先介紹模函數mod(s,t),該函數是一個二元函數,當兩個自變量均是整數時,模函數就是求余數.當兩個變量是一般的實數時,表示取模,返回余數,具體地講,就是將s寫成t與一個整數k的乘積和一個落在[0,t)之間的余數之和的形式s=kt+r, 那么mod(s,t)的函數值就是r.將這個模函數應用到隨機變量的場合,引進兩個一維隨機變量X,Y之和的模函數,這是對傳統教材上的兩個隨機變量的和函數的一個推廣.
一般灰度圖像的亮度值的范圍在理論上均是歸一化為區間[0,1),所以本文的模函數中的模t一般設為1, 從而函數值的值域也是[0,1).一般的灰度圖像的亮度值可以取值0, 所以本文所說的服從均勻分布的隨機變量在取值0時,其概率或概率密度與一些教材上的定義稍有不同, 不同之處在于隨機變量取值0可以具有正的概率或概率密度.如果兩個隨機變量X,Y均是區間[0,1)上的均勻分布,將有下面的定理1.
定理1假設連續型隨機變量X,Y相互獨立,均服從區間[0,1)上的均勻分布,即X,Y~U[0,1).則Z=mod(X+Y,1)的分布也是U[0,1).

圖1 函數Z=mod(X+Y,1)的分布 函數計算示意圖
證由于X,Y相互獨立,且服從相同的均勻分布U[0,1),其概率密度函數為
所以二維隨機變量(X,Y)的聯合概率密度函數為

而Z=mod(X+Y,1)的取值在[0,1),假設Z的分布函數為F(z),則
(i)對任意的z≥1,F(z)=P(Z≤z}=1;
(ii)對任意的z<0,F(z)=P(Z≤z}=0;
(iii)對任意的0≤z<1,
F(z)=P(Z≤z}=P{mod(X+Y,1)≤z}=P{0≤X+Y≤z}+P{1≤X+Y≤1+z}
其中,當0≤z<1時,分布函數的計算可以參看圖1. 從上面計算所得知道Z~U[0,1).
將隨機變量離散化,得到兩個隨機變量和的模函數的離散型問題,其結果可以用到數字圖像的加密領域中設計兩幅圖像和的模函數.模函數以及和函數的變量均是整數,所以有針對性地選取模為2的冪次數2m,其中m為某一個正整數.具體的應用場合就是數字圖像,一幅灰度圖像的亮度值可以用m比特的整數來表示,m比特的整數隨機變量總共可表示2m個不同的值{0,1,2,…,2m-1},也就是說,如果隨機變量X,Y表示m比特的圖像的亮度,其取值范圍就是{0,1,2,…,2m-1}. 比如m=8比特的數字圖像,有28=256個不同灰度層次.定理1的離散型版本即是下面的定理2.
定理2假設離散型隨機變量X,Y相互獨立,服從相同的均勻分布:

X(Y)01…2m-1pk2-m2-m…2-m
則Z=mod(X+Y,2m)的分布和X,Y的分布相同.
證Z=mod(X+Y,2m)的取值范圍為{0,1,2,…,2m-1},所以要得到其分布律,只要計算0≤k≤2m-1時,對應的概率P(Z=k}:
P(Z=k}=P{mod(X+Y,2m)=k}=P{X+Y=k}+P{X+Y=2m+k}
=(2-m)2×(k+1)+(2-m)2×(2m-1-k)=2-m.
所以Z=mod(X+Y,2m)服從和X相同的分布.
到此,得到兩個一維相互獨立的均勻分布隨機變量和的模函數的相關結論.在實際應用場合,均勻分布一般對應類似噪聲的信號、圖像信息.服從均勻分布的隨機變量所表示的圖像一般是一幅具有明確內容的明文圖像經過加密而得到的密文圖像.在應用中,很自然會碰到一個問題,就是一幅具有自然內容的明文圖像的加密問題,其中一種辦法就是改變圖像每個像素的亮度值,從而遮掩了自然圖像的內容.密碼學要求密文圖像要接近均勻分布,越逼近均勻分布,加密性能越好.所以有必要對這個問題進行探討,如何實現這個加密要求的理想效果,理論上有下面的定理3. 定理3中隨機變量X表示某一幅模擬圖像的連續型隨機變量,其灰度值的范圍已經歸一化到單位區間[0,1),所以其概率密度函數只是在[0,1)取值,而在[0,1)外的概率密度均為0.
定理3假設連續型隨機變量X,Y相互獨立,Y~U[0,1),X的概率密度函數為

則Z=mod(X+Y,1)的分布也是U[0,1).
證Z的取值范圍為[0,1),設Z的分布函數為F(z),則
(i)對任意的z≥1,F(z)=P(Z≤z}=1;
(ii)對任意的z<0,F(z)=P(Z≤z}=0;
(iii)對任意的0≤z<1,
F(z)=P(Z≤z}=P{mod(X+Y,1)≤z}=P{0≤X+Y≤z}+P{1≤X+Y≤1+z}.
由于(X,Y)的聯合概率密度函數為
和定理1一樣,計算當0≤z<1時的分布函數,可以參看圖1,但是這里的計算不能使用Ω1,Ω2的面積作為概率值,需要計算其累次積分.
F(z)=P(Z≤z}=P{(X,Y)∈Ω1}+P{(X,Y)∈Ω2}

所以和定理1結論一樣,Z~U[0,1).
同樣將定理3中的隨機變量離散化,應用到數字圖像處理的領域中,也有相應的離散型的定理4.
定理4假設離散型隨機變量X,Y相互獨立,X服從離散均勻分布:

X01…2m-1pk2-m2-m…2-m
Y的分布律為

Y01…2m-1pkp0p1…p2m-1
則Z=mod(X+Y,2m)的分布和X的分布相同,也是離散均勻分布.
證Z=mod(X+Y,2m)的取值范圍為{0,1,2,…,2m-1},當0≤k≤2m-1時,
P(Z=k}=P{mod(X+Y,2m)=k}=P{X+Y=k}+P{X+Y=2m+k}
=2-m×pk+2-m×pk-1+…+2-m×p0+2-m×p2m-1+…+2-m×pk+1
證明完畢.
更一般地,如果服從均勻分布的隨機變量X與另一個服從任意分布的隨機變量Y相互獨立的話,則可以證明X與Y之和的模函數也一定服從X同樣的分布,即有下面的定理5.
定理5假設隨機變量X,Y相互獨立,X~U[0,b),b>0,Y為任意分布的隨機變量,則Z=mod(X+Y,b)的分布也是U[0,b),且與Y相互獨立.
證該定理的證明分兩步完成.
① 對任意常數y,證明Z=mod(X+y,b)~U[0,b).假設y=kb+a,其中k為整數,而0≤a (i) 對任意的z≥b,F(z)=P(Z≤z}=1; (ii) 對任意的z<0,F(z)=P(Z≤z}=0; (iii) 對任意的0≤z F(z)=P(Z≤z}=P{mod(X+a,b)≤z}=P{0≤X+a≤z}+P{b≤X+a≤b+z}. 當a≤z F(z)=P{0≤X≤z-a}+P{b-a≤X≤b-a+z}