摘 要:一個漢字就是一個字節。字節由1個音素或最多4個音素組成。由于每個音素的發音方法和發音部位不同,又分為元音和輔音兩大類。每個音素的發音具有區別于其它音素發音的獨立特征,稱為特征音。除部分輔音外,音素是以被泛音調制后的基頻周期為循環周期的波動。由于泛音的調制作用,相鄰波形極性對偶但半周期卻不對稱。
關鍵詞:特征元群周期
中圖分類號:H311文獻標識碼:A文章編號:1674-098X(2011)08(b)-0224-02
為了展示音素的循環結構,對于語音放大采用高增益放大器,放大器頻帶寬度設定在150Hz~2kHz。將語音中凡過零點的波動均被放大至脈沖狀,沒有過零點的波形被摒棄,經整形后送入計時器,記錄每一個半波寬度(即半周期),并存入存儲器。再播放時盡管有些失真,但仍然保持了原語音的基本特征。
記錄半波半周期的計時器為16位寬。一個半周期數據必需用兩個8位寄存器分別存儲低字節和高字節。在文中標注時,采用雙字節標注法有利于數值間的比較,其標注方法是:低字節數據在前,并有下劃線;高字節數據在后,字體略大,與低字節數據之間不留空格,表示為一個完整的半周期數據;與前后相鄰半周期數據畫出高低電平以示區別。如表示1289這個半周期數據處于高電平,相鄰半周期數據為低電平。計時器在運行時,每1微秒作一次加1操作,1289這個以雙字節標注法表示的半周期數據轉換成以秒為單位的10進制數為(9×256+128)×0.000001(s)=0.002432(s)。例1是單音素、陰平調“衣”的語音記錄片段。
由于人的發聲器官不可能對每個半波半周期都控制的非常精確,在允許一定誤差的前提下,可以看出在例1中存在一個循環單元貫穿其中,由有下劃線和不劃線來區分(有無劃線只是為了區分,沒有本質區別);在這里稱這個循環單元為特征元。在例1中所有特征元均為4位組成。相鄰特征元的同一順序號的位為對應位;如果對應位之間正負差值在幾微秒~百微秒左右之間(個別現象除外)即認為是相同的。由于是循環結構,特征元的劃分從任一位為起始位都是一樣的;為了明顯一致,特征元的劃分以較低頻率、高電平半波為起始位。
除部分輔音如X、SH、S等,是由聲帶送氣、聲源在嘴部發聲以外,凡以聲帶發聲為聲源的音素都具有循環結構。如果出現特征元發生變異或消失必定是當前音素發音的結束。特征元內最少由一高一低兩位半波組成,最多可達幾十位。語音放大器帶寬越寬位數就越多,反之減少。在相同條件下,不同特征音其特征元位數也可能不同;但是無論位數多少,必定由偶數位組成。
不同的特征音在特征元內有著不同的半波組成。例2是從不同的特征音中提取出來的特征元。通過比較可以看出它們之間的差別。
選擇一個單音素、陰平調語音音素發音序列,將其劃分出特征元,在保證特征元完整不變的前提下,把順序打亂,以特征元為單位隨機輸入存儲器,在播放時仍發原音。如果隨機輸入時每個特征元從尾部向前輸入,也就是特征元反向輸入,再播放時特征音仍不變。如果將所有特征元拆分開來,再隨機輸入,那么特征音便不復存在了。這說明特征元是保持音素特征音的最小單位。
特征元內各位半波半周期的總和稱為群周期,以TN表示,對TN數值的表示方法仍采用雙字節標注法。群周期由式1/TN﹝將雙字節標注法轉換為(秒)﹞=頻率,進行群周期與基頻頻率的轉換。
音素中特征元群周期不是一成不變的。在陰平調語音中會有小幅變化,在陽平、上聲、去聲的語音中,群周期隨著聲調的改變而改變,聲調越高群周期越短。男聲群周期長,女聲群周期短。所以也可以同時認為音素是以特征元群周期為循環周期的。
例3中第一、二行是分別從校音管“A”和88鍵鋼琴小字一組音名為“A”的發音序列中提取出的特征元。理論上它們的波動頻率(440HZ)應該是相同的。再把二胡的外弦按校音管“A”校準,將其發音序列中提取出的特征元列于第三行。
在例3中,泛音按自身規律調制基頻,于是就產生了獨有的特征音(在音樂中叫音色)。同一基頻被不同的泛音調制就會產生不同的音色。這就觸類旁通的證明了語音中不同的特征音其特征元為什么會有不同的內部組成。
通過分析,可以得出:群周期與基頻的波動周期是相同的。但是群周期與基頻周期是兩個不同的概念。群周期更加明確的揭示出音素的內在原理。
單音素字節的發音就是單音素本身的發音。由2~4個音素組成的字節中,人的發聲器官對每個音素按即定順序逐個發音(參照漢語拼音),人耳聽覺系統聽到的是這些音素的組合音。
在說話時,每個字節中音素的群周期,是隨著地方方言發聲規律、聲調變化、再結合個人習慣、情感表達的不同而變化的。而在唱歌時,歌聲中每個字節中音素群周期(除部分輔音外)必須與伴奏器樂對應音高的波動周期相同或呈倍頻程(octave)關系,由于字節中音素的群周期依照音高按12平均律的規則變化,于是語音就有了樂感。
但是在歌聲中音素群周期與音高對應不是跳變的。字節與字節之間的音高改變和一個字節在延長發聲過程中的音高改變均不是跳變的。在兩個不同音高的中間一小段過渡部分,群周期具有趨向性滑動改變:后音高高于前音高的群周期會遞減直至達到目的音高;后音高低于前音高的則相反。
當聲調變高時,群周期在循環過程中逐漸變短,特征元內各個半波的半周期有的位減值大,有的位減值小,也有的位保持相對穩定,這種變化并非變異,所以仍然保持著特征音。例4是從上聲調“五”的語音序列中聲調從低到高的一段提取出來的特征元進行比較。為了比較的方便,在例4中將特征元豎向排列,在實際語音中它們是首尾相連的。
在例4中每個特征元前面的數字為排隊號,后面的TN值為群周期。第1號特征元內為6位,當運行到第7號時,第2位數據已減值到幾乎為原值的一半,第3位數據也有減值。從第12號運行到第13號時,第1、2、3位數據已消失。第13號特征元的第1位數據是在這之前第1、2、3位數據的合并。特征元從第13號開始變為4位。從第13號到26號中的第1位繼續不斷減值,從第26號直到發生變異之前一直保持著這種組成。
如果將第13號以前特征元的第1、2、3位數據作人為合并(例4括號內數據),不會影響特征音,只是清晰度有所下降。所以可以將前3位看成是1個數據,這樣一來所有的特征元都為4位。從中可以看出隨著聲調的升高,特征元內的第1位在不斷減值,造成群周期的連續減小;但對所有特征元的后3位影響卻相對較小。
在語音中存在很低頻率的半波被分解現象,這是因為聲帶作很低頻率振動時,由于半周期過長,在極限位置不能持久,便物極必反的向反方向運動(也應該屬于泛音,如果將語音放大器頻帶放寬,會出現更多分解)。從波形上看就是被分解。隨著聲調變高群周期縮短,這種現象就會消失,形成合并。這就是例4中1~12號特征元的前3位數據半途合并的原因。合并后的這1位繼續減值,當與其它同極性位的半周期數值接近時,語音就進入尾聲了。
相鄰特征元的群周期存在正負差值,而且特征元之間對應位也存在正負差值。語音中的差值激勵人耳聽力、增添了活躍氣氛,但是這兩種差值過大會造成語音噪聲加大;如在語音啟動階段位與位之間差值較大(百微秒以上),噪聲也大。隨著差值的逐漸減小,語音變的清晰起來。如果完全消除差值,就會毫無生氣,失去“生命跡象”,變成類似于共鳴的振動感。
不同的泛音結構對基頻的調制會產生不同的特征音。泛音占據的是基頻的份額,在滿足了所有泛音的占據以后,在基頻中只剩下相對泛音要低很多的低頻半波了(有可能被分解)。群周期的變化首當其沖是相對低頻半波的變化,每個泛音半波在變化中保持了相對穩定。這就是特征元的內涵。
在語音中任何一個有潛在能力可以影響語音性質的因素,如果僅在個別地方出現,其影響力微乎其微;它必需具有極高的重復概率和連續性才能發揮作用。
結論:
一.以聲帶發聲為聲源的音素中存在一個循環單元稱之為特征元,特征元是語音中的基頻被泛音調制以后的組合體,由偶數位組成,是保持音素特征音的最小單位。不同音素的特征元具有不同的內部組成。語音的傳送以基頻為載體,以泛音的調制為特征。
二.特征元內各個位半波半周期的總和稱為群周期,語音聲調由群周期決定。群周期與語音基頻的波動周期是相同的。
三.歌聲是具有循環結構的音素群周期按12平均律規則變化的語音。