楊俊杰,胡耀民
(山西警官高等專科學校,山西太原030021)
當前,司法話者識別主要依據人耳聽辨、言語識別、語音聲學特性比對等方法,其依據的主要是錄音中說話人的語音信息。其中,語音的共振峰特性是最有區別意義的定量特性[1]。因此,在檢案實踐中,一般要求待檢語音要滿足一定條件,否則將難以得出明確性結論。筆者曾運用錄音中當事人發出的非語音信息對兩起話者識別案件進行過檢驗,成功進行了對說話人的肯定性認定。
案例1原告張某及魯某一直向被告吳某提供貨物,截至2009年底吳某共欠張某及魯某4萬元與6萬元的貨款,后兩原告雖多次催要,但吳某皆以各種理由一直未付。2010年1月,兩原告到沈陽找被告催要貨款時對雙方談話進行了秘密錄音,并于2010年12月將吳某告上法庭,其最有力的證據就是雙方談話的錄音資料。隨后法院對原告提供的錄音資料進行送檢,要求鑒定錄音資料中帶有浙江口音語音的說話人與樣本中錄制的吳某語音的說話人是否系同一人。
案例2 2003年,原告某公司向被告某廠購買一套干燥設備,經安裝調試后投入生產。但該設備在使用中存在干燥裂問題,于是原告便扣留被告的設備費3萬5千元。2004年4月,被告方工程師李某前往原告方催要欠款并調查干燥裂原因時原告對雙方談話進行了秘密錄音。其后原告以該錄音作為證據于2004年12月將被告起訴到法院。法院委托司法鑒定部門對送檢檢材中說 “是不是這樣給你說的”、“你拿個意見”、“啊我我給你承認”等語句的男性說話人與樣本中的說話人李某是否是同一人進行鑒定。
對送檢錄音檢材與樣本作初步檢驗,在檢材中,帶有明顯浙江口音的男性說話人的部分語音在聽辨上比較清楚,在語圖上特征反映也比較充分,具備檢驗條件。但由于樣本中錄制的是自由對話內容,沒有完整語句的語音可與檢材語音進行比對,只好運用有限的詞匯或短語進行比對。經過仔細比對尋找,我們在檢材與樣本之間找到了發音相同、語圖特征反映較好的“反正 ”、“那不可能”、“沒有”、“我就”等內容的配對語音進行檢驗。
檢驗發現,檢材與樣本在以上音節的口音、音質、清晰度、語速等聽辨特性上高度相似,在寬帶語圖的共振峰頻率、共振峰動態模式等特征上整體符合較好,反映了二者的說話人很可能是同一人;但檢材與樣本在個別音節的共振峰特性上也存在一些較大差異。因此,根據語音信息只能得出傾向性認定結論。考慮到這些差異會因說話人語氣、錄音條件等的差異所導致,進一步對檢材與樣本中的非語音信息進行發掘、比較后發現,二者中待檢語音的說話人在笑聲的音質、節奏上比較特別,具有很強的特殊性。
最后,綜合檢驗結果得出要求鑒定的錄音資料中帶有浙江口音的語音的說話人與樣本中錄制的吳某語音的說話人是同一人的鑒定意見。
對送檢錄音檢材與樣本的檢驗條件進行了初步檢驗,在檢材語音中處 “是不是這樣給你說的”、“你拿個意見”、“啊我我給你承認”等語句在聽覺上比較清楚,在寬帶語圖中,有價值的語音特征反映得較好,具備檢驗條件;樣本錄音語音清晰,可供檢驗,但檢材中待檢語音語氣激昂,而樣本中待檢語音的語氣低沉,二者在語氣上差異較大。
進一步檢驗發現,檢材中待檢的男性說話人語音與樣本語音在聽覺上比較相似,在“是不是這樣給你說的”、“你拿個意見”、“啊我我給你承認”等語句的韻律特性、共振峰的動態模式上符合較好,但由于二者語氣差異較大,故定量比對差異較大。通過仔細聽辨,發現檢材中待檢男性說話人言語時敲擊桌子的方式、笑聲等與樣本中說話人的對應特征高度一致。
最后,綜合檢驗結果得出送檢檢材中“是不是這樣給你說的”、“你拿個意見”、“啊我我給你承認”等語句的男性說話人與樣本中的說話人李某是同一人的鑒定意見。
作為一項較新的個體識別技術,司法話者識別的理論與技術仍然需要不斷的發展與完善。目前,在進行說話人專家識別時一般要求檢材與樣本要有足夠數量(10個以上不同音節)、信噪比較高(30dB以上)并且寬帶語圖的有效頻率范圍能夠達到 300Hz~ 3000Hz的相同音節。但在檢案實踐中,時常會遇到因錄音設備使用不當(如微型采訪機用低速錄音)、錄音方法不當(把錄音機裝在密閉的手提包內)、錄音機麥克風靈敏度較低或錄音距離過遠等原因,而出現待檢人語音有效頻率范圍過窄 (例如只有2000Hz以下共振峰),檢材與樣本語氣、音強等差異較大,檢材與樣本可比對錄音內容較少等情況。在這種情況下,語音信息聽辨的有效性、共振峰特性的區別價值將會有所降低,進而影響話者識別結論的肯定性與準確性。如果我們能充分挖掘檢材與樣本中的非語音信息,則能增加鑒定意見的肯定性與準確性。因此,在錄音中語音信息不充分的條件下,充分發掘能反映說話人特定性的非語音信息就成為提高話者識別準確率的重要途徑。
所謂非語音信息是指人們在交際過程中,不采用語言作為表達意愿的工具,而運用其他非語言的方式所傳遞的信息,如尖叫聲、哭聲、咳嗽聲、擤鼻涕、笑聲、喝水聲、敲擊聲等非語音類聲音。對于非語音信息的個體特殊性,國外曾有人做過這樣的實驗:當一伙母親分別從許多嬰兒的哭聲中聽辨自己孩子時,相當準確。同時發現,即使有的嬰兒的聲音很像,他們的母親不但能準確地聽辨出自己的孩子,還能聽辨出別人的孩子[2]。另外,從日常生活中我們也有這樣的經驗:我們經常能夠根據熟人發出的哭聲、咳嗽聲、擤鼻涕、笑聲、腳步聲等聲音判斷出發聲人是誰。雖然目前我們還沒有看到有人曾對這些非語音信息進行過個體的特定性研究,但有一點可以相信,在一定范圍的人群內,非語音信息同樣具有個人的特定性,并且這種特定性也肯定會隨著非語音信息的增加而增強。因此,在對說話人識別時,我們應該充分利用待檢錄音中的非語音信息。
要充分利用待檢錄音中的非語音信息就需要我們在檢案工作中注意以下環節:
(1)錄制樣本前要全面熟悉檢材中待檢說話人留有哪些非語音信息和其出現的條件,并在錄取樣本時要盡量創造各種條件爭取錄到各種非語音信息。例如要采集案例2檢材中敲桌子的聲音,就要在錄樣時讓被采集對象坐在桌子跟前。
(2)必須錄制自由樣本。這樣做的好處是能夠充分錄到說話人自然的非語音信息,避免怕麻煩只錄朗讀樣本的習慣。
[1]楊俊杰,等.常用語音特性在鑒別雙胞胎語中的區別力研究[J].中國人民公安大學學報(自然科學版),2006,(3):21-24.
[2]楊俊杰.司法話者識別[M].北京:中國人民公安大學出版社,2008:154.