賈麗文
(中國(guó)政法大學(xué) 研究生院,北京100088)
我國(guó)從1989年第一起運(yùn)用語(yǔ)音鑒定的案件至今,聲紋鑒定逐步從單一依靠圖譜比對(duì)分析,發(fā)展成綜合運(yùn)用嗓音音質(zhì)、言語(yǔ)特征和頻譜數(shù)據(jù)的多種定性定量分析,一步步揭開(kāi)了其神秘面紗,使聲紋鑒定日趨規(guī)范化和標(biāo)準(zhǔn)化。伴隨對(duì)語(yǔ)音、語(yǔ)言研究的深入,以及語(yǔ)音處理軟件的升級(jí)換代,有的鑒定者在聲紋鑒定中,多依賴于頻譜的分析和數(shù)據(jù)的提取及處理上,卻忽視了鑒定中聽(tīng)音過(guò)程,或減少了聽(tīng)音次數(shù)。然而,聽(tīng)音才是聲紋鑒定之王,只有在聽(tīng)音基礎(chǔ)上的分析和判斷,才能成為聲紋鑒定的正確導(dǎo)向。
目前使用的聲紋鑒定方法,主要是通過(guò)語(yǔ)圖儀或語(yǔ)音工作站實(shí)現(xiàn)語(yǔ)音聲學(xué)特征比對(duì)進(jìn)行鑒定。聲紋鑒定的步驟,主要是“聽(tīng)-看-測(cè)-析”。“聽(tīng)”即聽(tīng)音,“看”(通過(guò)語(yǔ)圖觀察特定音節(jié)的各方面形態(tài)特征)、“測(cè)”(對(duì)各方面特征參數(shù)的定量檢測(cè))、“析”(綜合分析判斷)都是在“聽(tīng)”的基礎(chǔ)之上進(jìn)行。
聽(tīng)音,就是聽(tīng)辨檢材和樣本的全部語(yǔ)音材料,對(duì)有關(guān)方言、語(yǔ)音速度、言語(yǔ)習(xí)慣、鼻音輕重、音高、變音、變調(diào)、節(jié)奏、聲源譜特性(聲音的厚薄、余音的強(qiáng)弱)、清晰度、流暢度、口頭語(yǔ)、贅語(yǔ)、虛詞、言語(yǔ)缺陷(口吃、大舌頭等),以及是否偽裝等進(jìn)行辨別。此外,還要聽(tīng)辨語(yǔ)義、詞匯、語(yǔ)法及其表達(dá)方式的異同。
聽(tīng)音是聲紋鑒定的首要步驟,也是聲紋鑒定的必經(jīng)程序,聲紋鑒定離不開(kāi)聽(tīng)音這一過(guò)程。離開(kāi)聽(tīng)音,僅僅依靠對(duì)語(yǔ)圖的觀察和特征參數(shù)的測(cè)量,將使聲紋鑒定變得沒(méi)有方向,會(huì)浪費(fèi)大量的鑒定資源,得出不可靠的鑒定意見(jiàn)。
1.決定了聲紋鑒定的方向。在一段語(yǔ)料中,并不是所有的詞語(yǔ)和音節(jié)都有鑒定價(jià)值。聽(tīng)音是對(duì)整體語(yǔ)料的感知,同時(shí)也是對(duì)特征音節(jié)的篩選,進(jìn)而對(duì)語(yǔ)圖分析和參數(shù)測(cè)量有了方向和依據(jù)。
2.有助于得出正確的鑒定結(jié)論。不同的軟件和算法的選擇及不同的參數(shù)設(shè)置,會(huì)造成“同一”的假象,再使用聽(tīng)音進(jìn)行判斷和檢查,假象就會(huì)露出破綻,避免單一依靠語(yǔ)圖和數(shù)據(jù)帶來(lái)的鑒定失誤。
3.有助于彌補(bǔ)現(xiàn)有技術(shù)對(duì)語(yǔ)圖和參量數(shù)據(jù)無(wú)法反映的語(yǔ)音特征。人類對(duì)聲紋鑒定技術(shù)的認(rèn)識(shí)仍處在不斷的深化之中,現(xiàn)有的鑒定技術(shù)難免有其系統(tǒng)性的弊端。好在人的聽(tīng)覺(jué)感知系統(tǒng)與生俱來(lái)且功能強(qiáng)大,其奧妙之處,就在于人們能感知檢材與樣本是否為同一人所說(shuō)。
刑事物證鑒定的一般理論,揭示了被鑒定客體具有特定性、穩(wěn)定性和反映性。聲音之所以可進(jìn)行話者的同一認(rèn)定,亦是依賴聲音的特定性、穩(wěn)定性和反映性,其中最主要的是聲音的特定性。聲音的特定性,首先表現(xiàn)在語(yǔ)音產(chǎn)生的生理機(jī)制上,即人呼吸器官的生理結(jié)構(gòu)、聲帶的生理結(jié)構(gòu)(包括質(zhì)量、幾何形狀、勁度、周?chē)∪旱龋⒙暤赖纳斫Y(jié)構(gòu)(包括長(zhǎng)度、截面積、機(jī)能等);其次表現(xiàn)在話者的言語(yǔ)習(xí)慣定型,即話者言語(yǔ)的社會(huì)性,話者處在一定的社會(huì)環(huán)境和社會(huì)條件下,會(huì)形成獨(dú)特的言語(yǔ)搭配習(xí)慣和語(yǔ)音表達(dá)習(xí)慣(如:方言)。因此,聲音的特定性不是單一的生理結(jié)構(gòu)特點(diǎn)或是話者的語(yǔ)言習(xí)慣定型決定的,而是二者結(jié)合的結(jié)果,導(dǎo)致聲紋鑒定比指紋鑒定、筆跡鑒定更加復(fù)雜,影響鑒定的因素也更加多樣化。無(wú)論是指紋鑒定還是筆跡鑒定,都是直觀的檢材和樣本的比對(duì),而聲音之所以能進(jìn)行比對(duì),是依賴將聲音轉(zhuǎn)化為語(yǔ)圖。然而,不同的軟件所轉(zhuǎn)化的語(yǔ)圖,會(huì)因其自身的屬性或參數(shù)設(shè)置的不同而丟失,或者無(wú)法反映一些語(yǔ)音信息,使反映語(yǔ)音生理特點(diǎn)的特定性產(chǎn)生偏差。因此,語(yǔ)圖的比對(duì)要以聽(tīng)音為基礎(chǔ),排除聽(tīng)音以單一語(yǔ)圖比對(duì)將會(huì)產(chǎn)生錯(cuò)誤。而對(duì)于話者言語(yǔ)習(xí)慣定型的特定性的反映,聽(tīng)音是最好的選擇。話者是否有地方口音,是否有特殊的詞語(yǔ)搭配習(xí)慣,幾乎一聽(tīng)便知。
在日常生活中,人們能很輕易地辨別出家人、朋友、同事的聲音,甚至當(dāng)對(duì)方在憤怒、哭泣、大聲喊叫、使用方言時(shí),也能很快地辨別出是某人發(fā)出的聲音,而不是他人發(fā)出的聲音。就是很多年沒(méi)有交往的朋友,接電話聽(tīng)到聲音時(shí)還能聽(tīng)辨出對(duì)方是誰(shuí)。甚至對(duì)不熟悉的陌生人其少年時(shí)和老年期說(shuō)同樣一段話,人們也能分辨出哪個(gè)是其少年時(shí)所說(shuō),哪個(gè)是其老年期所說(shuō)。這種先天具有的功能,源于人類自身所具備的聽(tīng)覺(jué)系統(tǒng)。人類的聽(tīng)覺(jué)系統(tǒng)既是靈敏的聲音接收系統(tǒng),也是高度的語(yǔ)音綜合分析系統(tǒng)。
人類的聽(tīng)覺(jué)系統(tǒng)對(duì)聲音具有很強(qiáng)的解析、綜合和分析判斷能力,聽(tīng)覺(jué)系統(tǒng)的這些能力和特點(diǎn)總稱為聽(tīng)覺(jué)特性。聽(tīng)覺(jué)特性可進(jìn)一步細(xì)分為聲學(xué)感受性和主觀感受性。聲學(xué)感受性可通過(guò)各種聲學(xué)參數(shù)(如:頻率)來(lái)表述。但是,主觀感受性在聲紋鑒定研究中,要想如聲學(xué)感受性一樣得以量化表示和衡量,還有很長(zhǎng)一段路要走。此外,就音質(zhì)和音色而言,人類的聽(tīng)覺(jué)系統(tǒng)具有奇妙的感知能力,人們能夠輕易地區(qū)分不同人的聲音且不混淆,就是聽(tīng)覺(jué)具有差別感受性。也正是聽(tīng)覺(jué)的差別感受性,使聲音鑒定有據(jù)可循,最早的話者識(shí)別,就是依靠聽(tīng)音來(lái)完成。因此,聽(tīng)音在聲紋鑒定中具有其得天獨(dú)厚的優(yōu)勢(shì),它是人類的聽(tīng)覺(jué)系統(tǒng)與生俱來(lái)的,任何工具不可替代。
人類的生活離不開(kāi)語(yǔ)言。語(yǔ)言是生理現(xiàn)象、心理現(xiàn)象和社會(huì)現(xiàn)象三者的結(jié)合和統(tǒng)一。語(yǔ)音的生理性、心理性和社會(huì)性構(gòu)成了語(yǔ)音的特性。言語(yǔ)交流實(shí)際上是一系列生理、心理、物理轉(zhuǎn)換的復(fù)雜過(guò)程,它可分為發(fā)音、傳遞和感知三個(gè)階段。發(fā)音和傳遞在聲紋鑒定過(guò)程中是既定的,而感知過(guò)程是語(yǔ)音通過(guò)聽(tīng)音者聽(tīng)覺(jué)系統(tǒng)獲得專一信號(hào),這是一個(gè)從生理現(xiàn)象到心理現(xiàn)象的轉(zhuǎn)換過(guò)程,它具有很強(qiáng)的獨(dú)立性。正因如此,依據(jù)同樣一段語(yǔ)圖進(jìn)行聽(tīng)音,有些人聽(tīng)后可得出同樣的結(jié)論,有些人聽(tīng)后則得出不同的結(jié)論。之所以會(huì)產(chǎn)生這樣的情況,源于不同的人有不同的感知過(guò)程。在這種情況下,不僅要重視語(yǔ)圖和參量數(shù)據(jù),更要加強(qiáng)反復(fù)聽(tīng)音和多次聽(tīng)音。理由很簡(jiǎn)單:這種差異根本沒(méi)有反映在語(yǔ)圖上!正如筆跡鑒定尋找差異點(diǎn)需要反復(fù)比對(duì)一樣,聲紋鑒定也需要反復(fù)地聽(tīng)音來(lái)尋找差異點(diǎn),尤其在聲紋鑒定還沒(méi)有成熟化的今天,聽(tīng)音更不可捨棄。
目前,聲紋鑒定主要使用語(yǔ)音學(xué)分析法,即綜合運(yùn)用嗓音音質(zhì)、口頭語(yǔ)言和頻譜等特征綜合評(píng)斷的一種方法。此外,還有聲紋自動(dòng)識(shí)別法和綜合方法(即語(yǔ)音學(xué)分析法和聲紋自動(dòng)識(shí)別法相結(jié)合的方法)。鑒定方法的發(fā)展在逐步信賴科學(xué)技術(shù)的同時(shí),也很自然地逐步鞏固了聽(tīng)音的重要地位。因?yàn)椋?/p>
1.對(duì)現(xiàn)有科學(xué)技術(shù)的認(rèn)識(shí)存在局限性。在聲紋鑒定中,最重要的一點(diǎn)是對(duì)共振峰的提取,這方面的研究已經(jīng)頗為豐富,但是,不同軟件和不同參量的選擇,在提取的過(guò)程中都會(huì)面臨自身方法的弊端。人們?cè)谡J(rèn)識(shí)的過(guò)程中還不能達(dá)到盡善盡美,而聽(tīng)音能聽(tīng)出原聲態(tài)。
2.在某些情況下,聽(tīng)音比使用科學(xué)技術(shù)更加便利,能夠省去參量選擇和數(shù)據(jù)處理等技術(shù)要求的大量繁瑣過(guò)程,而直接得出可靠的意見(jiàn)。由此可見(jiàn),真正的聲紋鑒定,永遠(yuǎn)不會(huì)摒去聽(tīng)音,如同指紋鑒定離不開(kāi)“看”,聲紋鑒定亦離不開(kāi)“聽(tīng)”。
聽(tīng)音在聲紋鑒定中固然重要,但也會(huì)遭遇一些困境。
聽(tīng)音者的識(shí)別能力強(qiáng)度,很大程度上取決于聽(tīng)音者的感知。而感知會(huì)受到聽(tīng)覺(jué)效應(yīng)的影響產(chǎn)生偏差。聽(tīng)覺(jué)效應(yīng)主要有:
1.掩蔽效應(yīng)。即當(dāng)同時(shí)聽(tīng)到兩個(gè)聲音時(shí),較響的聲音掩蓋了較輕的聲音,使人聽(tīng)起來(lái)好像只有一個(gè)聲音。這種掩蔽效應(yīng),又分為純音對(duì)純音的掩蔽和噪音對(duì)純音的掩蔽。
2.哈斯效應(yīng),又稱時(shí)間效應(yīng)。即當(dāng)方向不同的兩個(gè)聲源發(fā)出同樣的聲音時(shí),由于到達(dá)的時(shí)間為同一時(shí)刻、或相差5~35ms、或相差35~50ms、或相差50ms以上,會(huì)感覺(jué)聲音來(lái)源方向是兩個(gè)聲源之間的一個(gè)假聲源、先到達(dá)的聲源、后到達(dá)的聲源,得出聲源來(lái)自不同方向的結(jié)果。
3.德·波埃效應(yīng),又稱響度效應(yīng)。即兩個(gè)聲源對(duì)稱的置于聽(tīng)音者的前方時(shí),當(dāng)反饋給兩個(gè)聲源的聲音信號(hào)相同時(shí),聽(tīng)音者感覺(jué)聲音來(lái)自兩個(gè)聲源的中間,而且似乎是只有一個(gè)聲源。
4.勞氏效應(yīng),又稱相位效應(yīng)。勞氏效應(yīng)產(chǎn)生假立體聲效果,即將信號(hào)延時(shí)后以反相疊加在直達(dá)聲信號(hào)上,立即就會(huì)產(chǎn)生明顯的空間印象,聲音似乎來(lái)自四面八方,聽(tīng)音者有置于樂(lè)隊(duì)之中的感受。
聽(tīng)覺(jué)效應(yīng)所產(chǎn)生的困境,主要是聽(tīng)音者感知失真。這種失真,聽(tīng)音者不可控制,也不可避免。對(duì)于掩蔽效應(yīng)帶來(lái)的困境,學(xué)術(shù)界已有人提出并研究了統(tǒng)計(jì)模型算法、譜減法、聽(tīng)覺(jué)掩蔽算法、短時(shí)譜估計(jì)算法、子空間算法、小波變換算法等,用作降低錄音資料的噪音信號(hào)、增強(qiáng)語(yǔ)音信號(hào)。其余的效應(yīng)在日常生活中不常見(jiàn),在此不作研究。
聽(tīng)音為聲紋鑒定服務(wù),聲紋鑒定的最終目的是要鑒別檢材與樣本的說(shuō)話人是否同一。就像指紋認(rèn)定同一一樣,要以本質(zhì)符合點(diǎn)占絕對(duì)多數(shù),且少數(shù)差異點(diǎn)得到科學(xué)解釋為判斷依據(jù)。聲紋鑒定能夠進(jìn)行同一認(rèn)定,也要有值得令人信服的判斷依據(jù)。而聽(tīng)音是一個(gè)主觀性很強(qiáng)的活動(dòng),很難以“我認(rèn)為兩個(gè)語(yǔ)料是同一人所說(shuō)”來(lái)取得他人的信服。即使兩個(gè)或三個(gè)聽(tīng)音者持同一意見(jiàn),也很難保證沒(méi)有其他聽(tīng)音者持不同意見(jiàn),這就使聽(tīng)音的結(jié)論很難在認(rèn)定聲音同一時(shí)得到體現(xiàn)。
對(duì)于這一困境,可以將主觀的聽(tīng)音判斷轉(zhuǎn)化為客觀的參數(shù)反映和語(yǔ)圖反映方式來(lái)解決。目前,國(guó)內(nèi)外學(xué)者對(duì)聲紋研究已經(jīng)日趨擴(kuò)大,從基本的音強(qiáng)特征、音高模式的研究,已經(jīng)逐步細(xì)化到情緒語(yǔ)音、情感語(yǔ)音及具體的地區(qū)方言(如廣州話、上海話等)的研究上,使聽(tīng)音所得的結(jié)論可通過(guò)具體的參數(shù)和形態(tài)(如共振峰頻率、基頻、語(yǔ)圖形態(tài)等)得以量化。雖然具體的研究還有待于進(jìn)一步探索,但聽(tīng)音在認(rèn)定同一中的體現(xiàn)也有了方向可循。
在提供偵查線索、縮小偵查范圍上,聲紋鑒定起到的作用有目共睹。但是,在法庭上作為證據(jù)使用,要具備證據(jù)力。在美國(guó),聲紋鑒定作為證據(jù)使用不是沒(méi)有,但并不常見(jiàn)。之所以如此,主要質(zhì)疑聲紋鑒定的可靠性,往往要從鑒定人是否具有經(jīng)驗(yàn),鑒定過(guò)程是否存在主觀性,語(yǔ)音自身的易變性等諸多問(wèn)題,對(duì)聲紋鑒定是否具有可采性提出質(zhì)疑。在日本、德國(guó)和英國(guó)等國(guó)家,聲紋鑒定作為證據(jù)也較少見(jiàn)。我國(guó)聲紋鑒定起步晚于西方國(guó)家,在之前的訴訟程序中,聲紋證據(jù)也不作為定案的根據(jù)。但是,伴隨新刑訴法的修改,鑒定結(jié)論改為鑒定意見(jiàn),鑒定人出庭制度得到進(jìn)一步的完善,聲紋作為訴訟程序中的證據(jù)指日可待。不過(guò)盡管如此,完善聲紋鑒定的證據(jù)能力,還要經(jīng)過(guò)很長(zhǎng)的路程對(duì)其探索。
聲紋鑒定過(guò)程中,聽(tīng)音是必不可少的重要步驟,鑒定人要高度重視聽(tīng)音。要多注重做好專業(yè)的聽(tīng)音訓(xùn)練,夯實(shí)語(yǔ)音學(xué)基礎(chǔ),以此提高聲紋鑒定質(zhì)量。
[1]徐立根.物證技術(shù)學(xué)[M].北京:中國(guó)人民大學(xué)出版社,2008.
[2]楊俊杰.司法話者識(shí)別[M].北京:中國(guó)人民公安大學(xué)出版社,2009.
[3]楊英倉(cāng),徐毓文,歐榮安,李文瑞,王英利.聽(tīng)辨在聲紋鑒定中的作用[J].刑事技術(shù),2012:43-45.
[4]唐暢,廖翔.淺談司法語(yǔ)音鑒定中的綜合技術(shù)應(yīng)用[J].警察技術(shù),2011:30-32.
[5]王英利,李敬陽(yáng),曹洪林.聲紋鑒定技術(shù)綜述[J].警察技術(shù),2012(4):5 4-56.
[6]伍浩鵬.聲紋鑒定及其證據(jù)效力[J].甘肅政法學(xué)院學(xué)報(bào),2000(4):99-102.
[7]文宇.一聲定音[J].檢查風(fēng)云,2004(6):36-38.
[8]宋淼,李敬陽(yáng).淺談聲紋檢驗(yàn)鑒定技術(shù)[J].北京人民警察學(xué)院學(xué)報(bào),2005(2):35-36.
[9]閻萍.聲紋鑒定及其在偵查破案中的作用[J].遼寧警專學(xué)報(bào),200 8(1):70-72.