蔣濤
作者單位:加拿大RWM聽力語音實驗室 成都 610021
技術在20世紀末,變革的速度已經超過了人類,這就是指數時代[1]。當今科學技術發展速度對聽力行業產生巨大的影響很難用常規方式描述。先進的數字技術和各種新技術提升了聽力檢測和診斷手段能力和聽力康復效果,臨床聽力師和患者受益巨大。尤其是人工智能和大數據的應用為傳統的聽力產品增加了眾多新功能。如2019年最新推出的人工智能助聽器,除傳統的助聽放大功能外,還增加了許多日常生活實用功能,能翻譯27鐘語言,能和亞馬遜的Alexa語音助手連接,完成日常語音通訊功能,還能監測心跳,預防跌倒提醒警告,即時語音文字轉換等。如何理解主流技術在聽力行業的應用不僅是一個學習使用的過程,還是認識技術本身特點以及與聽力技術之間關系的機會。同時,我們長期習慣花時間掌握每一項具體技術和產品的知識,很少從宏觀角度來認識技術作為人類文明進步的一個助推器。鑒于此,本文希望通過介紹軟、硬技術和聽力技術應用,開啟另一個學習聽力技術的窗口,從技術發展過程中去掌握聽力學技能和知識,從軟、硬聽力技術的角度重新認識我們已經習慣的臨床實踐手段和方法。
英文“technology”一詞來自古希臘語“tekhnologia”,“tekhnē”表示技藝和手工,整個單詞意思是“系統性處理”[2]。從歷史詞匯學看,“technology”一詞始于17世紀早期,從古希臘最初詞義形成今天廣為知曉的定義:科學知識在實踐的應用,尤其用于工業。不同詞典對技術一詞釋義各有不同,韋氏詞典的定義是科學在工業、工程等領域科學用于創造有用的事物或解決問題[3],強調技術范圍和應用目的。
漢語對技術的解釋和英文基本相似。新華詞典對技術定義為人類在利用自然和改造自然的過程中積累起來并在生產勞動中體現出來的經驗和知識,也泛指其他操作方面的技巧[4],現代漢語大辭典定義較為簡練:在勞動生產方面的經驗、知識和技巧,也泛指其他操作方面的技巧[4]。中英文對“技術”一詞定義均將其定位于科學知識或者經驗的應用,英文更強調技術的應用范圍,而中文的定義則偏重于知識或技巧的來源。
從詞匯學看,對比中英文“technology”和“技術”的構成,二者非常相似。英文是“技藝”(techn)和后綴“學科”(ology)組合而成,這是關于技藝的學科;中文“技術”一詞也是由表示技藝的“技”和表示學問的“術”組合而成,不同語言主要詞匯的構成存在共性成分。
技術一詞對于世界文明不僅是詞義學的貢獻,更重要的是技術本身的起源和發展始終貫穿人類發展歷史,推動了世界文明的發展。在石器時代,祖先利用不同形狀石頭制造成簡單的工具,用于打獵和采集,當今以人工智能和大數據為特征的第4次工業革命,從蒸汽機、電動機到電腦、電話、原子核反應堆和航天科技,技術是人類文明的最高成就,是進步的根本動力。研究技術起源和歷史發展是一門博大精深學問,本文主要介紹技術的兩個分類:“hard technology”(硬技術)和“soft technology”(軟技術),及其相互之間的關系;將聽力學技術納入軟、硬技術分類范疇,沿循主流技術發展趨勢,研究軟、硬聽力學技術并軌發展的特點及關系。
硬技術是能采購并裝置成輔助技術系統的有形部件,包括簡單的口棒到電腦和軟件;軟技術包括決策、制定戰略、培訓和形成概念的人類活動領域[5]。解釋軟、硬技術之別的最好例子是點火。人類最早用石頭作為點火工具,現在用火柴或打火機點火,這些工具是硬技術,用工具點火的方法是軟技術。換言之,硬技術是我們可以看到并且能直接操作使用的器械物件,軟技術是人們大腦積累的經驗、知識、印象以及過往成功或者失敗的案例。

表1 軟、硬聽力技術分類
關于軟、硬技術的研究較多,Burgess等[6]認為硬技術是有形的物理器械,如機器、工具、器械和裝置等;軟技術是與物質無關的流程或生產技巧等。Hlupic V.[7]等認為硬技術是來源物理世界運行的自然科學的知識,而軟技術則是與非自然科學有關的知識,如人類的思維、觀念、情感或人類行為技巧社會組織的行為等。有的科學家從應用程度區別軟、硬技術,如Norman[8]主張硬技術使得人類服從,軟技術賦予人類支配權力,他認為硬技術在社會發展的功能中起到抑制和約束作用,軟技術則起到包容吸納、融合貫通的作用。
Dron等[9]對軟、硬技術看法角度又不同。他們認為軟技術與創造力和靈活性相關;硬技術與不受錯誤、速度和效率影響的自由相關。兩者各有利弊,在合適時間兩者之間保持適當平衡才是重要的。硬技術的“軟化”(soften)或軟技術的“硬化”(harden)能發揮各自長處,有效的方法就是將不同的技術進行組合、聚合和組裝,通過增加不同的技術路徑或功能來“軟化”硬技術,或者采用程序化或自動化手段替換依賴人工操作流程實現“硬化”軟技術的目的。
在現實中,軟、硬技術之間并非天壤之別,有時還很難區分,這也是研究軟、硬技術的一個難題。重要的是在實際應用技術時,應該認識到二者是有區別的,能幫助我們更好地理解技術的多元性和復雜性,掌握技術,發揮技術的作用。
在聽力學領域,硬技術包括幾乎所有的硬件器械、設備、用品和工具等,聽力計、聲導抗儀、耳聲發射檢測儀、腦干聽覺誘發電位設備、助聽器分析儀、助聽器和各種軟件技術。驅動這些硬件設備的多是本文提到的軟聽力技術。軟聽力技術覆蓋所有無形的算法、計算公式、測試流程、評估方法等。通過軟、硬技術無縫結合,完成聽力學篩查、診斷、康復和評估等功能性任務。表1列出部分常用的硬聽力技術和相應的軟技術和使用結果。
多年來,隨著科學技術高度發展,硬聽力技術已經完成從模擬化技術轉變成數字化技術,進入自動化、智能化和移動化時代。總體講,硬聽力技術在三個主要方面繼續提升。一是完善數字化系統,半導體集成電路的廣泛使用將絕大部分聽力器械轉變成數字設備,使得聽力檢查和康復等方面的功能以及使用便捷性等都得到本質的改善,并大大縮小了原來模擬器械的體積,小型化和微型化為硬件技術移動化奠定了基礎。二是無線技術的應用將原來各自獨立的聽力器械無縫連接,形成一個無所不包的聽力硬件生態系統,聽力計與聲導抗連接、腦干誘發電位儀和助聽器驗配軟件互聯,大大提高臨床應用效率。三是硬聽力技術智能化系統的普及應用。大部分的高端助聽器均已采用智能算法,包括應用場景的智能分析、學習和調整、個體使用特征改變等,如本文開始介紹的人工智能助聽器,完全改變了傳統助聽器的應用范圍。
在硬技術發展基礎上,軟聽力技術也在向兩個方面推進,反過來會更深刻地影響硬聽力技術的應用:一個是利用數字技術優勢,研制出一系列臨床聽力技術應用的方法、算法、程序、流程等,其中有代表性的是臨床測聽。軟聽力技術改變了過去以人工操作為主的聽力檢測操作系統,替之以軟聽力技術驅動的自動分析和操作流程。智能化聽力計能按照聽力師需求,自動完成各種聽力閾值計算和相關交叉印證核查,自動計算氣骨導掩蔽閾值等。大部分傳統的人工操作測試程序和方法已基本實現數字化,可在硬件設備上運行,具有機器自動測試功能,尚有小部分因為需要患者的高度配合暫時無法實現,比如部分言語測試。

圖1 軟、硬聽力技術分類和關系
軟、硬聽力技術分類和關系見圖1。對于聽力學行業入門者而言,僅僅掌握硬件技術,熟悉聽力器械日常應用還不夠,更重要的是需要學習和理解驅動這些器械背后的軟技術,否則很難發揮出硬件的作用。
軟、硬技術之間承上啟下的關系是工業革命發展的重要推手。從18世紀60年代瓦特蒸汽機問世到1850年左右,伴隨著工業革命,機器為經濟建立了一套肌肉系統,現在又為其建立了一套神經系統[10]。鐵路、汽車、飛機、計算機和各種機器設備這些硬技術支撐起幾百年全球經濟和社會的高速發展,是社會文明發展的根本動力;今天進入以人工智能和大數據為特征的第4次工業革命時代,互聯網、大數據和人工智能作為當今社會無處不在的軟技術,猶如一套高效的“神經系統”,正在成為下一波經濟發展的新動力。筆者撰寫本文的初衷正是來源于推動工業社會發展的“肌肉系統”和“神經系統”。鑒于此,筆者認為有必要開始去認識、理解和探索軟、硬聽力技術之間的融合發展展示出的能動作用和內在聯系。
聽力學領域的軟、硬技術發展規律和其他工業科技領域一樣,可以通過三種關系去認識。
任何新技術的發明或應用,首先是解決在現實中某一特殊需求或問題。1765年瓦特改良蒸汽機,研制出將蒸汽能量轉換為機械功的往復式動力機械,其主要目的是解決大規模工業生產所需要的機械原動力,于是產生了用于工業生產的機器和包括火車輪船這種長途運輸工具。1876年,亞歷山大·貝爾發明電話,解決了人類對話的空間障礙和實時對話的需求,成為人類信息史上最偉大的創舉之一。
從技術歷史發展看,類似例子層出不窮,有趣的是一旦硬技術出現后,隨著技術不斷成熟和應用范圍擴大,直接推動了軟技術的發展。蒸汽機的出現不僅解決了生產和運輸原動力的問題,更重要的帶動了與此相關的一系列重大的技術革命,包括對工程技術、航海科技、材料技術和大規模工業生產的工藝流程都產生了深遠影響。起于蒸汽機的軟技術加快了人類社會從手工勞動轉變成機器生產的文明社會。
同樣,電話超越時空,實現了千里之遙的人對話猶如眼前的夢想。在電話發明的60年后,貝爾電話公司啟用了第一臺車載無線電話服務。時至今日,電話機的硬技術快速發展,催生出許多非常重要的無線通訊軟技術,智能手機、WIFI支持的即時通訊方法、射頻識別技術、藍牙無線通訊技術和現在即將全面推出的5G無線通訊技術成為當今全球經濟和社會發展的重要技術支撐。源自最初的有線電話的無線技術,已經被不僅推動了一大批軟技術,而且還形成獨當一面的無線經濟(wireless economy)。從這個意義講,被稱為軟技術的通訊方法和技術徹底顛覆了人類生活與交流的傳統方式。由此可見軟、硬技術之間承前啟后的發展關系的重要意義。
助聽器的技術和驗配方法的發展進程充分揭示出前面提到的軟硬聽力技術的關系。根據筆者提出的助聽器三個發展階段,圖2總結了助聽器從硬技術到軟技術在其應用范圍、功能、配方方法的發展特點。
筆者從三個維度來分析。第一個維度是助聽器技術分類,將2013年以前看作是助聽器的硬件發展的前期階段,從早期上個世紀初期的電子管技術到2013年的數字技術,助聽器的硬件經過了模擬技術對放大信號的處理再到數字技術對聲音的放大。與此對應的第二個維度是信號處理放大技術發展,在這個期間,助聽器放大技術經歷了從最早的碳精放大,到真空管和電子管技術,隨著半導體技術發展,晶體管和集成電路開始用于助聽器,大大減少助聽器體積,提高了放大的效率和聲音的質量。伴隨放大信號處理技術的提升,助聽器也從最早的臺式機到盒式機,從耳背機到耳內機,再到植入式或可穿戴式的各種形式。助聽器外形的發展是助聽器放大技術的結果。

圖2 助聽器技術三個階段和維度發展
與此對應的第三個維度是助聽器驗配方法發展。在這個階段,對硬件提升逐步實現了助聽器從聽得見的基本功能到聽得清楚的高級功能。以硬技術為主的發展階段的一百多年歷史中,早期的驗配方法主要是增益簡單補償算式法則,如伯格配方法、POGO配方法等,這些都屬于二分之一增益法的衍生計算方法,當然還有采用患者最大舒適級來計算增益和相應的頻響特征等類似的方法,這些屬于線性助聽器驗配方法。從1995年后,數字助聽器問世,其硬件技術也快速成熟,患者對助聽器的滿意度超過85%以上。期間,非線性驗配成為主流,具有代表性的是DSLi/o和NAL-NL的驗配方法。
從2013年后,我們看到數字芯片的處理能力以非常快的速度提升。雙核芯片和超過3100萬個晶體管已經成為助聽器芯片標配,近期有的新推出助聽器芯片速度甚至是上一代技術的50倍。在這個時期,助聽器的核心功能已經不簡單是聽得見和聽得清,而是聽得懂。快速和復雜的運算能力可以實現各種人工智能算法,包括按照聽覺神經對信號的反應和處理來放大聲音,模仿大腦對聲音解碼特征和參照人類自身聽覺系統的處理方式進行有針對性地放大等。在這個時期的信號放大處理可用神經信號來描述,因為幫助聽損患者能有效地理解語音的意義,已不再是簡單的對聲音強度的放大。與此對應的驗配方法也值得一提。各個助聽器生產廠家根據其采集的大量聽力數據和分析,推出了驗配方法,能滿足自身助聽器芯片和驗配軟件的應用,這種和產品配套的驗配方法也有一定優勢。
聽覺皮層學會看,視覺皮層學會聽,大腦自始至終只使用了一種相同的學習算法,負責不同知覺的區域之間的區別僅僅在于相互關聯的輸入信息的感官而已(眼、耳、鼻等)[11]。大腦對于外界信號的處理特點說明了軟聽力技術的重要性。2014年至今,助聽器技術已經成為人類第4次工業革命技術浪潮中的一個很好例子,可以預測基于神經信號的軟聽力技術是未來助聽器爆發式增長的突破點。
軟、硬技術的這種獨特的承上啟下發展關系可以用純音聽力測試做進一步闡述。
從歷史看,John Shore在1711年發明了音叉[12];1879年,David Edward Hughes在其呈遞給倫敦皇家學會的論文腳注中首次提到audiometer(聽力計)[13],據悉這是最初利用感應線圈的聽力器械;1899年,Seashore在設計出有40調試步驟,點擊發聲的聽力計,是后來西方電子設備公司推出商用聽力計的原型;1919年,Bunch等在美國耳科協會上宣講了題為《音調范圍聽力計》的論文;1922年Edmund P等共同研制出第一臺基于倍頻程的調試強度的聽力計,這是一臺具有真正商業價值的聽力計[14]。
物理振動發聲的音叉走過了200多年后,演變成電子管聽力計,顯然聽力硬件設備研發經歷了一條漫長的道路。從模擬聽力計發展到數字聽力計也經歷了至少半個多世紀的數據,在這267年期間,受限于軟聽力技術尚未同步發展,聽力計其實并沒有能幫助我們實現其主要目的:準確地獲得聽力閾值。1944年,美國眼耳鼻喉科學會聽力保護委員會提出了改良的Hughson-Westlake測聽法,即常說的“升5降10”測聽法,聽力閾值測試尚未規范。1978年,美國國家標準署才首次系統制定楚純音聽力閾值檢測方法。聽力測試軟技術的完善為聽力測試硬件技術制定出了科學的聽力閾值檢測標準[14]。
聽力計硬件和聽力檢測方法之間的關系猶如秤與計量標準一樣。如果只有秤,沒有計量方法,秤是毫無用處的;反之,即便有計量方法沒有秤,也難以實施。聽力計經歷的267年的發展歷史,說到底展示出硬技術和軟技術相互影響、承上啟下、共同發展的技術發展規律。沒有聽力計硬件不能測試聽力,有了聽力計,但是沒有科學的測試方法也不能獲得準確的聽力閾值,這就是硬聽力技術和軟聽力技術之間的能動關系。
上面例子再次告訴聽力學初學者,學習不僅僅是熟練操作腦干聽覺誘發電位儀,或助聽器分析儀,更重要的是充分理解軟、硬聽力技術各自特點和相互之間的關系,才能真正掌握聽力學基本技能和知識。
互聯網技術最早是在1969年由美國4所大學采用美國國防部研究計劃署制定的計算機協議所發明,1989年,當蒂姆·伯納斯·李(Tim Berners-Lee)爵士提出萬維網設想,一年后他在日內瓦的歐洲粒子物理實驗室里成功開發出了世界上第一個網頁瀏覽器,然后迅速在全球普及應用。計算機也有同樣的經歷。1946年,美國賓夕法尼亞大學研制出具有真正意義的第一臺電子計算機,體積龐大為170平方米,耗電150千瓦,造價48萬美元,每秒智能執行5000次加法或400次乘法運算。然而我們熟悉的微型計算機到30年以后才出現。
聽力技術從發明到應用也有一樣漫長的時間差。據悉第一臺助聽器是1898年發明的,而真正能用于聽力康復的助聽器至少要等到半個世紀以后才出現,第一臺數字助聽器要等到100多年以后才出現。圖3所示,1978年英國教授Kemp首次發現了耳聲發射現象,盡管他迅速研制出早期的耳聲發射檢測儀,也等到1999年后才大規模投入使用。寬頻動態壓縮線路最早于1975年發明,盡管WDRC非線性放大壓縮技術效果非常好,也得等到10年后才開始廣泛用于助聽器,取代了線性壓縮技術。

圖3 聽力技術發明到應用的時間差
數字助聽器產生和使用也是沿循同樣路徑。眾所周知,1995年是助聽器發展史的重要分水嶺,當年兩款商用數字助聽器問世,立即產生轟動效應,標志著模擬助聽器時代結束。之后十幾年里,數字助聽器以驚人的速度從初期到進入成熟期,時至今日,數字助聽器已是一個廣為使用的成熟產品。究其發展史,早在1970年便研發出數字助聽器了,只不過經過了25年后才得以推廣。
另外一個典型的例子是超級計算機和認知計算的應用。“超級計算(supercomputing)”最早在1929年由《紐約世界報》首次報道[16]。這是一種由數百、數千甚至更多的處理器(機)組成的,能計算普通PC機和服務器不能完成的大型、復雜課題的計算機。1976年美國克雷公司推出了世界上首臺運算速度達每秒2.5億次的超級計算機,自此后研發億億級超級計算機已經成為當今世界各國凸顯各自科學實力的一個終極目標。與此同時,科學家在上個世紀50年代提出利用超級計算機開發認知計算的想法,希望計算機能模仿人類思維去感知和認知世界。如何將計算機從長于數據分析的“左腦型”機器,變成擅長于“右腦型”任務處理的計算機[17],像人一樣去思維、分析和處理各種外部信息?這就是所謂結合了右腦與左腦運算的認知計算。早期由于超級計算機剛剛起步,加之對大腦認識有限,一直到了21世紀,當億億級超級計算機出現后,認知計算才有實質性進展。2011年當IBM的“華生”超級計算機在一次美國智力競賽中擊敗了人類選手后,認知計算技術得到了高度關注。超級計算機問世到認知計算快速發展的時間差超過半個世紀,其中主要原因是研制軟技術的難度遠遠大于開發硬技術。機器設備的生產是一個直觀的重復性的物理過程,方法學的形成則是一個可以千變萬化的抽象現象。新技術發明和應用之間的時差本質上是因為軟、硬技術遵循各自不同的發展規律所產生的。
聽力學是引入認知計算方法較早的一個領域。上個世紀末,人工智能技術已經開始用于聽力算法,幫助助聽器學習各種使用場景,從患者身處的環境中,實時收錄采集聲音信號,并快速分析處理后,能對目標信號進行具有針對性的放大,力求做到精準和適度。這是基于認知計算的助聽器學習的一個例子。能適應,有記憶能力,不斷調試和糾錯學習,熟悉患者個體使用習慣,實現有效放大效果。
隨著認知計算普及,模仿人類思維去改善聽力康復器械已成為當今重要方向標。神經科學和大腦認知科學高度發展,導致我們對人類交流和失調研究越來越明顯地依賴于大腦信息。近期,我們看到跨學科研究將聽覺功能和聽力損失與大腦功能聯系一起,以便能研制出更新的聽力測試和聽損干預手段。數字助聽器問世20年后,認知計算成為大腦聽力或仿生聽力等各種新技術的創新驅動。雖然硬件外形變化不大,助聽器的內在功能和作用卻發生了翻天覆地的變化。因此,在硬聽力技術基礎上,加快研發軟技術是推廣新技術從發明到實際應用有效手段之一。
前面介紹了軟硬聽力技術之間承上啟下的關系。硬技術可能解決了一個獨立的問題,而軟技術能在此基礎上解決一系列相互關聯的問題;相比硬技術,提高軟技術能力更能加快新技術應用,縮短發明和使用之間的時間差距。軟、硬聽力技術之間的關系揭示了這兩種技術分類的內部邏輯關系和相互之間的動態驅動關系。理解聽力學軟、硬技術相互之間的互動和依賴關系,才能發揮技術的作用;揭示聽力學技術發明和實際應用之間存在的延遲,給與我們足夠的時間為新技術的推廣應用,奠定堅實的基礎。所以,研究和學習技術的這些特征有助于更好掌握技術,充分發揮軟、硬技術能力,無論是幫助我們學習,還是改善聽力師的臨床技能,都是非常重要的。
從臨床使用角度,我們常可以看到這種情景:硬聽力技術功能越復雜,人們對硬件的依賴性越大,如當助聽器驗配軟件提供選擇越多,為驗配師提供的調試方法越復雜時,驗配師很可能會放棄復雜的操作系統,直奔所謂“一鍵式”的簡化操作路徑。反之,當硬件設備越簡單,我們越喜歡依賴簡單操作的感受去判斷效果的好壞。比如一臺助聽器只有三個能用小螺絲刀調試的按鈕時,我們可能會來回不停地在三個按鈕功能之間切換和調試,這時我們會更多地關注簡單操作后的結果。
從學習過程來看,掌握軟、硬聽力技術所花費的精力和學習難度也不同,硬技術往往顯得更容易一些,這是因為學習硬技術是一個系統的反復練習和操作過程,常常會考量我們如何快速掌握操作程序的能力。比如第一次學習使用雙通道聽力計時,我們的注意力往往集中在記憶聽力計鍵盤各個按鈕分組功能,隨著練習增加,熟練程度相應提升。軟技術的學習更需要我們去思考和分析,比如臨床測聽掩蔽技術是一個需要及時做出決策的思維過程。掩蔽聲和測試聲之間的強度關系迫使我們必須在過渡掩蔽和掩蔽不足的范圍內做出正確選擇,單靠速記掩蔽公式還不夠,只有在多個復雜場景中訓練快速決策,不斷試錯,才能熟能生巧,準確地完成掩蔽測試。就學習而言,最佳的效果應該是在熟練掌握硬件技術同時,充分理解軟技術的作用,把握好二者的關系,利用相互之間的依賴關系,合理平衡是充分發揮技術優勢的最高境界。
硬聽力技術和軟聽力技術各自的作用猶如地圖和指南針,地圖標明了所有能找到的詳細地形信息和最佳路徑,我們只需掌握地圖上有的信息,就不會迷路,不過地圖上沒有的信息,可能就是迷失方向的原因。指南針雖小和簡單,一根針提供了用地磁場來定北極的一種方法,非常靈活,只要我們掌握了定位原理,分清東南西北,無論路途多復雜,都能找到路。在現實生活中,我們需要地圖,也需要指南針。在聽力學,我們需要軟、硬聽力技術,更重要的是需要充分發揮二者結合起到的作用。