沈知涵
你和朋友坐在一起聊天,隨手把手機扔在桌上。你問他,家里暖氣不熱怎么辦?夜晚,你便在小紅書的信息流里刷到“教你給暖氣放氣”。你一驚,心想“難道又被手機竊聽了”?因為你從未主動搜索過類似話題。
“App監聽談話”,被反復提及,原因是用戶總能發現“巧合”,卻難以將其證實。相關商業公司也只是否認,拿不出反駁證據。如果App真的通過麥克風一直監聽我們,到底可不可行?
人們的確抓到過智能音箱和語音助手的把柄,亞馬遜Alexa曾因為錯誤理解指令,把“偷聽”來的談話錄音發給用戶通訊錄里的好友,證明麥克風偷聽并非臆想。
2020年,一位產品經理在hackernoon(一個技術分享社區)寫過一篇文章專門解釋這個困惑。他拿Siri舉例,說Siri確實在“聽”,但它“聽不懂”,直到被“Hey Siri”觸發后,它才開始理解你的指令。
因為Siri只是聽懂你在喊它,就已經耗費很多“力氣”。落到麥克風上的聲音會以0.01秒為一幀,每次20幀(0.2s),被輸入深度神經網絡,進行本地計算。深度神經網絡將這些聲音轉換成概率密度函數。當函數值達到閾值,主處理器被激活。在主處理器激活之前,處理聲音的是協處理器。
所謂協處理器可以理解為,具備有限的功能和電量消耗的輔助處理器,允許用戶在屏幕關閉時,訪問一些“始終開啟”的功能。“Hey Siri”功能推出后,它就幫著Siri處理聲音。Siri理解,你不想讓它聽的聲音,它就“左耳進右耳出”。
那App會不會跟語音助手一樣呢?如果它“左耳進”,但“沒右耳出”呢?

“Hey Siri”可被看作蘋果的“底層應用”,是寫在系統內部的,相比之下,iOS系統之上的應用,調用系統權限的時候,用戶不會那么“無感”。
2019年,國內的一個開發者團隊寫了一個安卓App,在演示中,App獲取“錄音”權限后,鎖屏在后臺監聽。開發者對麥克風說:“今晚吃什么?”服務器端就收到App上傳的語音轉文字后的信息。他們為了證明,拋開所有限制條件,僅從技術角度來說,“App在后臺監聽到用戶說什么”是可行的。
為什么強調“僅從技術上”?因為想要完全繞過用戶的注意,實現“偷”聽,難度可就大了。2017年,Facebook廣告負責人加西亞·馬丁內斯在《連線》上撰文。他說,如果Facebook通過麥克風記錄聽到的所有內容,在功能上等同于用戶和Facebook在“一直通電話”。
有人做了實驗,錄音一小時,消耗電量6%。低功耗長時間的錄音,耗電量不是很大。如果多個 App,多個SDK同時使用該方式,手機會變得又熱又燙。
你難以想象“實時傳輸”能產生多少用戶數據。馬丁內斯假設用戶每天使用手機時長為半天,以當時來計算,“網絡通話”的單向傳輸速率平均24kbps,每人每天傳輸數據大約130MB。當時Facebook僅在美國的日活是1.5億,每天產生大約20PB數據。Facebook數據庫中存儲了300PB的數據,每天處理的數據量大約為600TB。這樣一算,監聽所產生的音頻數據就是每天要處理的33倍了。即便公司體量如Facebook,也難承其重。
也許有人仍有疑問。既然這條路行不通了,手機、App廠商可以在本地將“語音轉文字”,過濾后提取有價值的信息,再上傳到后臺服務器。拋開這樣做后臺運算會“吞噬”CPU,造成手機性能下降不說,擔負的成本也不低。
Google以0.006美元/15秒向第三方出售其“語音轉文字”服務。(一個用戶)每天轉寫24小時的成本是12614美元,即便每天轉寫1小時也得525美元。
根據各個平臺的隱私政策,獲取麥克風權限,淘寶是為了與AI客服對話,抖音是為了拍攝短視頻作品,百度是為了語音搜索。
我做了一次從個人消費者出發的測試,想去證實兩個懷疑,這三款主流的App有沒有在無感知(沒有啟用麥克風)的情況下,錄下我的對話;并將此用于App的個性化推薦和廣告系統。
為此我盡可能規避其他變量,用一部抹掉所有內容和設置,并升級到iOS15以上的iPhone 7 Plus進行測試。并且注冊了以上三款App的新賬戶。
至少在這次實驗中,App調用麥克風時無法不被察覺,也沒有將我的談話內容,和周圍環境聲音,“轉化為”個性化推薦。
就像開篇提到的“供暖”例子,基于社交媒體對用戶的了解,你可能已經被準確打上“年輕女性”“北漂”標簽,恰好“北京供暖”這個話題搜索熱度高。帖子可能被推給了10萬打著同樣標簽的人,其中恰好包括你,你理所當然地認為自己被監聽了。
這可能是證實偏差(confirmation bias)在作祟。證實偏差是一個心理學上的概念,它就像腦中的過濾器,留下你認為正確的,而把那些與需要不相關的其他信息無意識地過濾掉,選擇性注意。它也被稱作“視網膜效應”或“孕婦效應”。
類似例子非常常見。你與男朋友在外散步,討論起最近搬家,談及買什么牌子的投影儀好。結果你晚上回家刷手機,不僅在社交媒體上被推薦中介看房,淘寶還給你推送了新款投影儀。這時候,你剛準備跟男朋友炫耀“我就說,手機一定在竊聽我們”。等等,冷靜了一下,回憶起自己出門根本沒帶手機。
這種情況之所以發生,也許是你的男朋友已經在網上瀏覽過搬家,如何挑選投影儀。而你們因為在網絡上互為好友,被監測到相互轉發等行為,已經被廣告系統標注為“有共同興趣”。
所以廣告系統已經這樣成熟了嗎?沒必要!真的沒必要!
至少在商業消費領域,通過“偷”聽獲得的用戶數據,質量不見得高,但需要付出的成本極其高昂,公司沒必要為此買單。
大部分主流App都表明類似立場。因為對于第三方App來說,它們想不被用戶發覺,或突破系統權限進行監聽幾乎不可能。
2019年,澎湃新聞的記者發現,在今日頭條App中關閉程序化廣告后,用戶看到的廣告數量保持不變,但廣告相關度會降低。南都在2020年的《個人信息安全年度報告》中對50款頭部App進行測評,發現六款沒有提供個性化推薦關閉選項。兩年之后,這些頭部App均增加了這一選項。
好了,這下手機不會“搶答”了。