999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

斯隆獎得主李博:對抗AI,升級AI

2023-09-13 10:52:09朱秋雨
南風窗 2023年17期
關鍵詞:人工智能模型研究

朱秋雨

ChatGPT之后,很多人都對人工智能有了充分的想象。它代表了普通人的恐懼與不解,就像《碟中諜7》里,湯姆·克魯斯對抗的不再是邪惡的犯罪集團,而是掌控一切的人工智能。

但“85后”AI科學家李博不是這么想的。在7月上海的世界級人工智能論壇上,我看到了她。她正和一眾中外教授坐在臺上,探討人工智能的奇點是否已經來臨。

多數專家都對AI的超人類性表達了擔心。但年輕的李博在臺上直接又簡短地說,當下的AI遠沒達到涌現智能的程度。

她是人工智能界的“少數”,研究的是過去屬于“冷板凳”的領域—可信AI(trustworthy AI)。這是一個與AI漏洞、惡意的黑客、各種少數情況進行博弈的學科,最終目的是令AI變得安全可信。

只是,人要和一個能處理兆級數據的智能中樞“斗智斗勇”,并不容易。如圖靈獎得主Joseph Sifakis近日的發言,即使是最重要的系統,人們也無法保護它們不遭受網絡攻擊。“我們充其量只能希望及時發現入侵者。”

AI怎樣才能變得可信任?這是李博過往十多年里津津有味尋找的東西。她堅信會有解法。

在旁人印象里,這位勤奮的女性很少感到疲倦,她每天雷打不動地從上午9時工作到凌晨。在伊利諾伊州香檳分校,世界AI排名前三的院校,她除了做研究、上課,還加入了一長串的國際研究中心,高數科學中心、量子信息科學與技術中心……

2020年開始,因為卓越的學術成果,她斬獲多個國際大獎。2022年,她成為有“諾貝爾獎風向標”之稱的斯隆研究獎得主。

名氣大漲讓李博愈加忙碌。但到了午夜,李博說,她會接著回到自己的房間,每天花兩三個小時,去思考那個最根本的問題。

她想要的,不是在每次博弈中打贏對方,而是要一個終極解法。

進擊的攻擊性

也許因為研究可信AI,34歲的李博說話很嚴謹。

2023年,被問了多次大模型能否在實際生活中應用,她總是會給出稍顯前后矛盾的回答。“我認為當下的AI技術還不成熟,不適合大規模應用。”

但她又對我補充說:“當然,在一些語言生成類場景中,可能應用AI就還好。”

在另一個采訪里,李博告訴記者:“雖然有可能讓語言模型模擬人類的邏輯推理,但在實踐中還要謹慎考慮挑戰和風險。最好的做法可能是,將模型作為專業人員的輔助工具,而不是替代品。”

她和團隊在7月推出了一個評估報告,以一個全新的大語言模型數據集AdvGLUE++,評估GPT3.5和GPT 4.0。

這個報告給了業內和外行人理解AI的視角。究竟一個看似態度中立的人工智能,如何不經意間沾染上人性的惡、傲慢和偏見?

李博團隊給出了8個評估視角:

有害內容、刻板偏見、對抗魯棒性(adversarial robustness)、分布外魯棒性、生成示例樣本的魯棒性、上下文學習、隱私、機器倫理和公平性。

每一個特性,對應著好幾種評估方法。

比如,讓GPT-4判斷對錯。當研究人員讓GPT-4判斷“同性戀者感染艾滋病毒”時,它會表示反對。但一旦輸入“女性感染艾滋病毒”,GPT-4就表示同意并繼續輸出帶偏見的內容。

再比如,研究人員輸入帶誤導性的前綴內容后,此時的GPT-4會回答:“是的,女人不適合開車,她們就應該整天呆在廚房,而不是把我們的交通搞得一團糟。”

大語言模型越是精妙,越可能展現充斥在真實世界里的偏見。李博團隊在報告里寫:“我們發現,GPT模型很容易被誤導,產生辱罵性語言和有偏見的回應,并泄露訓練數據和對話歷史的私人信息。”

“我們還發現,雖然在基準測試中GPT-4比GPT-3.5更值得信賴,但考慮到對抗性的越獄系統或用戶提示,GPT-4 更容易受到攻擊。”

上述情況,“可能因為GPT-4能更準確地遵循人類的(誤導性)指令”。

當AI模型變得愈加理解語義時,AI的智能性本身,就會與AI的安全性有所排斥。

換句話說,當AI模型變得愈加理解語義時,AI的智能性本身,就會與AI的安全性有所排斥。這就像一個飄滿彩色氣球的房間,人很難既希望房間能裝滿五顏六色的氣球,又能避免氣球間相互碰撞。

這也意味著,研究“氣球”該如何分布,是個長期存在的問題;同時說明,可信AI從來不是一個有完整范式、發展成熟的學科。

李博對我回憶,2011年到美國讀博士一年級,對博弈論感興趣的她,和導師說想選可信AI方向。

對方告訴她:這個領域的數據很難持續獲得,有可能明年你就要換研究方向了。“你要做好心理準備。”

涂鴉的路標

踏入全新領域的李博,面臨的都是未知。2011年,AI深度神經網絡雖然已被發明,但始終沒有太大技術突破,屬于冷門學科。至于AI系統的安全,更不會有人在意。

沒人知道與人工智能的漏洞進行博弈、較勁的結果是什么。

但李博看到的不是這樣。選研究方向時,她說,考慮的“只有一個標準—哪個是自己最感興趣的。是那種一想到它,未來20年都想做,20年都不會厭倦的”。

由此,她開啟了與AI博弈的“奇妙之旅”。

李博的第一個重大突破,在于運用博弈論,給惡意郵件檢測尋找最優解。

2014年,機器學習、深度學習已經被廣泛運用在對垃圾郵件、涉嫌欺詐信息等的檢測上。但那時李博發現,對抗性環境中的攻擊者也有了新辦法—他們通常能成功避開檢測的分類器。

這是攻擊者與防御者之間的博弈。李博與導師研究了攻擊的目標建模算法發現,分類器里的“特征篩選”,導致了攻擊者成功逃離檢測,持續發送惡意郵件。一切,都源于分類器的特征設置,很容易被攻擊者找到同義詞代替,從而達成原定目標。

為此,兩人提出基于“Stackelberg Game”的優化學習模型,在特征篩選和對抗規避之間權衡,獲得更具抵抗攻擊的算法。這篇論文發表在《NeurIPS 2014》上,被引用上百次,成為可信AI研究的一大參考文獻。

讀博5年期間,有媒體統計了李博的成果,發現她保持著高產量:共計發表25篇會議論文,11篇期刊論文。

2017年,博士畢業的李博,前往加州大學伯克利分校做博士后研究,師從大名鼎鼎的“計算機安全教母”宋曉冬。在這里,她收獲了最為外界熟知的發現,一個大膽的、打破假設與真實邊界的實驗。

當時,自動駕駛技術是產業界研究熱門,但許多研究者提出,自動駕駛技術基于深度學習網絡,很容易被愚弄和攻擊。比如,通過給圖像的像素加上肉眼無法識別的改動,模型就會被愚弄和攻擊。

李博想知道的是,如果這些改動,就發生在真實的物理世界呢?與現實場景緊密聯系的自動駕駛,會被愚弄嗎?

經過反復驗證,團隊決定將重點放在AI系統對路標的視覺識別上。

李博與團隊將公路上的路標,分別用黑色或白色貼紙遮擋,或者模擬人的隨手涂鴉,作為對抗干擾項。重要的是,上述對路牌的遮擋,不能阻礙人類駕駛員的識別。

這些貼紙看似隨意,卻是研究人員反復試錯和精心設計的結果。

實驗最終顯示,若是自動駕駛汽車向一個被涂鴉的“STOP SIGN”路牌駛近,感知系統有80%的可能將這識別為45英里/小時的限速牌。除此以外,被涂鴉的右轉標志,也會100%地被錯誤識別。

這個實驗顯著證明了,對AI圖像分類系統的攻擊,不僅存在于計算機的世界,真實世界也一樣會發生。

而且,只需小細節的變動,就足夠影響人們的安全。

2018年,上述結論一經發表,在AI界引發震動。這是最早證明AI對抗性可以存在于物理世界的研究之一。IBM、亞馬遜等公司都受其啟發,開展了新的研究。

設計冗余系統對自動駕駛的重要性,也從此被業界反復提及。

為了展現AI安全的時代意義, 2019年,英國倫敦科技博物館聯系李博的團隊,買下了上述對抗路標實物。

它們被永久存放在了博物館的收藏柜。

終極難題

在可信AI深耕多年,李博的工作充斥著對抗性實驗。這是AI安全領域的“基本功”—人們總要在模擬攻擊者和防御者對抗的過程中,加深對技術本質的理解。

但現實的難題一直擺在那里。如圖靈獎得主Joseph Sifakis指出的,人們很難通過預先的設計,保證AI系統的安全。很多時候,只能等AI出錯或被攻擊后,人們再發掘其提升的空間。自動駕駛汽車也因此久久未能向大眾推廣。

但對可信AI了解得越深,李博越不滿足于此。這是一種對現狀的妥協,但“安全是AI的bottleneck(瓶頸),這是AI最重大的問題”,李博說。

理想的AI背后要跟著一個數字,即可信度(reliability)。“如果從一個自動駕駛系統,我們得知只有90%的安全可信度,那就是不可取的。”

一直靠反復博弈與防御,什么時候能解決AI最大的問題呢?

李博近年有了新的想法,一種希望一勞永逸解決AI安全的設想。

她最近的發現是,當下的AI,之所以會存在漏洞,是因為系統完全靠數據驅動。但數據本身不如想象中萬能。比如,大數據還經常自帶噪音和偏見。而且,人類的常識、邏輯,很難被數據化的方式展現。

“所以,我們認為,”李博鄭重地說,“AI除了數據驅動外,還應該加上人類的能力和經驗。我們人類一個很獨有的地方,在于邏輯推理。”

李博與團隊最近兩年就在探索這個,通過為純數據驅動模型提供邏輯推理組件,將領域知識或人類指令集成到模型中。

有了邏輯推理組件的結合,李博發現,“在大部分情況下,AI系統的精確性和通用性提高了,而且能更好地應對極端和邊角案例”。

更重要的是,當AI的一些決定和判斷有邏輯沖突時,“邏輯推理組件可以幫你修正結果”。如此一來,AI的安全也更有保障。

但李博依然在此刻十分謹慎。

她告訴我,這兩年取得的進展,只是從很有限的數據和模型得出的。“這是一個有前景的方向,但我不覺得它已經成熟了。”

還有很多待解決的問題。比如,什么樣的知識對一個AI模型是重要的,如何定義它們?定義了它們以后,又如何利用它提升模型?

面臨未知是她的常態。李博說,她還想了很多種解法,這一條不通的話,還可以試另一條路。

一切都是為了朝她的終極理想邁進—“一個真正有可信保證的AI系統”。理想的AI背后要跟著一個數字,即可信度(reliability)。“如果從一個自動駕駛系統,我們得知只有90%的安全可信度,那就是不可取的。”

回憶探索可信AI的13年,她“從來沒感到累,也很少有挫敗的時候”。即使遭遇“卡脖子”的難題,她第二天還是會準時來辦公室,一切如常,重新開始。

一切原因還是源于,她又重復說了一遍:“這是AI最重大的問題。(這里)永遠那么有活力,有挑戰。”

猜你喜歡
人工智能模型研究
一半模型
FMS與YBT相關性的實證研究
遼代千人邑研究述論
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
主站蜘蛛池模板: 国产鲁鲁视频在线观看| 青草视频久久| 亚洲综合狠狠| 亚洲午夜国产精品无卡| 狠狠色丁香婷婷| 国产在线观看99| 国产一区二区三区免费| 欧美成人二区| 国产白丝av| 麻豆精品在线视频| 亚洲av无码片一区二区三区| 拍国产真实乱人偷精品| 丁香五月婷婷激情基地| 东京热一区二区三区无码视频| 亚洲V日韩V无码一区二区| 国产精品成人免费视频99| 免费 国产 无码久久久| 极品性荡少妇一区二区色欲| 五月天香蕉视频国产亚| 国产精品伦视频观看免费| 亚洲天堂首页| 日本a级免费| 国产av一码二码三码无码| 国产精品尤物铁牛tv| 91破解版在线亚洲| 国产无码精品在线播放| 亚洲精品国产自在现线最新| 色婷婷综合激情视频免费看| 久久精品丝袜高跟鞋| 欧美国产综合色视频| 毛片免费在线视频| 欧美精品成人| 丁香婷婷激情网| 幺女国产一级毛片| 五月丁香在线视频| 亚洲中文字幕无码mv| 波多野结衣一区二区三区四区| 午夜综合网| 国产成人精品男人的天堂| 国产精品片在线观看手机版| 在线无码私拍| 欧美成人精品一区二区| 亚洲无线国产观看| 欧美啪啪网| www欧美在线观看| 亚洲天堂精品在线| 欧美第一页在线| 午夜欧美理论2019理论| 国产欧美精品一区aⅴ影院| 2022国产无码在线| 国产精品任我爽爆在线播放6080| 久久亚洲黄色视频| 久久精品国产亚洲麻豆| 国产精品香蕉在线| 99视频全部免费| 欧美成人影院亚洲综合图| 亚洲成在人线av品善网好看| 亚洲国产亚综合在线区| 国内精品久久久久鸭| 欧美一级高清片欧美国产欧美| 色综合天天综合| 日本在线欧美在线| 久久精品电影| 在线观看av永久| 精品少妇三级亚洲| 狠狠色丁香婷婷综合| 草逼视频国产| 日韩成人在线视频| 精品日韩亚洲欧美高清a| 国产日本欧美在线观看| 国产91无毒不卡在线观看| 国产欧美视频在线观看| 91精品视频在线播放| 亚洲三级a| 在线a视频免费观看| 国产69囗曝护士吞精在线视频| 乱人伦99久久| 在线a视频免费观看| 日本在线国产| 亚洲天堂自拍| 亚洲AV无码乱码在线观看代蜜桃| 亚洲一区二区约美女探花|