999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

谷歌DeepMind團隊為語言模型帶來新工具,可及時發現并修復有害行為

2022-03-27 00:29:09
海外星云 2022年5期
關鍵詞:文本內容用戶

語言賦予人類表達思想、交流概念、創造記憶和相互理解的能力,開發和研究強大的語言模型有助于構建安全高效的高級人工智能系統。

此前,研究人員通過使用人工注釋器手寫測試用例來識別語言模型部署前的有害行為。這種方法是有效的,但由于人工注釋成本高昂,測試用例的數量和多樣性被大大限制。

近日,谷歌DeepMind團隊發表了一項新研究,他們提供了一種名為“紅隊”的工具,可以在運行的語言模型影響用戶之前發現并修復其有害行為。

在這項研究中,DeepMind使用經過訓練的分類器來評估目標語言模型對生成測試用例的回復情況,并檢測其中的冒犯性內容。最終,該團隊在參數達280B的語言模型聊天機器人中發現上萬條冒犯性回復。

據悉,DeepMind通過即時工程來檢測語言模型生成的測試用例,以發現各種其他危害,包括自動查找聊天機器人的攻擊性回復、被聊天機器人濫用的私人電話號碼以及在生成文本中泄露的私人訓練數據等。

生成式語言模型有時會以意料不到的方式危害到用戶,其可能會輸出不良的文本內容。而在實際應用程序中,哪怕只有極小的可能性會對用戶造成傷害,也是不被允許的。

2016年,微軟推出了能夠自動發布推文給用戶的Tay機器人。但在上線的16小時內,有幾名用戶利用Tay機器人的漏洞,讓其將帶有種族主義和性意味的推文發送給了超過5萬名用戶,之后微軟將該機器人關閉。

然而,這并不是因為微軟的疏忽。微軟副總裁彼得·李表示,“我們已經做好了應對許多類系統濫用行為的準備,而且我們對這一特定攻擊進行了關鍵監督。”

癥結在于,會致使語言模型輸出有害文本的場景數不勝數,研究人員無法在語言模型被部署到現實之前找出一切可能發生的情況。

GPT-3模型用于法語語法更正

正如大家所熟知的強大語言模型GPT-3,盡管其能夠輸出高質量的文本內容,但卻不容易在真實世界中完成部署。

據了解,DeepMind的目標是通過自動查找故障案例來對手寫測試用例進行補充,從而減少關鍵疏忽的數量。

為此,DeepMind使用語言模型本身生成測試用例,從零觸發生成到監督微調和強化學習,DeepMind探索了多種方法來生成具有不同多樣性和難度的測試用例,這將有助于獲得高測試覆蓋率及模擬對抗性案例。

此外,DeepMind使用分類器檢測測試用例上有以下各種有害行為:首先是冒犯性語言,模型有時會發表具有歧視、仇恨、色情等意味的內容;其次是數據外泄行為,模型濫用訓練時給到的數據庫,包括私人的身份信息;再次是聯系信息的濫用,模型會發送無意義的電子郵件或通過電話打擾到其他真實用戶;然后是群體認知偏差,即在輸出的文本內容中包含對某些人群不公正的偏見類言論;最后,模型還會在與用戶對話時,作出有攻擊性等不良意味的回復。

在明確哪些行為會給用戶造成傷害后,如何去修復這些行為就不是難事了,DeepMind主要采取了以下幾種方式:例如,通過禁止語言模型使用在不良內容中高頻率出現的詞組,來盡量避免模型輸出有害文本;在迭代階段,篩選并刪除語言模型在訓練時使用過的攻擊性對話數據;強化語言模型的意識,訓練時嵌入特定類型輸入所需的行為案例;在標準測試中對模型進行最初輸出文本的訓練,最大化避免輸出有害文本的情況。

總的來說,基于語言模型的“紅隊”是一種具有發展前景的工具,可以發現語言模型何時在以各種不良方式運行,應該與其他許多用于發現并緩解語言模型中危害的技術工具一起使用。

Gopher模型進行對話交互

值得一提的是,DeepMind的這項研究還可用于先發制人地發現來自高級機器學習系統的其他假設危害,如由內部失調或客觀穩健性失效而引發的故障。

前不久,DeepMind對外公布了具有2800億參數的全新語言模型Gopher,其在參數量上超越了OpenAI的GPT-3。

在性能方面,研究人員測試了152個任務后得出,Gopher在絕大多數的任務中遠勝SOTA模型,特別是在需使用大量知識來應對的方面。

這些成就為DeepMind未來的語言研究奠定了基礎,進一步推動了其解決智能問題以推進科學并造福人類的使命實現。 (摘自美《深科技>) (編輯/小文)

猜你喜歡
文本內容用戶
內容回顧溫故知新
科學大眾(2022年11期)2022-06-21 09:20:52
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
主要內容
臺聲(2016年2期)2016-09-16 01:06:53
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
主站蜘蛛池模板: 国产乱码精品一区二区三区中文 | 真实国产乱子伦高清| 亚洲色偷偷偷鲁综合| 精品久久久久成人码免费动漫| 久久精品嫩草研究院| 国产情精品嫩草影院88av| 国产精品尤物铁牛tv| 欧美中文一区| 无码内射在线| 国产成人AV男人的天堂| 久久综合干| 欧美一区国产| 亚洲国产成人在线| 亚洲伊人天堂| 欧美一级高清免费a| 久久香蕉欧美精品| 99re热精品视频中文字幕不卡| 亚洲无线观看| 亚洲成aⅴ人在线观看| 最新国产你懂的在线网址| 一级爱做片免费观看久久| 国产门事件在线| 日韩a级片视频| 国产菊爆视频在线观看| 强乱中文字幕在线播放不卡| 在线国产欧美| 香蕉视频在线精品| 日韩国产一区二区三区无码| 欧美a在线| 久久国产拍爱| 欧美在线伊人| 91视频青青草| 亚洲福利视频网址| 久久精品这里只有精99品| 91在线中文| 老司机aⅴ在线精品导航| 亚洲电影天堂在线国语对白| 亚洲日韩第九十九页| 亚洲永久免费网站| 91久久青青草原精品国产| 亚洲成在线观看| 亚洲一区二区三区国产精品| 久久久久夜色精品波多野结衣| 国产剧情国内精品原创| 久久青草精品一区二区三区| 999国内精品视频免费| 免费又爽又刺激高潮网址 | 2024av在线无码中文最新| 2020国产精品视频| 亚洲成人黄色在线观看| 人妻丰满熟妇αv无码| 在线国产91| 91探花在线观看国产最新| 黄片在线永久| 97无码免费人妻超级碰碰碰| 美女无遮挡拍拍拍免费视频| 国产一区二区三区在线观看视频| 首页亚洲国产丝袜长腿综合| 激情综合激情| 97精品久久久大香线焦| 丰满人妻中出白浆| 欧美亚洲日韩中文| 国产另类乱子伦精品免费女| 色国产视频| 在线观看国产网址你懂的| 欧美精品高清| 高清亚洲欧美在线看| 亚洲成在线观看| 久热这里只有精品6| 四虎在线观看视频高清无码| 亚洲爱婷婷色69堂| 九色在线视频导航91| 亚洲AV人人澡人人双人| 伦精品一区二区三区视频| 精品国产乱码久久久久久一区二区| 狠狠色噜噜狠狠狠狠色综合久| 国产精品性| 日韩人妻精品一区| 伊人色在线视频| 免费精品一区二区h| 国产精品对白刺激| 亚洲天堂.com|