999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

谷歌DeepMind團隊為語言模型帶來新工具,可及時發現并修復有害行為

2022-03-27 00:29:09
海外星云 2022年5期
關鍵詞:文本內容用戶

語言賦予人類表達思想、交流概念、創造記憶和相互理解的能力,開發和研究強大的語言模型有助于構建安全高效的高級人工智能系統。

此前,研究人員通過使用人工注釋器手寫測試用例來識別語言模型部署前的有害行為。這種方法是有效的,但由于人工注釋成本高昂,測試用例的數量和多樣性被大大限制。

近日,谷歌DeepMind團隊發表了一項新研究,他們提供了一種名為“紅隊”的工具,可以在運行的語言模型影響用戶之前發現并修復其有害行為。

在這項研究中,DeepMind使用經過訓練的分類器來評估目標語言模型對生成測試用例的回復情況,并檢測其中的冒犯性內容。最終,該團隊在參數達280B的語言模型聊天機器人中發現上萬條冒犯性回復。

據悉,DeepMind通過即時工程來檢測語言模型生成的測試用例,以發現各種其他危害,包括自動查找聊天機器人的攻擊性回復、被聊天機器人濫用的私人電話號碼以及在生成文本中泄露的私人訓練數據等。

生成式語言模型有時會以意料不到的方式危害到用戶,其可能會輸出不良的文本內容。而在實際應用程序中,哪怕只有極小的可能性會對用戶造成傷害,也是不被允許的。

2016年,微軟推出了能夠自動發布推文給用戶的Tay機器人。但在上線的16小時內,有幾名用戶利用Tay機器人的漏洞,讓其將帶有種族主義和性意味的推文發送給了超過5萬名用戶,之后微軟將該機器人關閉。

然而,這并不是因為微軟的疏忽。微軟副總裁彼得·李表示,“我們已經做好了應對許多類系統濫用行為的準備,而且我們對這一特定攻擊進行了關鍵監督。”

癥結在于,會致使語言模型輸出有害文本的場景數不勝數,研究人員無法在語言模型被部署到現實之前找出一切可能發生的情況。

GPT-3模型用于法語語法更正

正如大家所熟知的強大語言模型GPT-3,盡管其能夠輸出高質量的文本內容,但卻不容易在真實世界中完成部署。

據了解,DeepMind的目標是通過自動查找故障案例來對手寫測試用例進行補充,從而減少關鍵疏忽的數量。

為此,DeepMind使用語言模型本身生成測試用例,從零觸發生成到監督微調和強化學習,DeepMind探索了多種方法來生成具有不同多樣性和難度的測試用例,這將有助于獲得高測試覆蓋率及模擬對抗性案例。

此外,DeepMind使用分類器檢測測試用例上有以下各種有害行為:首先是冒犯性語言,模型有時會發表具有歧視、仇恨、色情等意味的內容;其次是數據外泄行為,模型濫用訓練時給到的數據庫,包括私人的身份信息;再次是聯系信息的濫用,模型會發送無意義的電子郵件或通過電話打擾到其他真實用戶;然后是群體認知偏差,即在輸出的文本內容中包含對某些人群不公正的偏見類言論;最后,模型還會在與用戶對話時,作出有攻擊性等不良意味的回復。

在明確哪些行為會給用戶造成傷害后,如何去修復這些行為就不是難事了,DeepMind主要采取了以下幾種方式:例如,通過禁止語言模型使用在不良內容中高頻率出現的詞組,來盡量避免模型輸出有害文本;在迭代階段,篩選并刪除語言模型在訓練時使用過的攻擊性對話數據;強化語言模型的意識,訓練時嵌入特定類型輸入所需的行為案例;在標準測試中對模型進行最初輸出文本的訓練,最大化避免輸出有害文本的情況。

總的來說,基于語言模型的“紅隊”是一種具有發展前景的工具,可以發現語言模型何時在以各種不良方式運行,應該與其他許多用于發現并緩解語言模型中危害的技術工具一起使用。

Gopher模型進行對話交互

值得一提的是,DeepMind的這項研究還可用于先發制人地發現來自高級機器學習系統的其他假設危害,如由內部失調或客觀穩健性失效而引發的故障。

前不久,DeepMind對外公布了具有2800億參數的全新語言模型Gopher,其在參數量上超越了OpenAI的GPT-3。

在性能方面,研究人員測試了152個任務后得出,Gopher在絕大多數的任務中遠勝SOTA模型,特別是在需使用大量知識來應對的方面。

這些成就為DeepMind未來的語言研究奠定了基礎,進一步推動了其解決智能問題以推進科學并造福人類的使命實現。 (摘自美《深科技>) (編輯/小文)

猜你喜歡
文本內容用戶
內容回顧溫故知新
科學大眾(2022年11期)2022-06-21 09:20:52
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
主要內容
臺聲(2016年2期)2016-09-16 01:06:53
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
主站蜘蛛池模板: 噜噜噜综合亚洲| 青青草a国产免费观看| 色婷婷国产精品视频| 国内精自视频品线一二区| 国模视频一区二区| 国内黄色精品| 青青草91视频| 激情视频综合网| 秋霞国产在线| 国产99视频在线| 欧美一级视频免费| 日韩第八页| 91精品国产91久久久久久三级| 欧美午夜精品| www.亚洲色图.com| 最新亚洲人成网站在线观看| AV不卡无码免费一区二区三区| 亚洲国产精品日韩专区AV| 亚洲欧美成人在线视频| 亚洲人成网18禁| 亚洲视频免| 久久精品国产国语对白| 综合社区亚洲熟妇p| 妇女自拍偷自拍亚洲精品| 综合社区亚洲熟妇p| 亚洲午夜福利精品无码不卡| AV老司机AV天堂| 9cao视频精品| 久久狠狠色噜噜狠狠狠狠97视色| 国产在线视频欧美亚综合| 国产一级毛片在线| 少妇精品在线| 黄片一区二区三区| 欧美曰批视频免费播放免费| 精品無碼一區在線觀看 | 小说区 亚洲 自拍 另类| 国产精品视频第一专区| 男女精品视频| 五月婷婷亚洲综合| 国产精品xxx| 99视频全部免费| 国产又爽又黄无遮挡免费观看 | 亚洲清纯自偷自拍另类专区| 亚洲欧美天堂网| AⅤ色综合久久天堂AV色综合| 亚洲AV无码久久精品色欲| 国产精品三级av及在线观看| 在线免费亚洲无码视频| 91久久国产综合精品| 99青青青精品视频在线| 亚洲天堂免费观看| 人妻中文字幕无码久久一区| 人妻熟妇日韩AV在线播放| 亚洲天堂久久新| 成人毛片免费观看| 亚洲天堂网在线播放| 免费不卡在线观看av| 日本福利视频网站| 成人在线视频一区| 久久综合成人| 国产免费高清无需播放器| 国产福利微拍精品一区二区| 麻豆精品视频在线原创| 久热这里只有精品6| 亚洲综合香蕉| 国内丰满少妇猛烈精品播| 欧美日本在线观看| 欧美a级在线| 欧美另类图片视频无弹跳第一页| 亚洲欧美日本国产综合在线 | 久久这里只有精品国产99| 在线欧美一区| 在线无码私拍| 亚洲精品午夜无码电影网| 丰满人妻久久中文字幕| 麻豆精品在线播放| 91无码网站| 久无码久无码av无码| 萌白酱国产一区二区| 日本午夜影院| 欧美亚洲国产视频| 亚洲一区二区三区国产精华液|