


關(guān)鍵詞 語(yǔ)言智能;語(yǔ)言治理;數(shù)據(jù);倫理安全;技術(shù)評(píng)測(cè)
中圖分類號(hào)H002 文獻(xiàn)標(biāo)識(shí)碼A 文章編號(hào)2096-1014(2024)03-0038-11
DOI 10.19689/j.cnki.cn10-1361/h.20240304
一、引言
當(dāng)前,以人工智能為代表的現(xiàn)代科技飛速發(fā)展,智能技術(shù)離開實(shí)驗(yàn)室,全面走進(jìn)社會(huì),前所未有地豐富了語(yǔ)言生活,但也對(duì)原有的語(yǔ)言治理模式形成了沖擊(王春輝2020,2021)。在智能技術(shù)的放大下,社會(huì)語(yǔ)言問題的復(fù)雜性和不確定性劇增,國(guó)家語(yǔ)言治理的難度持續(xù)加大(王輝,周智婉2021)。智能時(shí)代,數(shù)據(jù),包括語(yǔ)言數(shù)據(jù),已成為新科技發(fā)展的關(guān)鍵要素和現(xiàn)代經(jīng)濟(jì)的生產(chǎn)要素(李宇明2023)。張凱等(2022)強(qiáng)調(diào),數(shù)據(jù)資源的重要性日益凸顯,數(shù)據(jù)“管理”也逐漸走向數(shù)據(jù)“治理”,既要關(guān)注語(yǔ)言數(shù)據(jù)的數(shù)量與質(zhì)量,也重視治理模式的優(yōu)化與創(chuàng)新。曹進(jìn)、趙寶巾(2021)指出,深度偽造信息內(nèi)容、提取敏感信息等智能應(yīng)用引起的問題給國(guó)家語(yǔ)言安全帶來(lái)“全新挑戰(zhàn)”,在此背景下,語(yǔ)言服務(wù)具有極為重要的安全價(jià)值。王春輝(2022a)也指出,語(yǔ)言數(shù)據(jù)安全是國(guó)家語(yǔ)言安全的重要組成部分,但當(dāng)前語(yǔ)言數(shù)據(jù)意識(shí)和語(yǔ)言數(shù)據(jù)安全意識(shí)不足,語(yǔ)言數(shù)據(jù)的泛用與確權(quán)不明,對(duì)語(yǔ)言數(shù)據(jù)跨境流動(dòng)關(guān)注闕如,語(yǔ)言數(shù)據(jù)市場(chǎng)安全缺乏評(píng)估。2022 年年末以來(lái),“柴語(yǔ)生”(ChatGPT)等大語(yǔ)言模型(以下簡(jiǎn)稱大語(yǔ)模)產(chǎn)品的發(fā)布,更是引起學(xué)界對(duì)國(guó)家的國(guó)際話語(yǔ)權(quán)、語(yǔ)言知識(shí)與倫理、語(yǔ)言社會(huì)傳播、語(yǔ)言信息安全、語(yǔ)言使用模式、語(yǔ)言資源保護(hù)等問題及治理方案的廣泛討論(肖辛格,等2023 ;饒高琦2022 ;令小雄,等2023;張華平,等2023;饒高琦,等2023;王春輝2022b ;李宇明,梁京濤2024)。
語(yǔ)言智能在推動(dòng)語(yǔ)言生活發(fā)展的同時(shí),自身也成為語(yǔ)言治理的對(duì)象。目前關(guān)于機(jī)器翻譯、大語(yǔ)模等具體語(yǔ)言智能治理的論述很多,本文希望從語(yǔ)言智能的治理出發(fā),對(duì)其治理抓手(數(shù)據(jù)和應(yīng)用)進(jìn)行論述,并從數(shù)據(jù)、評(píng)價(jià)和倫理安全3 個(gè)角度分析語(yǔ)言智能的治理路徑,最后提出面向能力和安全的兩方面政策建議。
二、語(yǔ)言智能發(fā)展的目標(biāo)和關(guān)鍵要素
(一)語(yǔ)言智能發(fā)展的目標(biāo)
語(yǔ)言智能的發(fā)展目標(biāo)是“營(yíng)造高效、和諧的語(yǔ)言生活,助力人類命運(yùn)共同體的建設(shè)”(語(yǔ)言智能與社會(huì)發(fā)展論壇2023)。隨著語(yǔ)言智能技術(shù)的快速融合和深度發(fā)展,語(yǔ)言生活逐漸從完全由人構(gòu)成的樣態(tài)向人機(jī)共生的樣態(tài)演進(jìn)(張洪忠,等2019;汪磊2022;饒高琦2019)。虛擬空間中政治實(shí)體、地理單元的邊界被大大模糊,語(yǔ)言社團(tuán)、文化社團(tuán)的邊界則越來(lái)越鮮明。語(yǔ)言智能技術(shù)應(yīng)為提高語(yǔ)言溝通的效率、減低語(yǔ)言障礙做出貢獻(xiàn)。
在這一目標(biāo)的驅(qū)使下,人類社會(huì)對(duì)語(yǔ)言智能提出了能力和安全兩方面的要求。前者指更強(qiáng)的語(yǔ)言理解和生成能力,更加貼合應(yīng)用目標(biāo)的服務(wù)能力,即更強(qiáng)和更好用;后者指治理方要求智能技術(shù)兩端(數(shù)據(jù)和應(yīng)用)均遵守相關(guān)的安全和倫理規(guī)則,營(yíng)造向善和共生的智能文化氛圍,即更安全和更善良。
(二)語(yǔ)言智能發(fā)展的基礎(chǔ)要素:數(shù)據(jù)
驅(qū)動(dòng)人工智能發(fā)展的三大要素為算力、算法和數(shù)據(jù)(尼克2017)。近20 年來(lái),在三者的共同推動(dòng)下,以統(tǒng)計(jì)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)為代表的技術(shù)群將人工智能推向高潮。其發(fā)展和應(yīng)用反過(guò)來(lái)又刺激了算法、算力和數(shù)據(jù)的研究與發(fā)展,形成了正反饋。
語(yǔ)言智能是人工智能的重要分支,以上現(xiàn)象也適用于語(yǔ)言智能。在三大生產(chǎn)要素中,相對(duì)而言,算法和算力與應(yīng)用的具體目標(biāo)關(guān)系較小,數(shù)據(jù)則承載了人類的通用知識(shí)和具體服務(wù)目標(biāo)的領(lǐng)域知識(shí),具有很強(qiáng)的特異性和定制性。語(yǔ)言智能區(qū)別于其他人工智能分支的獨(dú)特性,最集中地由語(yǔ)言數(shù)據(jù)體現(xiàn)。而且數(shù)據(jù)的價(jià)值不僅隨著規(guī)模的擴(kuò)大而增長(zhǎng),也隨著領(lǐng)域知識(shí)精細(xì)程度和質(zhì)量的提高而提升。近年來(lái),隨著開源運(yùn)動(dòng)成為主流(算法擴(kuò)散),計(jì)算基礎(chǔ)設(shè)施普及(算力擴(kuò)散),算法和算力在重點(diǎn)發(fā)展領(lǐng)域之間已無(wú)法形成實(shí)質(zhì)性差異,決定智能技術(shù)落地效果的關(guān)鍵更多地轉(zhuǎn)移到了數(shù)據(jù)層面。
此外,數(shù)據(jù)更基礎(chǔ)的作用體現(xiàn)在整個(gè)人工智能的發(fā)展階段中。人工智能可分為計(jì)算智能、感知智能和認(rèn)知智能(如圖1)。其中前兩者屬于弱人工智能,認(rèn)知智能屬于強(qiáng)人工智能。從計(jì)算智能到認(rèn)知智能,其難度、深度和重要程度依次增加。人類知識(shí)的表示以語(yǔ)言為媒介,而認(rèn)知智能突破所依賴的邏輯、常識(shí)等均以語(yǔ)言形式存在和交流。這些信息蘊(yùn)含于語(yǔ)言數(shù)據(jù)之中。語(yǔ)言數(shù)據(jù)資源的建設(shè),就其本質(zhì)而言是人類智能通過(guò)數(shù)據(jù)向機(jī)器智能轉(zhuǎn)移的過(guò)程。因而可以說(shuō),語(yǔ)言數(shù)據(jù)的建設(shè)和利用是弱人工智能通向強(qiáng)人工智能的重要路徑。
(三)語(yǔ)言智能發(fā)展的牽引要素:應(yīng)用場(chǎng)景
人類的思維、溝通和文化行為大多通過(guò)語(yǔ)言完成,因而語(yǔ)言智能的應(yīng)用范圍十分廣闊,對(duì)生活生產(chǎn)的滲透率很高。智能輸入法、機(jī)器翻譯、語(yǔ)音識(shí)別、自動(dòng)問答等典型語(yǔ)言智能技術(shù),一經(jīng)突破便能快速鋪開。這使得語(yǔ)言智能成為人工智能影響社會(huì)生活的最直接接口。因而有學(xué)者認(rèn)為:語(yǔ)言智能一小步,人類社會(huì)一大步(李宇明2020)。
也恰恰因?yàn)檎Z(yǔ)言智能和社會(huì)生產(chǎn)生活的緊密關(guān)系,其落地場(chǎng)景在技術(shù)發(fā)展中起到更直接的反饋?zhàn)饔谩?yīng)用場(chǎng)景提出了智能技術(shù)服務(wù)的需求。這些需求可以被抽象和概括為具體的任務(wù)。如語(yǔ)言教育中對(duì)學(xué)習(xí)者行為評(píng)價(jià)的需求,就形成了作文自動(dòng)評(píng)閱、錯(cuò)誤自動(dòng)檢測(cè)等具體任務(wù)。語(yǔ)言智能的發(fā)展不是停留在紙面上的。其優(yōu)劣,最終由它在具體任務(wù)上的性能決定。語(yǔ)言智能通過(guò)完成任務(wù),滿足生活生產(chǎn)中各場(chǎng)景的需求。發(fā)展何種語(yǔ)言智能技術(shù),構(gòu)建哪些語(yǔ)言數(shù)據(jù)資源,本質(zhì)上是由應(yīng)用場(chǎng)景決定的。可以說(shuō)應(yīng)用場(chǎng)景是語(yǔ)言智能發(fā)展的牽引要素,過(guò)去20 余年中語(yǔ)言智能的發(fā)展也基本遵循了“應(yīng)用場(chǎng)景提出任務(wù)”“技術(shù)發(fā)展以任務(wù)為導(dǎo)向”的路線。
此外,值得注意的是,語(yǔ)言智能具有其他人工智能分支所沒有的應(yīng)用場(chǎng)景多樣性。多樣性體現(xiàn)在形式和內(nèi)容兩方面。在形式上,從語(yǔ)音到字符圖像再到文本,應(yīng)用場(chǎng)景的變化對(duì)語(yǔ)言智能的處理對(duì)象提出了多樣化的需求。在內(nèi)容上,從專業(yè)技術(shù)到時(shí)政新聞再到娛樂生活,無(wú)限細(xì)分的應(yīng)用領(lǐng)域都有自己獨(dú)特的語(yǔ)言內(nèi)容需求。多樣化的需求產(chǎn)生了多樣化的任務(wù),最終也決定了語(yǔ)言智能發(fā)展為算法、數(shù)據(jù)皆具多樣性的“技術(shù)家族”。
(四)語(yǔ)言智能治理的抓手
科學(xué)技術(shù)的發(fā)展有其自有規(guī)律。雖然可以通過(guò)科技政策和行業(yè)組織對(duì)研發(fā)活動(dòng)本身進(jìn)行引導(dǎo)和干預(yù),但成本較高,可控性較差。然而研發(fā)活動(dòng)不是獨(dú)立存在的,它受到生產(chǎn)要素投入和市場(chǎng)需求的雙重制約。語(yǔ)言智能的三大生產(chǎn)要素算法、算力和數(shù)據(jù)中,前兩者屬于技術(shù)范疇;唯有數(shù)據(jù)來(lái)自社會(huì)、市場(chǎng)等具體領(lǐng)域,具有外部性和可調(diào)節(jié)性,可以作為治理的抓手。另一方面,市場(chǎng)的需求和評(píng)價(jià)決定了語(yǔ)言智能研發(fā)的出口,市場(chǎng)應(yīng)用是技術(shù)研發(fā)的最終驅(qū)動(dòng)力,可以作為治理的另一抓手。和產(chǎn)業(yè)利潤(rùn)率中的“微笑曲線”相似,語(yǔ)言智能的治理也在兩端較為有效:作為研發(fā)起點(diǎn)的數(shù)據(jù)端和作為研發(fā)終點(diǎn)的產(chǎn)品應(yīng)用端。
三、語(yǔ)言智能的數(shù)據(jù)治理
數(shù)據(jù)資源建設(shè)的深度、規(guī)模和質(zhì)量深刻影響著人工智能的核心能力發(fā)展。語(yǔ)言數(shù)據(jù)資源決定著語(yǔ)言智能在性能、技術(shù)落地、關(guān)鍵領(lǐng)域應(yīng)用和倫理安全等重要方面的表現(xiàn),而當(dāng)前中國(guó)在這些方面的實(shí)際情況并不樂觀。
(一)語(yǔ)言智能性能
當(dāng)前的語(yǔ)言智能技術(shù)對(duì)數(shù)據(jù)的規(guī)模和質(zhì)量都提出了越來(lái)越高的要求。以機(jī)器翻譯為例,要達(dá)到相同的翻譯性能,較為先進(jìn)的深度神經(jīng)網(wǎng)絡(luò)技術(shù)方案需要更多的雙語(yǔ)平行語(yǔ)料,而傳統(tǒng)的統(tǒng)計(jì)機(jī)器翻譯方法所需數(shù)據(jù)則較少(肖桐,朱靖波2021;馮洋,邵晨澤2020)。隨著語(yǔ)料規(guī)模的快速增大,深度神經(jīng)網(wǎng)絡(luò)能夠獲得持續(xù)的性能提升,而統(tǒng)計(jì)機(jī)器學(xué)習(xí)和基于規(guī)則的機(jī)器翻譯則容易遇到瓶頸。其他典型的語(yǔ)言智能應(yīng)用在性能上也具有與數(shù)據(jù)的規(guī)模和質(zhì)量同增的效應(yīng)(宗成慶2013)。
深度學(xué)習(xí)的研究對(duì)語(yǔ)言資源規(guī)模提出了極高要求,為此發(fā)展出了“預(yù)訓(xùn)練范式”——使用大規(guī)模文本語(yǔ)料庫(kù)數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,然后使用面向特定任務(wù)的小規(guī)模語(yǔ)言數(shù)據(jù)集進(jìn)行微調(diào),形成任務(wù)模型。預(yù)訓(xùn)練模型在幾乎所有自然語(yǔ)言處理任務(wù)上,都表現(xiàn)出了優(yōu)異的性能。尤其是生成式預(yù)訓(xùn)練模型(Generative Pre-trained Transformer,GPT)利用轉(zhuǎn)換器模型的編碼器和解碼器,從語(yǔ)言大數(shù)據(jù)中萃取豐富的知識(shí)。隨著參數(shù)規(guī)模膨脹,這類模型產(chǎn)生了知識(shí)涌現(xiàn)現(xiàn)象(馮志偉,等2023)。當(dāng)然,不同的技術(shù)范式對(duì)數(shù)據(jù)的類型要求、格式要求、加工方式等都有差異,但總體趨勢(shì)是相近的。
面對(duì)高性能語(yǔ)言智能巨大的數(shù)據(jù)需求,做大數(shù)據(jù)供給是必由之路,也是最重要的治理目標(biāo)。目前數(shù)據(jù)采集、標(biāo)注和交易已形成產(chǎn)業(yè),且增長(zhǎng)迅速。2023年國(guó)家發(fā)改委印發(fā)《“數(shù)據(jù)要素×”三年行動(dòng)計(jì)劃(2024—2026 年)》意見,提出到2026年年底,打造300個(gè)以上典型應(yīng)用場(chǎng)景,數(shù)據(jù)產(chǎn)業(yè)年均增速超過(guò)20%,數(shù)據(jù)交易規(guī)模倍增。山西、河南、山東等省份將數(shù)據(jù)產(chǎn)業(yè)定位為區(qū)域重點(diǎn)培育的新產(chǎn)業(yè)。2024年數(shù)據(jù)標(biāo)注產(chǎn)業(yè)預(yù)計(jì)增長(zhǎng)達(dá)到近200 億元人民幣規(guī)模。
(二)語(yǔ)言智能行業(yè)落地
實(shí)現(xiàn)人機(jī)共生、場(chǎng)景落地的關(guān)鍵在于場(chǎng)景適應(yīng)和人機(jī)協(xié)同。三大生產(chǎn)要素中,算力和算法具有較強(qiáng)的任務(wù)和領(lǐng)域通用性,最大的差異集中于知識(shí)表示的方法,而這一點(diǎn)也可以被視作數(shù)據(jù)的使用方式,從而歸入數(shù)據(jù)資源的研究范圍。具體到細(xì)分的應(yīng)用領(lǐng)域,如智能司法、智能金融、醫(yī)學(xué)信息處理等,研發(fā)者通常使用成熟的“貨架技術(shù)”進(jìn)行組合,并搭配不同的數(shù)據(jù)處理方法和知識(shí)表示方案來(lái)實(shí)現(xiàn)任務(wù)目標(biāo)。而領(lǐng)域落地所需的領(lǐng)域知識(shí)則全部蘊(yùn)含于數(shù)據(jù)要素中。
然而現(xiàn)實(shí)情況是,中國(guó)在人文社科、傳統(tǒng)制造業(yè)、農(nóng)林漁牧、基礎(chǔ)教育等行業(yè)的數(shù)據(jù)化程度較低,資源積累貧乏(饒高琦,等2023)。相關(guān)行業(yè)數(shù)據(jù)的標(biāo)注規(guī)模、質(zhì)量和交易情況均不理想,大量數(shù)據(jù)供給依靠需求方自建團(tuán)隊(duì)、自我服務(wù)。這反過(guò)來(lái)又限制了語(yǔ)言智能的行業(yè)落地。
(三)語(yǔ)言智能數(shù)據(jù)自給
關(guān)鍵領(lǐng)域方面,數(shù)據(jù)的地位更加突出。在事關(guān)國(guó)家安全、公眾福利、醫(yī)療和教育等方面的智能應(yīng)用中,高質(zhì)量、大規(guī)模的自主可控語(yǔ)言數(shù)據(jù)尤其重要。以基礎(chǔ)智能能力“自動(dòng)句法分析”為例。1995年,賓夕法尼亞大學(xué)建設(shè)并發(fā)布了中文句法分析樹庫(kù)(Marcus et al. 1994);自此之后,國(guó)內(nèi)外中文句法分析工作都以該樹庫(kù)為綱,并以樹庫(kù)上模型的精確率為評(píng)價(jià)指標(biāo)。該任務(wù)的數(shù)據(jù)基礎(chǔ)為國(guó)外控制,這一情況一直延續(xù)到近年。與此類似,在如醫(yī)療、應(yīng)急等關(guān)鍵服務(wù)領(lǐng)域,智能應(yīng)用的數(shù)據(jù)國(guó)產(chǎn)程度十分有限。
關(guān)鍵領(lǐng)域必須實(shí)現(xiàn)高質(zhì)量數(shù)據(jù)自給。目前中國(guó)通用語(yǔ)言資源建設(shè)逐步加速,而領(lǐng)域語(yǔ)言資源的質(zhì)量良莠不齊,規(guī)模大小不一。顯然,基于這樣的數(shù)據(jù)現(xiàn)狀所構(gòu)建的智能系統(tǒng)在關(guān)鍵領(lǐng)域中無(wú)法做到完全適配,且數(shù)據(jù)和數(shù)據(jù)制備的規(guī)范標(biāo)準(zhǔn)無(wú)法實(shí)現(xiàn)自主,也構(gòu)成了一種“卡脖子”現(xiàn)象,與國(guó)家對(duì)關(guān)鍵領(lǐng)域系統(tǒng)裝備自主、可控的要求相違背。
(四)數(shù)據(jù)的倫理安全
語(yǔ)言數(shù)據(jù)在很大程度上決定了語(yǔ)言智能系統(tǒng)的性能、公平性、穩(wěn)健性和安全性。語(yǔ)言智能中的性別偏見、種族歧視、政治誘導(dǎo)等問題大都可以追溯到數(shù)據(jù)層面(李宇明2023)。如今計(jì)算設(shè)施、計(jì)算服務(wù)方面的安全已經(jīng)獲得了相當(dāng)程度的重視,數(shù)據(jù)倫理安全的地位則亟待提升。語(yǔ)言資源作為重要的數(shù)據(jù)資源,在安全、倫理等底線問題上需要建立相應(yīng)的審查、約束標(biāo)準(zhǔn)。在這一方面,國(guó)家通過(guò)行政規(guī)章和立法構(gòu)建了數(shù)據(jù)倫理安全治理的基本框架。2019年的《新一代人工智能治理原則——發(fā)展負(fù)責(zé)任的人工智能》和2021年開始實(shí)施的《中華人民共和國(guó)數(shù)據(jù)安全法》《數(shù)據(jù)出境安全評(píng)估辦法》《中華人民共和國(guó)個(gè)人信息保護(hù)法》都體現(xiàn)了國(guó)家在數(shù)據(jù)安全監(jiān)管方面的基本思路。2023年《生成式人工智能服務(wù)管理暫行辦法》則對(duì)數(shù)據(jù)和數(shù)據(jù)標(biāo)注問題進(jìn)行了專條約束。
四、語(yǔ)言智能的評(píng)價(jià)治理
(一)應(yīng)用評(píng)價(jià)對(duì)語(yǔ)言智能的反饋?zhàn)饔?/p>
技術(shù)研發(fā)的終點(diǎn)是其在具體任務(wù)中的落地,并得到市場(chǎng)的認(rèn)可和反饋。這一作用的前提是公允的性能評(píng)價(jià)。通過(guò)消費(fèi)者試錯(cuò)和反饋來(lái)形成評(píng)價(jià),社會(huì)成本和時(shí)間成本都較為高昂。而有關(guān)學(xué)術(shù)機(jī)構(gòu)、政府機(jī)構(gòu)組織的技術(shù)評(píng)測(cè)則可以在應(yīng)用投放市場(chǎng)之前對(duì)其進(jìn)行科學(xué)而全面的技術(shù)性評(píng)價(jià)。技術(shù)評(píng)測(cè)已經(jīng)成為推動(dòng)智能技術(shù)和產(chǎn)品進(jìn)步的重要手段(黃昌寧,趙海2007)。
語(yǔ)言智能20余年以來(lái)的發(fā)展,與技術(shù)評(píng)測(cè)活動(dòng)的開展息息相關(guān)。從基礎(chǔ)技術(shù)如分詞、詞類標(biāo)注、文本分類,到上層應(yīng)用如用戶畫像、自動(dòng)問答、情感分析等,國(guó)內(nèi)外機(jī)構(gòu)組織的技術(shù)評(píng)測(cè)在推動(dòng)技術(shù)發(fā)展的過(guò)程中都起到了重要的作用。在2013~2014年國(guó)家語(yǔ)委開展的大規(guī)模規(guī)范標(biāo)準(zhǔn)調(diào)研活動(dòng)中,信息處理組別的專家?guī)缀醵贾赋觯夹g(shù)評(píng)測(cè)是刺激技術(shù)研發(fā)、推動(dòng)行業(yè)發(fā)展的力量之一,并呼吁有關(guān)部門對(duì)技術(shù)評(píng)測(cè)進(jìn)行良好的頂層規(guī)劃和任務(wù)設(shè)計(jì)。
語(yǔ)言智能領(lǐng)域的技術(shù)評(píng)測(cè)通常通過(guò)發(fā)布公開統(tǒng)一的數(shù)據(jù)集,征集各研究團(tuán)隊(duì)的技術(shù)框架、模型和實(shí)驗(yàn)系統(tǒng)。組織方在相同的測(cè)試條件下對(duì)各團(tuán)隊(duì)方案進(jìn)行比較,從而高效率地找出適合任務(wù)的技術(shù)方案,最大限度避免重復(fù)“造車輪”。組織方還通過(guò)召開評(píng)測(cè)會(huì)議、工作坊等形式,將一個(gè)時(shí)間段內(nèi)的成果加以匯聚。表現(xiàn)優(yōu)秀的技術(shù)方案則以技術(shù)報(bào)告、論文等形式向公眾和科研管理層進(jìn)行宣介。從數(shù)據(jù)加工,到任務(wù)發(fā)布,再到成果匯聚,技術(shù)評(píng)測(cè)活動(dòng)周而復(fù)始地推動(dòng)技術(shù)迭代。評(píng)測(cè)活動(dòng)較之無(wú)結(jié)構(gòu)的學(xué)術(shù)爭(zhēng)鳴,能更有效地促進(jìn)本領(lǐng)域?qū)W術(shù)、技術(shù)的進(jìn)步。
因此,技術(shù)評(píng)測(cè)本身的規(guī)劃和組織也具有重要的研究?jī)r(jià)值。考察國(guó)內(nèi)外重要的科研、學(xué)術(shù)機(jī)構(gòu),不難發(fā)現(xiàn),優(yōu)秀的評(píng)測(cè)任務(wù)規(guī)劃和設(shè)計(jì)能較好地滿足行業(yè)與學(xué)術(shù)發(fā)展的需求,將科學(xué)問題和實(shí)際應(yīng)用相互結(jié)合。在組織上,傳統(tǒng)的形式是學(xué)術(shù)會(huì)議嵌套評(píng)測(cè)論壇,而如今發(fā)展到刷榜式評(píng)測(cè)(如圖2 所示,中文語(yǔ)言理解評(píng)測(cè)基準(zhǔn)榜單),影響力和更新速率都持續(xù)增長(zhǎng)。2021年年底,中國(guó)還發(fā)布了“智源指數(shù)”作為綜合性的中文語(yǔ)言智能能力評(píng)測(cè)基準(zhǔn)。
技術(shù)評(píng)測(cè)活動(dòng)同時(shí)也成為溝通公眾和學(xué)界的重要橋梁,大量科研成果通過(guò)評(píng)測(cè)活動(dòng)匯聚呈現(xiàn)給公眾和管理者。例如在機(jī)器翻譯的評(píng)測(cè)中,機(jī)器翻譯工作坊(Workshop on Machine" Translation,WMT)是全球?qū)W術(shù)界公認(rèn)的規(guī)模最大的國(guó)際頂級(jí)機(jī)器翻譯評(píng)測(cè)比賽之一,自2006 年以來(lái)已連續(xù)舉辦18屆,為評(píng)估機(jī)器翻譯的最新發(fā)展水平、傳播數(shù)據(jù)集、改進(jìn)機(jī)器翻譯評(píng)測(cè)方法做出了重要貢獻(xiàn)。在語(yǔ)言分析領(lǐng)域,計(jì)算自然語(yǔ)言學(xué)習(xí)會(huì)議(Conference on Computational Natural Language Learning,CoNLL)系列評(píng)測(cè)是影響力最大的基礎(chǔ)語(yǔ)言能力評(píng)測(cè)。從1999 年開始,該會(huì)議陸續(xù)開展了大量細(xì)致的結(jié)構(gòu)分析、語(yǔ)義分析等評(píng)測(cè)任務(wù),有力推動(dòng)了自然語(yǔ)言處理各項(xiàng)任務(wù)的發(fā)展。
對(duì)于大語(yǔ)模,學(xué)術(shù)界延續(xù)預(yù)訓(xùn)練模型研究的基準(zhǔn)測(cè)試傳統(tǒng),許多學(xué)者嘗試為大語(yǔ)模評(píng)測(cè)提供“標(biāo)準(zhǔn)”測(cè)試集, 如SuperNI(Wang,Kordi et al. 2022)、Instruct-252 數(shù)據(jù)集(Wang,Mishra et al.2022)、AGIEval(Zhong et al. 2023)等。一些研究也針對(duì)中文設(shè)計(jì)了專門的基準(zhǔn)數(shù)據(jù)集,比如Huang etal.(2023)提出了第一個(gè)綜合性的中文基礎(chǔ)模型評(píng)測(cè)套件C-EVAL,Zhang et al.(2023)提出了以中國(guó)高考題目為數(shù)據(jù)集的GAOKAO-bench。大語(yǔ)模評(píng)測(cè)基準(zhǔn)和方法已進(jìn)入快速發(fā)展的軌道。
從評(píng)測(cè)舉辦主體上看,以美國(guó)國(guó)防部遠(yuǎn)景開發(fā)局(DARPA)、美國(guó)國(guó)家標(biāo)準(zhǔn)院(NIST)和歐洲語(yǔ)言資源協(xié)會(huì)(ELRA)等為代表的評(píng)測(cè)規(guī)劃與組織單位國(guó)際影響力很大。它們以評(píng)測(cè)活動(dòng)為渠道,推動(dòng)了數(shù)據(jù)、技術(shù)、人才的匯聚,提高了科研資金的利用效率,促進(jìn)了學(xué)術(shù)、技術(shù)發(fā)展(Harman 1992 ;Pallett 2003 ;Arranz amp; Choukri 2010)。而中國(guó)的技術(shù)評(píng)測(cè),在權(quán)威性、影響力、規(guī)劃和設(shè)計(jì)科學(xué)程度上尚有提升空間。
(二)“數(shù)據(jù)?技術(shù)?評(píng)測(cè)”閉環(huán)
需要注意到的是,技術(shù)評(píng)測(cè)本身也依賴數(shù)據(jù)資源的建設(shè)來(lái)開展。在技術(shù)評(píng)測(cè)的實(shí)踐中,很多參賽單位也以獲取數(shù)據(jù)集為參賽目標(biāo)之一。優(yōu)質(zhì)數(shù)據(jù)推動(dòng)技術(shù)研發(fā)的進(jìn)步,同時(shí)也提供了良好的測(cè)試集供技術(shù)評(píng)測(cè)使用;技術(shù)評(píng)測(cè)反過(guò)來(lái)也可以推動(dòng)技術(shù)研發(fā)的進(jìn)步;而更加先進(jìn)的技術(shù)對(duì)數(shù)據(jù)資源建設(shè)和評(píng)測(cè)開展都提供了工具和動(dòng)力。因而“數(shù)據(jù)資源建設(shè)”“技術(shù)研發(fā)”和“技術(shù)評(píng)測(cè)”三者構(gòu)成了互相促進(jìn)的閉環(huán)(如圖3)。其中關(guān)鍵在于“數(shù)據(jù)資源建設(shè)”和“技術(shù)評(píng)測(cè)”這兩端,執(zhí)此兩端則可以有效地對(duì)技術(shù)研發(fā)全鏈條進(jìn)行治理。
(一)能力問題
語(yǔ)言智能的安全治理首先是能力問題,這是因?yàn)楫?dāng)前許多智能應(yīng)用中的危險(xiǎn)和隱患,根本上還是由于語(yǔ)言智能能力落后于場(chǎng)景需求和安全需求。針對(duì)能力問題,應(yīng)在“數(shù)據(jù)?技術(shù)?評(píng)測(cè)”閉環(huán)的框架下注重加強(qiáng)語(yǔ)言資源建設(shè)和科學(xué)規(guī)劃技術(shù)評(píng)測(cè)。
1. 加強(qiáng)語(yǔ)言資源建設(shè)
在能力方面,不論是基礎(chǔ)能力還是領(lǐng)域能力,當(dāng)前瓶頸都在于數(shù)據(jù)資源建設(shè)。大力開展語(yǔ)言資源建設(shè)是語(yǔ)言智能治理的重要推手,不僅要做大,還應(yīng)做深、做細(xì)。
做大,即進(jìn)一步提高語(yǔ)言資源的規(guī)模,以充分發(fā)揮大規(guī)模預(yù)訓(xùn)練模型等前沿技術(shù)路線的知識(shí)獲取能力。做深,即應(yīng)深入探索適應(yīng)中國(guó)語(yǔ)言特點(diǎn)和當(dāng)代語(yǔ)用特色的標(biāo)注體系、表示方法。做細(xì),即應(yīng)在滿足基本通用需求的情況下強(qiáng)調(diào)場(chǎng)景落地,強(qiáng)調(diào)垂直性,建設(shè)一批服務(wù)關(guān)鍵領(lǐng)域和業(yè)務(wù)痛點(diǎn)的數(shù)據(jù)資源。
尤其對(duì)于做細(xì)這一點(diǎn),需要注意到語(yǔ)言智能所面臨的根本難題在于語(yǔ)言行為的開放性和復(fù)雜性,而受限領(lǐng)域的受限反饋可以大幅縮小人工智能與人類智能的表現(xiàn)差距。在可預(yù)見的未來(lái),弱人工智能通過(guò)系統(tǒng)工程的方式高效組合,可以極大提升現(xiàn)有生產(chǎn)力水平和人民生活的便利程度。弱人工智能所要求的語(yǔ)言智能技術(shù)必定是高度專門化、垂直化、領(lǐng)域化的,唯其如此,才能在較為窄小的應(yīng)用面上,盡可能窮盡解決方案,實(shí)現(xiàn)高質(zhì)量智能服務(wù)。
2. 科學(xué)規(guī)劃技術(shù)評(píng)測(cè)
技術(shù)評(píng)測(cè)是檢驗(yàn)智能技術(shù)研發(fā)和落地的重要手段,也是重要推動(dòng)力。技術(shù)評(píng)測(cè)的規(guī)劃與頂層設(shè)計(jì),應(yīng)首先根據(jù)國(guó)家、社會(huì)的重大需求和長(zhǎng)遠(yuǎn)發(fā)展目標(biāo)規(guī)劃技術(shù)發(fā)展的關(guān)鍵目標(biāo)。技術(shù)評(píng)測(cè)規(guī)劃應(yīng)本著目標(biāo)務(wù)實(shí)、有限前瞻、多階發(fā)展的原則進(jìn)行。技術(shù)評(píng)測(cè)的目標(biāo)是推動(dòng)不成熟技術(shù)快速發(fā)展,需要保持一定的前瞻性,但其本身也應(yīng)當(dāng)務(wù)實(shí),與相當(dāng)長(zhǎng)一段時(shí)間的技術(shù)發(fā)展?fàn)顩r相協(xié)調(diào)。如“使用文本自動(dòng)生成技術(shù)挑戰(zhàn)滿分作文”這一任務(wù),即便不考量評(píng)測(cè)組織的成本和效益,其本身也部分觸及圖靈測(cè)試的實(shí)質(zhì)內(nèi)容,并不務(wù)實(shí)。這將促使參與方不再專注于探索科學(xué)問題,反而聚焦在提升評(píng)測(cè)表現(xiàn)的工程手段上,背離了推動(dòng)技術(shù)進(jìn)步的初衷。而如“作文語(yǔ)法錯(cuò)誤檢測(cè)”“閱讀理解并回答問題”這樣的任務(wù),或具有強(qiáng)實(shí)用性或挑戰(zhàn)語(yǔ)言智能核心科學(xué)問題,都有較好的評(píng)測(cè)目標(biāo),并取得過(guò)良好的實(shí)踐效果(Rao et al. 2020 ;Rajpurkar et al. 2016)。
在前瞻性上,為推動(dòng)實(shí)驗(yàn)室技術(shù)發(fā)展成熟走向市場(chǎng),技術(shù)評(píng)測(cè)目標(biāo)需要對(duì)當(dāng)前技術(shù)水平構(gòu)成可達(dá)到的挑戰(zhàn)。這種挑戰(zhàn)應(yīng)來(lái)源于技術(shù)本身的落差而非工程落差。如“低資源自然語(yǔ)言處理”相關(guān)評(píng)測(cè)任務(wù),可供系統(tǒng)使用的數(shù)據(jù)資源天然受限,短時(shí)間內(nèi)很難快速增長(zhǎng)。要提高系統(tǒng)表現(xiàn),必須從算法、模型和知識(shí)角度進(jìn)行努力。而這是推進(jìn)這一任務(wù)技術(shù)發(fā)展的重要著力點(diǎn)。
(二)倫理安全問題
語(yǔ)言智能面對(duì)的倫理安全問題主要集中于語(yǔ)言資源、應(yīng)用和社會(huì)文化3 個(gè)部分,因而其治理也應(yīng)從這3個(gè)方面入手。
1. 語(yǔ)言資源中的倫理安全問題
語(yǔ)言資源在語(yǔ)言智能發(fā)展中主要作為數(shù)據(jù)支撐來(lái)發(fā)揮作用。當(dāng)下的數(shù)據(jù)倫理安全問題,主要集中于數(shù)據(jù)隱私、數(shù)據(jù)破壞和數(shù)據(jù)偏見3 個(gè)方面。
數(shù)據(jù)隱私是智能應(yīng)用中最重要的倫理安全問題之一。2021 年9 月和11 月正式實(shí)施的《中華人民共和國(guó)數(shù)據(jù)安全法》和《中華人民共和國(guó)個(gè)人信息保護(hù)法》都將數(shù)據(jù)隱私問題提高到了法律治理的層面。語(yǔ)言數(shù)據(jù)是個(gè)人隱私、商業(yè)秘密、國(guó)家秘密等的重要載體。面向不同應(yīng)用目標(biāo)進(jìn)行不同層次的語(yǔ)言數(shù)據(jù)脫敏,對(duì)敏感信息進(jìn)行語(yǔ)言層面的審查是語(yǔ)言資源構(gòu)建過(guò)程中不可忽視的一環(huán)。
數(shù)據(jù)破壞包含數(shù)據(jù)篡改,惡意數(shù)據(jù)注入等。如在智能系統(tǒng)的訓(xùn)練數(shù)據(jù)中注入帶有強(qiáng)烈情感信號(hào)、歧視色彩的語(yǔ)料,篡改原有語(yǔ)料提供錯(cuò)誤統(tǒng)計(jì)分布信息,從而達(dá)到破壞智能系統(tǒng)的目標(biāo)。這種情況也被稱作數(shù)據(jù)投毒(魏薇,等2020)。對(duì)模型或算法進(jìn)行修改,容易被發(fā)現(xiàn),有時(shí)也難以控制結(jié)果;但篡改訓(xùn)練數(shù)據(jù)十分隱蔽,模型一經(jīng)訓(xùn)練完成,其參數(shù)就已固定并且缺乏可解釋性,難以溯源。這些技術(shù)現(xiàn)狀都給數(shù)據(jù)投毒留下了可乘之機(jī)。
排除有意為之的破壞行為,自然語(yǔ)言本身也包含歧義、偏見乃至破壞性信息。在使用中這些“不中立”“不真實(shí)”的情況被稱作數(shù)據(jù)偏見(陳晉音,等2021)。這些情況來(lái)自語(yǔ)言社團(tuán)長(zhǎng)期的文化傳統(tǒng),從而遺存在自然語(yǔ)言之中;也有的是受到系統(tǒng)選擇、語(yǔ)料加工的限制,從而強(qiáng)化了已存在的偏見。以性別偏見或性別刻板印象為例(Su et al. 2021),自然語(yǔ)言生成任務(wù)里,涉及“護(hù)士”時(shí),系統(tǒng)搭配的代詞都是“她”,而涉及“司機(jī)”時(shí),代詞都是“他”。又如自然語(yǔ)言分析任務(wù)中,過(guò)多依賴正式書面語(yǔ)語(yǔ)料,從而導(dǎo)致很多語(yǔ)言生活中的常用現(xiàn)象無(wú)法被分析、識(shí)別和記錄。
2. 應(yīng)用中的倫理安全問題
這部分主要涉及智能應(yīng)用和人類智能、人類語(yǔ)言生活的邊界問題。相較于通過(guò)自然語(yǔ)言進(jìn)行信息傳輸,語(yǔ)言智能展現(xiàn)出了前所未有的高速度、低成本特性。然而今天的語(yǔ)言智能還遠(yuǎn)無(wú)法完全規(guī)范合理地使用,因而在其使用領(lǐng)域、程度上進(jìn)行規(guī)約就十分必要。
近年來(lái),具體的語(yǔ)言智能失范現(xiàn)象表現(xiàn)為語(yǔ)言失信、語(yǔ)言不規(guī)范、語(yǔ)言暴力、語(yǔ)言偏見、傳播虛假信息等。盡管這些現(xiàn)象在人類語(yǔ)言生活中早已有之,但語(yǔ)言智能帶來(lái)的高效生產(chǎn)和傳播,放大了人類語(yǔ)言生活中的許多惡疾,并有可能引發(fā)社會(huì)生態(tài)的變化。濫用語(yǔ)言智能技術(shù)將帶來(lái)明顯的倫理焦慮和安全問題,機(jī)器翻譯和智能寫作便是較為明顯的兩例。
機(jī)器翻譯在進(jìn)入深度學(xué)習(xí)時(shí)代以后,性能提升十分迅速,在特定場(chǎng)景和領(lǐng)域中獲得較多應(yīng)用。但隨之而來(lái)的,卻是諸多機(jī)器翻譯研發(fā)企業(yè)過(guò)分夸大機(jī)器翻譯效果,在輿論中對(duì)人工外語(yǔ)服務(wù)形成沖擊(韓林濤2019;饒高琦2018)。如果放任這種不實(shí)宣傳,誤導(dǎo)公眾認(rèn)知,將嚴(yán)重影響國(guó)家的科技規(guī)劃和教育規(guī)劃,進(jìn)而有損公眾利益。而外語(yǔ)學(xué)科、翻譯行業(yè)受到?jīng)_擊,將直接影響應(yīng)用市場(chǎng)和數(shù)據(jù)生產(chǎn),進(jìn)而使語(yǔ)言智能行業(yè)自己也成為受害者。
相類似的,近年來(lái)智能寫作技術(shù)隨著性能提高,開始在多個(gè)領(lǐng)域得到大量應(yīng)用。內(nèi)容資訊、金融財(cái)經(jīng)、數(shù)字營(yíng)銷和行政辦公成了對(duì)智能寫作需求最強(qiáng)、黏性最高的4個(gè)市場(chǎng)。智能寫作機(jī)器人已經(jīng)從新聞、應(yīng)用文,走向廣告文案和創(chuàng)意寫作等任務(wù)。然而,技術(shù)若不加限制地應(yīng)用,在各應(yīng)用領(lǐng)域都將產(chǎn)生侵權(quán)問題及倫理焦慮(饒高琦2019)。對(duì)個(gè)人而言,它可能會(huì)導(dǎo)致信息過(guò)載,干擾個(gè)人生活;對(duì)社會(huì)而言,伴隨技術(shù)應(yīng)用而來(lái)的浮夸宣傳,將給教育者和學(xué)習(xí)者造成恐慌,誤導(dǎo)產(chǎn)業(yè)規(guī)劃和教育決策。更嚴(yán)重的問題是,智能寫作的泛濫會(huì)擾亂社會(huì)秩序,惡化語(yǔ)言生態(tài)。
3. 社會(huì)文化中的倫理問題
語(yǔ)言智能深度融合嵌入現(xiàn)實(shí)生活,勢(shì)必對(duì)社會(huì)文化產(chǎn)生重要的影響。全社會(huì)秉持什么樣的“智能觀”,對(duì)語(yǔ)言智能的發(fā)展影響極大。智能觀的核心是人與智能技術(shù)的關(guān)系:技術(shù)及其產(chǎn)品是與人競(jìng)爭(zhēng)乃至取而代之,還是成為人的擴(kuò)展,抑或與人共生共存。當(dāng)前,弱人工智能在高度局限的可形式化任務(wù)上可以媲美甚至超越人類。正如現(xiàn)代交通業(yè)擴(kuò)展了人類的移動(dòng)能力,弱人工智能可以成為人的部分智能的擴(kuò)展,但無(wú)法全面替代人類的感官和行為能力。
語(yǔ)言智能亦不例外。例如,智能寫作可以替代部分重復(fù)性的文牘工作,機(jī)器翻譯大幅提高翻譯效率等。但讓一個(gè)智能體完全替代人的完整語(yǔ)言能力,在可預(yù)見未來(lái)是不會(huì)成為現(xiàn)實(shí)的。語(yǔ)言智能技術(shù)的發(fā)展和實(shí)踐,不應(yīng)也不可能謀求全面替代人類的語(yǔ)言能力。應(yīng)當(dāng)倡導(dǎo)人機(jī)共存、人機(jī)互育的智能觀,令語(yǔ)言智能真正成為人類語(yǔ)言能力的擴(kuò)展、語(yǔ)言生活的幫手,而非對(duì)人類語(yǔ)言能力進(jìn)行替代,甚至威脅相關(guān)行業(yè)。
六、政策建議
基于前文分析,語(yǔ)言智能的治理應(yīng)集中于提升能力和提升安全性兩個(gè)方面。本文對(duì)此提出以下政策建議。
(一)強(qiáng)化“數(shù)據(jù)?技術(shù)?評(píng)測(cè)”閉環(huán)
語(yǔ)言智能能力提升應(yīng)以數(shù)據(jù)為基礎(chǔ),以評(píng)測(cè)為牽引。
首先,數(shù)據(jù)方面,應(yīng)在基礎(chǔ)研究和行業(yè)培養(yǎng)兩方面進(jìn)行激勵(lì)。在基礎(chǔ)研究方面,建立語(yǔ)言資源研究和建設(shè)激勵(lì)機(jī)制,鼓勵(lì)生產(chǎn)和開源獨(dú)創(chuàng)性的語(yǔ)言資源、資源建設(shè)規(guī)范和方法。改變“標(biāo)數(shù)據(jù)”是低級(jí)勞動(dòng)的觀念,探索和發(fā)展語(yǔ)言資源建設(shè)中的科學(xué)問題。發(fā)展語(yǔ)言資源學(xué),研究總結(jié)語(yǔ)言資源建設(shè)的方法,研發(fā)相關(guān)工具。
在行業(yè)培養(yǎng)方面,建議建設(shè)國(guó)家、行業(yè)數(shù)據(jù)資源基礎(chǔ)設(shè)施,對(duì)語(yǔ)言國(guó)情數(shù)據(jù)、大語(yǔ)種通用語(yǔ)料庫(kù)等進(jìn)行開源,并發(fā)布通用使用工具和接口。鼓勵(lì)基于數(shù)據(jù)基礎(chǔ)設(shè)施的數(shù)據(jù)創(chuàng)新、產(chǎn)品創(chuàng)新和商業(yè)轉(zhuǎn)化。
組建語(yǔ)言資源管理標(biāo)準(zhǔn)化組織,提高行業(yè)標(biāo)準(zhǔn)化服務(wù)水平。以標(biāo)準(zhǔn)落實(shí)法律法規(guī)對(duì)語(yǔ)言資源倫理安全上的要求,以標(biāo)準(zhǔn)化提升行業(yè)生產(chǎn)效率,規(guī)范資源交換、增值方式。
其次,評(píng)測(cè)方面,技術(shù)評(píng)測(cè)應(yīng)在頂層設(shè)計(jì)和評(píng)測(cè)標(biāo)準(zhǔn)化方面多下功夫。頂層設(shè)計(jì)方面,應(yīng)建立技術(shù)評(píng)測(cè)科學(xué)規(guī)劃?rùn)C(jī)制,組建由國(guó)家語(yǔ)言文字管理部門協(xié)同國(guó)家數(shù)據(jù)局、標(biāo)準(zhǔn)化委員會(huì)、工信部和科技部組成的部級(jí)協(xié)調(diào)機(jī)制。技術(shù)評(píng)測(cè)規(guī)劃應(yīng)納入部門中長(zhǎng)期科技發(fā)展規(guī)劃,共同編制。評(píng)測(cè)目標(biāo)瞄準(zhǔn)中長(zhǎng)期科技發(fā)展規(guī)劃中服務(wù)國(guó)家重大智能化需求,對(duì)市場(chǎng)、行業(yè)有顯著推進(jìn)作用的項(xiàng)目進(jìn)行攻關(guān)和評(píng)測(cè)。對(duì)每一目標(biāo)進(jìn)行分階段、分領(lǐng)域不同目標(biāo)的評(píng)測(cè)。
評(píng)測(cè)標(biāo)準(zhǔn)化方面,應(yīng)加強(qiáng)評(píng)價(jià)語(yǔ)言資源和語(yǔ)言評(píng)測(cè)的規(guī)范標(biāo)準(zhǔn)研制。以規(guī)范標(biāo)準(zhǔn)的形式確定對(duì)評(píng)測(cè)活動(dòng)本身、測(cè)試用數(shù)據(jù)的評(píng)價(jià)原則、評(píng)價(jià)側(cè)面和評(píng)價(jià)方法。以標(biāo)準(zhǔn)化促進(jìn)評(píng)測(cè)活動(dòng)有序、科學(xué)發(fā)展,建立評(píng)測(cè)品牌,提高其對(duì)技術(shù)和數(shù)據(jù)研發(fā)的推動(dòng)作用。
(二)把好語(yǔ)言智能的安全和倫理關(guān)
1. 把好安全關(guān)
在安全方面,語(yǔ)言智能的治理應(yīng)著力于數(shù)據(jù)、評(píng)測(cè)和使用3個(gè)具體方面。
第一,數(shù)據(jù)安全。首先確保數(shù)據(jù)的隱私和保密性。以技術(shù)、法規(guī)雙重手段防止未經(jīng)授權(quán)的訪問和數(shù)據(jù)泄露。其次,確保數(shù)據(jù)的完整性和可信度。建立數(shù)據(jù)完整性驗(yàn)證機(jī)制,確保數(shù)據(jù)的來(lái)源和交換可信。再次,還應(yīng)高度關(guān)注數(shù)據(jù)的多樣性和公平性。避免系統(tǒng)對(duì)特定群體或地區(qū)的偏見和歧視。最后,需制定公平和透明的數(shù)據(jù)采集和使用原則。
第二,評(píng)測(cè)安全。除任務(wù)性能外,評(píng)測(cè)都應(yīng)包含安全和倫理指標(biāo)。評(píng)測(cè)過(guò)程應(yīng)在評(píng)測(cè)數(shù)據(jù)的選擇、評(píng)估指標(biāo)的定義和評(píng)測(cè)結(jié)果的解釋等方面提出安全要求。
第三,使用安全。要積極推動(dòng)語(yǔ)言智能系統(tǒng)的服務(wù)能力提升。當(dāng)前許多使用層面的安全問題,還是由于能力不足造成的。另外,語(yǔ)言智能系統(tǒng)應(yīng)確保合規(guī)和向善使用。開發(fā)者應(yīng)該提供明確警示,告知用戶系統(tǒng)的能力和限制。同時(shí),使用者也應(yīng)該對(duì)系統(tǒng)的使用負(fù)責(zé),避免利用其進(jìn)行違法活動(dòng)。
2. 把好倫理關(guān)
在倫理方面,語(yǔ)言智能治理應(yīng)集中于理念、組織、實(shí)施、學(xué)科和社會(huì)文化等方面。
在理念上,應(yīng)高度重視,將語(yǔ)言智能的多方面?zhèn)惱韱栴}納入倫理學(xué)、語(yǔ)言學(xué)總體加以考量。在組織上,建議有關(guān)界別共同組建語(yǔ)言智能倫理專門機(jī)構(gòu),并在各層次的科學(xué)倫理委員會(huì)中增加語(yǔ)言安全、語(yǔ)言倫理相關(guān)審查內(nèi)容。在實(shí)施上,應(yīng)對(duì)語(yǔ)言資源建設(shè)中的數(shù)據(jù)投毒、數(shù)據(jù)偏見等問題進(jìn)行審查。完善語(yǔ)言倫理審批機(jī)制,將倫理安全審查納入質(zhì)量監(jiān)督體系。在學(xué)科上,將語(yǔ)言智能的倫理安全課程納入相關(guān)專業(yè)學(xué)位課程體系。傳統(tǒng)語(yǔ)言相關(guān)專業(yè)應(yīng)與時(shí)俱進(jìn),將語(yǔ)言智能的挑戰(zhàn)作為轉(zhuǎn)型發(fā)展的契機(jī),力圖形成人機(jī)互育,共同進(jìn)步的局面。在社會(huì)文化上,應(yīng)將智能產(chǎn)品宣傳納入相關(guān)法規(guī)的約束范圍,禁絕夸大、恐嚇、誤導(dǎo)性的宣傳。智能產(chǎn)品的研發(fā)和宣傳都應(yīng)以求真和向善為出發(fā)點(diǎn),以人為本,以提升公眾福祉為目標(biāo),尊重社會(huì)倫理和科技倫理,擔(dān)當(dāng)起社會(huì)責(zé)任。積極引導(dǎo)和建立共生互利的智能觀,并營(yíng)造健康積極的智能技術(shù)和智能生活文化。