AI也有偏見(jiàn)？

2021-01-25 09:33:46聶龍

大科技·百科新說(shuō) 2021年11期

關(guān)鍵詞：檢測(cè)

聶龍

AI檢測(cè)一定公平嗎？絕大多數(shù)人對(duì)這個(gè)問(wèn)題的答案很可能是肯定。在2018年，美國(guó)社交媒體Facebook開(kāi)發(fā)了新的代號(hào)為Rosetta的AI系統(tǒng)，用以檢測(cè)自己社交平臺(tái)上的仇恨性言論。然而，兩年之后，美國(guó)南加州大學(xué)的研究人員發(fā)現(xiàn)，包括Facebook在內(nèi)的所有AI語(yǔ)言檢測(cè)系統(tǒng)實(shí)際上也帶有偏見(jiàn)，黑人、同性戀和變性人所發(fā)的信息更容易被這些AI標(biāo)記為“具有仇恨的”。例如，黑人的推特（美國(guó)另一個(gè)社交媒體，類似中國(guó)的微博）被AI標(biāo)記為“帶有種族歧視”的可能性是其他族裔的1.5倍，這個(gè)數(shù)值在其他研究當(dāng)中甚至高達(dá)2.2倍。

AI并沒(méi)有我們想象中那樣的公平，這是怎么一回事？

“學(xué)壞”的AI

為什么AI也帶有偏見(jiàn)？這是因?yàn)锳I“學(xué)壞”了。AI是在某一種機(jī)器學(xué)習(xí)模型的基礎(chǔ)上發(fā)展起來(lái)的，而所有的機(jī)器學(xué)習(xí)模型都需要大量的數(shù)據(jù)來(lái)進(jìn)行訓(xùn)練和充實(shí)自己的數(shù)據(jù)庫(kù)。如果把AI比作高樓，那么機(jī)器學(xué)習(xí)模型就是這座AI高樓的設(shè)計(jì)圖紙，而那些數(shù)據(jù)就是建造這座AI高樓的磚瓦。

然而，機(jī)器學(xué)習(xí)模型所使用的數(shù)據(jù)來(lái)自于現(xiàn)實(shí)生活中的各大社交平臺(tái)，這些社交平臺(tái)當(dāng)中的信息又都充滿了偏見(jiàn)，有的社交平臺(tái)甚至專為種族歧視者服務(wù)。因此，基于“偏見(jiàn)”磚瓦所壘砌的AI高樓，帶有偏見(jiàn)也就不足為奇了。

另外，這些AI采用的還是“關(guān)鍵字”的檢測(cè)方式，完全忽略了上下文和語(yǔ)境。就拿“nigger”這個(gè)英文單詞來(lái)說(shuō)，它的中文意思是“黑鬼”，是一個(gè)極具種族歧視色彩的單詞，也是AI所檢測(cè)的重點(diǎn)單詞之一。但是，如果情況是黑人自己說(shuō)了nigger這個(gè)詞（無(wú)論對(duì)象是誰(shuí)），那么這個(gè)詞的意思卻是“好兄弟”、“好朋友”或“死鬼”（死鬼：在黑人婦女稱呼自己黑人丈夫的語(yǔ)境下），等等。在日常口語(yǔ)中，黑人也多以nigger來(lái)稱呼自己親密的朋友和兄弟。

但AI可管不了這么多。只要信息中出現(xiàn)ni gger，或其他類似的詞或語(yǔ)句，這信息就會(huì)被AI標(biāo)記，然后被關(guān)“小黑屋”，同時(shí)，AI還會(huì)記錄發(fā)送該信息的用戶的“罪行”。于是乎，在文章的開(kāi)頭提到的，黑人的推特更容易被標(biāo)記為“具有種族歧視”的現(xiàn)象就產(chǎn)生了。

聯(lián)系上下文的AI更公平

那么，科學(xué)家該如何改進(jìn)AI，使它對(duì)仇恨性言論的檢測(cè)更加公平？首先在我們腦海顯現(xiàn)的方法很可能是解決“磚瓦”上的問(wèn)題。既然AI帶有偏見(jiàn)的原因之一，是由于其訓(xùn)練和使用的數(shù)據(jù)帶有偏見(jiàn)，那么給AI提供客觀公平的數(shù)據(jù)不就好了？但是，取自現(xiàn)實(shí)生活的數(shù)據(jù)或多或少都帶有偏見(jiàn)，如果人工制造絕對(duì)客觀公平的數(shù)據(jù)，那么這個(gè)工作量可是非常巨大的，甚至大到無(wú)法實(shí)現(xiàn)。

南加州大學(xué)的研究人員對(duì)原來(lái)的AI算法進(jìn)行了編程，使它識(shí)別關(guān)鍵字或關(guān)鍵詞的同時(shí)，能夠聯(lián)系上下文，并判斷上下文有沒(méi)有侮辱性的語(yǔ)言，也就是說(shuō)，跟原來(lái)的AI相比，經(jīng)過(guò)編程后的AI只多考慮了兩個(gè)“情況”。

改進(jìn)后的AI效果如何？跟其它最新開(kāi)發(fā)的AI相比，即使南加州大學(xué)的研究人員改進(jìn)后的AI練習(xí)所使用的數(shù)據(jù)全都來(lái)自臭名昭著的仇恨網(wǎng)站，但它檢測(cè)仇恨性言論的準(zhǔn)確率依然更高，高達(dá)90%，而其它最新AI只有77%。只是多考慮兩個(gè)附加因素的南加州大學(xué)AI為什么會(huì)有如此大的提升？

其背后的道理不難理解。同樣且簡(jiǎn)單的一句話“Thank you， myni gger. ”（中文意思：“多謝了，我的好兄弟。”），如果跟南加州大學(xué)AI那樣考慮上下文的話，那么我們很容易就能理解這句話的意思是感謝。但是，如果我們跟傳統(tǒng)的AI那樣，忽略了上下文，只看關(guān)鍵詞“nigger”的話，那么我們就會(huì)認(rèn)為說(shuō)者在發(fā)表種族歧視的言論。