噓，機(jī)器已經(jīng)能讀懂你的言外之意

2014-04-29 00:00:00秦筱

iRead壹讀 2014年15期

想知道德國(guó)和阿根廷哪支球隊(duì)的中國(guó)球迷更多？來(lái)看看門(mén)戶(hù)網(wǎng)站的投票結(jié)果吧，十萬(wàn)人投票，參與的人可真不少。

但是，真正關(guān)心兩支球隊(duì)的球迷數(shù)量遠(yuǎn)超于此：巴西世界杯期間，僅僅在社交類(lèi)網(wǎng)站中，每天就有超過(guò)1.2億人在討論比賽、討論自己喜歡的球隊(duì)，新浪微博中的相關(guān)發(fā)言甚至超過(guò)十億次。十萬(wàn)樣本，只不過(guò)是千分之一而已。看到這里，你還相信投票結(jié)果嗎？

是時(shí)候放棄“來(lái)呀來(lái)呀，來(lái)投票嘛”的守株待兔方針，轉(zhuǎn)而“主動(dòng)出擊”了。

不靠投票，而是抓取球迷們的發(fā)言，通過(guò)自然語(yǔ)意分析來(lái)獲取他們內(nèi)心最真實(shí)的想法，這就是IBM大數(shù)據(jù)分析的做法。世界杯半決賽開(kāi)始前，IBM已經(jīng)用這種方法分析出了中國(guó)球迷對(duì)四強(qiáng)的支持率：德國(guó)第一、阿根廷第二、荷蘭第三、巴西第四，與最終的四強(qiáng)排名驚人地一致。

解讀球迷到底支持哪支球隊(duì)的關(guān)鍵，是讓機(jī)器“讀懂”人類(lèi)的語(yǔ)言，并從中分辨出“喜愛(ài)”、“厭惡”、“無(wú)感”甚至“反諷”等復(fù)雜的人類(lèi)情緒—尤其在網(wǎng)絡(luò)世界中，很少有人會(huì)直白示愛(ài)“我愛(ài)德國(guó)”，更多人會(huì)說(shuō)“壯哉我大德意志！”

機(jī)器“聰明過(guò)人”就等于“會(huì)思考”嗎

事實(shí)上，早在1950年就有人提出了這樣的問(wèn)題：計(jì)算機(jī)能像人類(lèi)一樣思考嗎？這個(gè)人叫阿蘭·圖靈，被后人尊稱(chēng)為“人工智能之父”。

之后的十年里，一系列堪稱(chēng)“神奇”的機(jī)器誕生了，它們中有些可以解決代數(shù)應(yīng)用題、有些能證明幾何定理、有些可以學(xué)習(xí)和使用英語(yǔ)……這些如今計(jì)算機(jī)必備的基本功能，讓當(dāng)時(shí)的人們嘆為觀止。

隨著技術(shù)的不斷發(fā)展，一些以“人工智能”為賣(mài)點(diǎn)的計(jì)算機(jī)成為媒體上的明星，其中最具知名度的無(wú)疑是“深藍(lán)”（Deep Blue）和“沃森”（Watson）。前者于1997年在國(guó)際象棋比賽中戰(zhàn)勝了世界冠軍卡斯帕羅夫，后者在2011年參加美國(guó)智力問(wèn)答節(jié)目《危險(xiǎn)邊緣》（類(lèi)似于央視《開(kāi)心辭典》），接連打敗最高獎(jiǎng)得主和74場(chǎng)連勝紀(jì)錄保持者，贏得了100萬(wàn)美元的獎(jiǎng)金。這兩個(gè)計(jì)算機(jī)系統(tǒng)都是由IBM開(kāi)發(fā)的。

深藍(lán)、沃森，這些戰(zhàn)勝不同領(lǐng)域里最優(yōu)秀的人類(lèi)的機(jī)器，被人們視為實(shí)現(xiàn)科幻故事的里程碑—但一個(gè)本質(zhì)問(wèn)題是，它們真的會(huì)“思考”嗎？

答案是否定的。“這些成就的取得并不是因?yàn)榉妒缴系母锩鼈內(nèi)匀皇枪こ碳夹g(shù)的復(fù)雜應(yīng)用，只不過(guò)現(xiàn)在的計(jì)算機(jī)性能已經(jīng)今非昔比了。”谷歌技術(shù)總監(jiān)雷·庫(kù)茲韋爾如此評(píng)論，他曾被比爾·蓋茨稱(chēng)為“我所知道的在預(yù)測(cè)人工智能領(lǐng)域最厲害的人”。

“深藍(lán)”的成功，完全憑借著蠻橫的計(jì)算能力。每走一步棋，它都能可以計(jì)算六個(gè)甚至更多回合之后的局勢(shì)。運(yùn)用預(yù)設(shè)的快速評(píng)估程序，它最多能在一秒鐘之內(nèi)計(jì)算3.3億個(gè)不同棋局的走勢(shì)，然后從中選擇能帶來(lái)最高分?jǐn)?shù)的方案。相比之下，世界冠軍卡斯帕羅夫每下一步棋前，最多只能評(píng)估幾十個(gè)。

而“沃森”就不一樣了，它背后的核心技術(shù)，是一種被稱(chēng)為“DeepQA”的算法。它能夠用1000多個(gè)自然語(yǔ)言處理、機(jī)器學(xué)習(xí)和推理的算法來(lái)產(chǎn)生和評(píng)價(jià)初始答案，然后再?gòu)臄?shù)據(jù)中搜索和收集相關(guān)的支持信息，以計(jì)算初始答案的確信度，并用確信度對(duì)初始答案進(jìn)行排序，最終給出一個(gè)最優(yōu)的答案。從表面上看起來(lái)，它就有了初級(jí)的“思考”能力。憑借這個(gè)能力，它才成為那次比賽的冠軍。

也就是說(shuō)，“尤金”的成功，某種程度上是利用了人類(lèi)的固有心理：我們總認(rèn)為自己是一種充滿(mǎn)了Bug的生物，就像蘇中說(shuō)的那樣，“機(jī)器是那么準(zhǔn)確，但人會(huì)犯錯(cuò)誤”。

機(jī)器破譯人類(lèi)情感的初級(jí)成功示范

三年之后，這次對(duì)社交媒體上普通人發(fā)言的大規(guī)模解讀，正是IBM突破“范式”的新嘗試。不同于模式化的棋局和問(wèn)答節(jié)目中的標(biāo)準(zhǔn)答案，人類(lèi)語(yǔ)言要復(fù)雜得多。

“就像美國(guó)人學(xué)中文，幾年以后或許可以進(jìn)行日常交流，但讓他看小品，他不見(jiàn)得能夠笑得出來(lái)。因?yàn)檎Z(yǔ)言后面有很多文化和知識(shí)的積累，這是更難的境界。”IBM中國(guó)研究院信息分析研究部研發(fā)總監(jiān)蘇中說(shuō)。

這已非擴(kuò)充數(shù)據(jù)庫(kù)和提高運(yùn)算的速度就能解決的—棋局庫(kù)和題庫(kù)再大，也是有容量邊界的，而語(yǔ)言和文化卻沒(méi)有。解決方案是讓機(jī)器自己掌握學(xué)習(xí)的技能：“我們會(huì)標(biāo)注一些樣本，比如‘梅西’是一個(gè)人名，‘球星’是一種身份，代表人名和身份的詞語(yǔ)出現(xiàn)在語(yǔ)言結(jié)構(gòu)中的特征是不一樣的，我們要從中找到一些內(nèi)在規(guī)律—其中可能包含著幾十種特征，然后構(gòu)建一個(gè)模型，讓機(jī)器來(lái)學(xué)習(xí)。”蘇中向壹讀記者介紹。

SoftLayer大型數(shù)據(jù)中心的運(yùn)力支持配合IBM強(qiáng)大的云計(jì)算能力，為這種不斷擴(kuò)展的學(xué)習(xí)能力提供了基礎(chǔ)。整套系統(tǒng)會(huì)在龐大而不斷動(dòng)態(tài)更新的社交數(shù)據(jù)流中抓取所有有用的信息，并且不斷進(jìn)行實(shí)時(shí)的分析。

解讀語(yǔ)言之后，更大的挑戰(zhàn)與野心是“讀懂”這些發(fā)言背后活生生的人。IBM的“大數(shù)據(jù)情感挖掘技術(shù)”可以告訴你，梅西的球迷低調(diào)、敏感、理性，以宅男宅女居多；C羅的球迷則不乏女王范兒、有氣場(chǎng)、愛(ài)熱鬧；即便是被貼上“咬人”標(biāo)簽的蘇亞雷斯也有自己的粉絲，他們做事沒(méi)什么條理，但是自我、有想象力、敢于競(jìng)爭(zhēng)。

感知人類(lèi)的情緒，甚至擁有人類(lèi)的情感，是機(jī)器“擬人”過(guò)程中最難的環(huán)節(jié)，被視為人工智能研究的終極命題之一。盡管目前機(jī)器所有的“思維”依然是靠程序驅(qū)動(dòng)的，但“大數(shù)據(jù)情感挖掘技術(shù)”畢竟為機(jī)器破譯人類(lèi)情感提供了一種初級(jí)的成功示范。

當(dāng)然，揣測(cè)人類(lèi)的心理已不僅僅是計(jì)算機(jī)科學(xué)的范疇，為了將一些心理學(xué)領(lǐng)域的特征用更好理解的方式呈現(xiàn)出來(lái)，IBM還特意請(qǐng)來(lái)了專(zhuān)業(yè)心理學(xué)家參與部分程序的設(shè)計(jì)。

“機(jī)器是那么準(zhǔn)確，但人會(huì)犯錯(cuò)誤”

在慶祝突破技術(shù)瓶頸的同時(shí)，一直伴隨著人工智能研究的爭(zhēng)議也在逼近現(xiàn)實(shí)：一旦機(jī)器有了人的思維和情感，它還是機(jī)器嗎？還是一個(gè)沒(méi)有肌肉和骨骼的人？這是一個(gè)科學(xué)問(wèn)題，更是一個(gè)哲學(xué)問(wèn)題。

不過(guò)，在蘇中看來(lái)，人工智能的發(fā)展遠(yuǎn)沒(méi)到需要擔(dān)心倫理問(wèn)題的時(shí)候。

即便一個(gè)被稱(chēng)為“尤金·古斯特曼”的聊天程序在今年6月通過(guò)了“圖靈測(cè)試”，人類(lèi)現(xiàn)有的技術(shù)距離人工智能的完美標(biāo)準(zhǔn)依然相差太多。

那并不是一次“公平”的測(cè)試。它冒充的是一個(gè)13歲的小男孩，盡管其開(kāi)發(fā)者、三位俄羅斯學(xué)者花了很多時(shí)間來(lái)使“他”具備可信的人格，但他們也承認(rèn)，“我們當(dāng)時(shí)的主要想法是，尤金可以吹噓自己懂得所有事情，但考慮到‘他’的年齡，有很多事情‘他’不知道也是很合理的。”況且，這個(gè)“男孩”被設(shè)定為一個(gè)烏克蘭人，英語(yǔ)并非“他”的母語(yǔ)。

也就是說(shuō)，“尤金”的成功，某種程度上是利用了人類(lèi)的固有心理：我們總認(rèn)為自己是一種充滿(mǎn)了Bug的生物，就像蘇中說(shuō)的那樣，“機(jī)器是那么準(zhǔn)確，但人會(huì)犯錯(cuò)誤”。

這些“擬人化”的聊天程序，比如許多科技公司開(kāi)發(fā)的聊天機(jī)器人，除了能讓我們感嘆“它們好像一個(gè)人呀”之外，并沒(méi)有太多實(shí)際意義。IBM更希望將“人工智能”技術(shù)應(yīng)用在商業(yè)領(lǐng)域，結(jié)合社交網(wǎng)絡(luò)中源源不斷的大數(shù)據(jù)，去分析人類(lèi)的情緒和行為，來(lái)為企業(yè)決策提供指導(dǎo)意見(jiàn)：比如飛往夏威夷的航線是否要在東京經(jīng)停，或者飛機(jī)上要不要開(kāi)通Wi-Fi。

換句話說(shuō)，聊天程序的目的只是取悅?cè)祟?lèi)，理解人類(lèi)才更有價(jià)值。

iRead壹讀2014年15期

iRead壹讀的其它文章: 我們同事真不是極品; 吃碗方便面，也是幸福的; 新知科技改變生活; 一個(gè)充滿(mǎn)傳感器的世界將會(huì)如何改變我們？; 跟蘇軾喝酒、燒墨、逗老和尚; 道士下山，怪力亂神