999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

靠這個“譜”讓機器會思考

2018-05-14 12:05:50張佳星
科學導報 2018年6期
關鍵詞:人類文本

張佳星

如果說波士頓動力的翻跟頭是在幫機器人鍛煉筋骨,那么知識圖譜的“繪制”則是在試圖“創造”一個能運轉的機器人大腦。

“目前,還不能做到讓機器理解人的語言。”中國科學院軟件所研究員、中國中文信息學會副理事長孫樂說。無論是能逗你一樂的Siri,還是會做詩的小冰,亦或是會“懸絲診脈”的沃森,它們并不真正明白自己在做什么、為什么這么做。

讓機器學會思考,要靠“譜”。這個“譜”被稱為知識圖譜,意在將人類世界中產生的知識,構建在機器世界中,進而形成能夠支撐類腦推理的知識庫。

為了在國內構建一個關于知識圖譜的全新產學合作模式,知識圖譜研討會日前召開,來自高校院所的研究人員與產業團隊共商打造全球化的知識圖譜體系,建立世界領先的人工智能基礎設施的開拓性工作。

技術原理:把文本轉化成知識

“對于‘姚明是上海人這樣一個句子,存儲在機器里只是一串字符。而這串字符在人腦中卻是‘活起來的。”孫樂舉例說。比如說到“姚明”,人會想到他是前美職籃球員、“小巨人”、中鋒等,而“上海”會讓人想到東方明珠、繁華都市等含義。但對于機器來說,僅僅說“姚明是上海人”,它不能和人類一樣明白其背后的含義。機器理解文本,首先就需要了解背景知識。

那如何將文本轉化成知識呢?

“借助信息抽取技術,人們可以從文本中抽取知識,這也正是知識圖譜構建的核心技術。”孫樂說,目前比較流行的是使用“三元組”的存儲方式。三元組由兩個點、一條邊構成,點代表實體或者概念,邊代表實體與概念之間的各種語義關系。一個點可以延伸出多個邊,構成很多關系。例如姚明這個點,可以和上海構成出生地的關系,可以和美職籃構成效力關系,還可以和2.26米構成身高關系。

“如果這些關系足夠完善,機器就具備了理解語言的基礎。”孫樂說。那么如何讓機器擁有這樣的“理解力”呢?

“上世紀六十年代,人工智能先驅麻省理工學院的馬文·明斯基在一個問答系統項目SIR中,使用了實體間語義關系來表示問句和答案的語義,劍橋語言研究部門的瑪格麗特·瑪斯特曼在1961年使用Semantic Network來建模世界知識,這些都可被看作是知識圖譜的前身。”孫樂說。

隨后的Wordnet、中國的知網(Hownet)也進行了人工構建知識庫的工作。

“這里包括主觀知識,比如社交網站上人們對某個產品的態度是喜歡還是不喜歡;場景知識,比如在某個特定場景中應該怎么做;語言知識,例如各種語言語法;常識知識,例如水、貓、狗,教人認的時候可以直接指著教,卻很難讓計算機明白。”孫樂解釋,從這些初步的分類中就能感受到知識的海量,更別說那些高層次的科學知識了。

構建方式:從手工勞動到自動抽取

“2010年之后,維基百科開始嘗試‘眾包的方式,每個人都能夠貢獻知識。”孫樂說,這讓知識圖譜的積累速度大大增加,后續百度百科、互動百科等也采取了類似的知識搜集方式,發動公眾使得“積沙”這個環節的時間大大縮短、效率大大增加,無數的知識從四面八方趕來,迅速集聚,只待“成塔”。

面對如此大量的數據,或者說“文本”,知識圖譜的構建工作自然不能再手工勞動,“讓機器自動抽取結構化的知識,自動生成‘三元組。”孫樂說,學術界和產業界開發出了不同的構架、體系,能夠自動或半自動地從文本中生成機器可識別的知識。

孫樂的演示課件中,有一張生動的圖畫,一大摞文件紙吃進去,電腦馬上轉化為“知識”,但事實遠沒有那么簡單。自動抽取結構化數據在不同行業還沒有統一的方案。在“百度知識圖譜”的介紹中這樣寫道:對提交至知識圖譜的數據轉換為遵循Schema的實體對象,并進行統一的數據清洗、對齊、融合、關聯等知識計算,完成圖譜的構建。“但是大家發現,基于維基百科,結構化半結構化數據挖掘出來的知識圖譜還是不夠,因此目前所有的工作都集中在研究如何從海量文本中抽取知識。”孫樂說,例如谷歌的Knowledge Vault,以及美國國家標準與技術研究院主辦的TAC-KBP評測,也都在推進從文本中抽取知識的技術。

在權威的“知識庫自動構建國際評測”中,從文本中抽取知識被分解為實體發現、關系抽取、事件抽取、情感抽取等4部分。在美國NIST組織的TAC-KBP中文評測中,中科院軟件所—搜狗聯合團隊獲得綜合性能指標第3名,事件抽取單項指標第1名的好成績。

“我國在這一領域可以和國際水平比肩。”孫樂介紹,中科院軟件所提出了基于Co-Bootstrapping的實體獲取算法,基于多源知識監督的關系抽取算法等,大幅度降低了文本知識抽取工具構建模型的成本,并提升了性能。

終極目標:將人類知識全部結構化

《圣經·舊約》記載,人類聯合起來興建希望能通往天堂的高塔——“巴別塔”,而今,創造AI的人類正在建造這樣一座“巴別塔”,幫助人工智能企及人類智能。

自動的做法讓知識量開始形成規模,達到了能夠支持實際應用的量級。“但是這種轉化,還遠遠未達到人類的知識水平。”孫樂說,何況人類的知識一直在增加、更新,一直在動態變化,理解也應該與時俱進地體現在機器“腦”中。

“因此知識圖譜不會是一個靜止的狀態,而是要形成一個循環,這也是美國卡耐基梅隆大學等地方提出來的Never Ending Learning(學無止境)的概念。”孫樂說。

資料顯示,目前谷歌知識圖譜中記載了超過35億事實;Freebase中記載了4000多萬實體,上萬個屬性關系,24億多個事實;百度百科記錄詞條數1000萬個,百度搜索中應用了聯想搜索功能。

“在醫學領域、人物關系等特定領域,也有專門的知識圖譜。”孫樂介紹,Kinships描述人物之間的親屬關系,104個實體,26種關系,10800個事實;UMLS在醫學領域描述了醫學概念之間的聯系,135個實體,49種關系,6800個事實。

“這是一幅充滿美好前景的宏偉藍圖。”孫樂說,知識圖譜的最終目標是將人類的知識全部形式化、結構化,并用于構建基于知識的自然語言理解系統。

盡管令業內滿意的“真正理解語言的系統”還遠未出現,目前的“巴別塔”還只是在基礎層面,但相關的應用已經顯示出廣闊的前景。例如,在百度百科輸入“冷凍電鏡”,右豎條的關聯將出現“施一公”,輸入“撒幣”,將直接在搜索項中出現“王思聰”等相關項。其中蘊含著機器對人類意圖的理解。

“知識圖譜的應用涉及到眾多行業,尤其是知識密集型行業,目前關注度比較高的領域:醫療、金融、法律、電商、智能家電等。”孫樂介紹,基于信息、知識和智能形成的閉環,從信息中獲取知識,基于知識開發智能應用,智能應用產生新的信息,從新的信息中再獲取新的知識,不斷迭代,就可以不斷產生更加豐富的知識圖譜,更加智能的應用。

猜你喜歡
人類文本
顫抖吧,人類
哈哈畫報(2022年4期)2022-04-19 11:11:50
人類能否一覺到未來?
人類會成長起來嗎?
英語文摘(2021年2期)2021-07-22 07:56:54
人類第一殺手
好孩子畫報(2020年5期)2020-06-27 14:08:05
初中群文閱讀的文本選擇及組織
甘肅教育(2020年8期)2020-06-11 06:10:02
在808DA上文本顯示的改善
1100億個人類的清明
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
論《柳毅傳》對前代文本的繼承與轉化
人間(2015年20期)2016-01-04 12:47:10
主站蜘蛛池模板: 91麻豆国产精品91久久久| 欧美不卡视频在线| 欧美成在线视频| 97视频在线精品国自产拍| 国产女人在线| 国内精品免费| 日韩小视频网站hq| 国产十八禁在线观看免费| 国产精品美女网站| 一级毛片高清| 国产激情无码一区二区免费| 青草视频久久| 最近最新中文字幕免费的一页| 色偷偷综合网| 精品国产黑色丝袜高跟鞋| 香蕉在线视频网站| 国产精品永久不卡免费视频| 在线观看国产精品一区| 欧美高清三区| 精品欧美一区二区三区久久久| 日本一区二区三区精品AⅤ| 99re视频在线| 欧美综合区自拍亚洲综合绿色 | 欧美日韩午夜视频在线观看| 第一页亚洲| 中文字幕日韩久久综合影院| 国产乱人激情H在线观看| 女人av社区男人的天堂| 欧美精品在线视频观看| 亚洲精品手机在线| 久久人人爽人人爽人人片aV东京热 | 一本大道AV人久久综合| 欧美精品另类| 伊人久久青草青青综合| 亚洲日韩AV无码一区二区三区人| 国产成人AV大片大片在线播放 | 任我操在线视频| 国产美女叼嘿视频免费看| 国产手机在线小视频免费观看| 欧美成人二区| 久久精品国产精品国产一区| 乱人伦99久久| 2021最新国产精品网站| 国产福利小视频高清在线观看| 成人精品视频一区二区在线 | 国产欧美亚洲精品第3页在线| 国产精品所毛片视频| 91精品国产综合久久香蕉922| 国产杨幂丝袜av在线播放| 午夜免费视频网站| 日韩a级毛片| 香蕉eeww99国产精选播放| 婷婷午夜天| 91在线无码精品秘九色APP| 日本不卡视频在线| 欧美精品黑人粗大| 99免费在线观看视频| 国产综合亚洲欧洲区精品无码| 一区二区三区高清视频国产女人| 国产91视频观看| 国产高清又黄又嫩的免费视频网站| 国产va欧美va在线观看| 91麻豆精品视频| 欧美天堂在线| 国产亚洲欧美在线人成aaaa| 国产毛片片精品天天看视频| 国产打屁股免费区网站| 亚洲永久色| 99视频在线观看免费| 色偷偷综合网| 福利片91| 亚洲无码四虎黄色网站| 青青青伊人色综合久久| 丰满人妻一区二区三区视频| 久久久久无码国产精品不卡| 国产好痛疼轻点好爽的视频| 四虎永久免费在线| …亚洲 欧洲 另类 春色| 99成人在线观看| 天天色综网| 日韩精品高清自在线| 91视频首页|